この記事では、1つの母不適合数における信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。
不適合数の信頼区間は、この記事で完結して解説していますが、標本調査の考え方など、区間推定(その1)の記事から段階を追って説明しています。
さまざまな区間推定の種類を網羅的に学習したい方は、ぜひ最初から読んでみてください。
不適合数とは?
定義
「不適合品」とは規格に適合しないもの、すなわち不良品のことを意味し、不適合数とは不良品の数のことを表します。
とある標本データから求めた「単位当たりの不良品の平均発生回数」を$λ$と表記します。
一方、母集団の不適合数を意味する「母不適合数」は$λ_{o}$と表記され、標本平均の$λ$と区別して表現されます。
母不適合数の区間推定では、標本データから得られた単位当たりの平均の不適合数から母集団の不適合数を推定するもので、サンプルサイズ$n$、平均不良数$λ$から求められます。
ポアソン分布との関係
ポアソン分布とは、ある特定の期間の間にイベントが発生する回数の確率を表した離散型の確率分布です。
稀な事象の発生確率を求める場合に活用され、事故や火災、製品の不具合など、身近な事例も数多くあります。
確率質量関数を表すと以下のようになります。
$e$はネイピア数(自然対数の底)、$λ$は平均の発生回数、$k$は確率変数としての発生回数を表し、「パラメータ$λ$のポアソン分布に従う」「$X~P_{o}(λ)$」と表現されます。
生産ラインで不良品が発生する事象もポアソン分布として取り扱うことができます。
不良品が稀な事象じゃないと困るもんね
そのため、母不適合数の区間推定を行う際にも、ポアソン分布の期待値や分散の考え方が適用されるので、ポアソン分布の基礎をきちんと理解しておきましょう。
母不適合数の信頼区間の求め方
信頼区間の計算式
母不適合数の確率分布も、不適合品率の場合と同様に標準正規分布$N(0,1)$に従います。
標準正規分布とは、正規分布を標準化したもので、標本平均から母平均を差し引いて中心値をゼロに補正し、さらに標準偏差で割って単位を無次元化する処理のことを表します。
詳しくは別の記事で紹介していますので、合わせてご覧ください。
標準正規分布では、分布の横軸($Z$値)に対して、全体の何%を占めているのか対応する確率が決まっており、エクセルのNORM.S.DIST関数や標準正規分布表で簡単に求められます。
そして、この$Z$値を係数として用いることで、信頼度○○%の信頼区間の幅を計算することができるのです。
母不適合数の95%信頼区間の計算式は、以下のように表されます。
$λ$は標本の単位当たり平均不適合数、$λ_{o}$は母不適合数、$n$はサンプルサイズを表します。
$Z$は標準正規分布の$Z$値を意味し、例えば信頼度95%の場合、$Z((1-α)/2)=1.96$となります。
ポアソン分布では、期待値$E(X)=λ$、分散$V(X)=λ$なので、分母は$\sqrt{V(X)/n}$、分子は「標本平均-母平均」の形になっており、母平均の区間推定と同じ構造の式であることが分かります。
信頼区間の考え方はどれも同じなんだね
計算の手順
それでは、実際に母不適合数の区間推定をやってみましょう。
とある1年間で5回の不具合が発生した製品があるとき、1カ月での不具合の発生件数の95%信頼区間はいくらとなるでしょうか?
1.標本不適合数の平均値を求める
標本データから得られた不適合数の平均値を求めます。
ここで注意が必要なのが、母不適合数の単位に合わせてサンプルサイズを換算することです。
今回の場合、標本データのサンプルサイズは$n=12$(1カ月×12回)なので、単位当たりに換算すると不適合数の平均値$λ=5/12$となります。
2.対応する$Z$値を求める
信頼度に対応する$Z$値を求めます。
今回の場合、求めたい信頼度は95%(0.95)となるので、確率Pが0.025(片側で2.5%)となるKp値を読み取ると1.96となります。
3.信頼区間を計算する
先ほどの式に信頼区間95%の$Z$値を入れると、以下の不等式が成立します。
平方根の中の$λ_{o}$は、不適合品率の区間推定の場合と同様に、標本の不適合数$λ$に置き換えて計算します。
分子の$λ_{o}$に対して式を変換して、あとは$λ$と$n$の値を代入すれば、信頼区間を求めることができました。
まとめ
- 母不適合数の信頼区間の求め方
⇒標準正規分布の$Z$値を用いる - 計算の手順
⇒標本不適合数を求める
対応する$Z$値を求める
信頼区間を計算する
最後まで読んでいただき、ありがとうございました。
コメント