この記事では、2つの母不適合数の差に関する信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。
不適合数の信頼区間は、この記事で完結して解説していますが、標本調査の考え方など、区間推定(その1)の記事から段階を追って説明しています。
さまざまな区間推定の種類を網羅的に学習したい方は、ぜひ最初から読んでみてください。
また、この記事では、母不適合数の定義やポアソン分布との関係性についての基本的な説明を省略しています。
あらためて定義から確認したいという方は、合わせて参考にしていただければと思います。
母不適合数の信頼区間の求め方
信頼区間の計算式
2つの母不適合数の差の確率分布に関しても、1つの母不適合数と同様に、標準正規分布$N(0,1)$に従います。
標準正規分布では、分布の横軸($Z$値)に対して、全体の何%を占めているのか対応する確率が決まっており、エクセルのNORM.S.DIST関数や標準正規分布表で簡単に求められます。
そして、この$Z$値を係数として用いることで、信頼度○○%の信頼区間の幅を計算することができるのです。
2つの集団を$A, B$と名付けると、母不適合数の差の95%信頼区間の計算式は、以下のように表されます。
$A$と$B$はそれぞれの集団を意味し、$\bar{λ}_{A}, \bar{λ}_{B}$は標本不適合数、$λ_{A}, λ_{B}$は母不適合数、$n_{A}, n_{B}$はサンプルサイズを表します。
$Z$は標準正規分布の$Z$値を意味し、例えば信頼度95%の場合、$Z((1-α)/2)=1.96$となります。
計算式の構造は、1つの母不適合数の場合と同じなので覚えやすいですね。
その1から何度も見てきた式の形だね
計算の手順
それでは、実際に母不適合数の差の区間推定をやってみましょう。
過去2年半での市場不具合の発生件数が7件であった製品A、過去5年間での不具合件数が2件であった製品Bにおいて、一カ月あたりの不具合発生件数の差の95%信頼区間はいくらとなるでしょうか?
1.標本不適合数を求める
サンプリングの結果から、それぞれの集団の標本不適合数$\bar{λ}_{A}, \bar{λ}_{B}$を求めます。
2.対応する$Z$値を求める
信頼度に対応する$Z$値を求めます。
今回の場合、求めたい信頼度は95%(0.95)となるので、確率Pが0.025(片側で2.5%)となるKp値を読み取ると1.96となります。
3.信頼区間を計算する
先ほどの式に信頼区間95%の$Z$値を入れると、以下の不等式が成立します。
平方根の中に含まれる$λ_{A}, λ_{B}$については、1つの母不適合数の場合と同様に、それぞれの標本比率に置き換えて計算します。
あとは、母不適合数の差$(λ_{A}-λ_{B})$に対して変換し、各値を代入すると以下のように信頼区間を求めることができました。
区間推定はもうバッチリ
まとめ
- 母不適合数の差の信頼区間の求め方
⇒標準正規分布の$Z$値を用いる - 計算の手順
⇒標本不適合数を求める
対応する$Z$値を求める
信頼区間を計算する
最後まで読んでいただき、ありがとうございました。
コメント