この記事では、2つの母不適合品率(母比率)の差に関する信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。
不適合品率の信頼区間は、この記事で完結して解説していますが、標本調査の考え方など、区間推定(その1)の記事から段階を追って説明しています。
さまざまな区間推定の種類を網羅的に学習したい方は、ぜひ最初から読んでみてください。
また、この記事では、母不適合品率の定義や二項分布との関係性についての基本的な説明を省略しています。
あらためて定義から確認したいという方は、合わせて参考にしていただければと思います。
母不適合品率の信頼区間の求め方
信頼区間の計算式
2つの母不適合品率の差の確率分布に関しても、1つの母不適合品率と同様に、標準正規分布$N(0,1)$に従います。
標準正規分布では、分布の横軸($Z$値)に対して、全体の何%を占めているのか対応する確率が決まっており、エクセルのNORM.S.DIST関数や標準正規分布表で簡単に求められます。
そして、この$Z$値を係数として用いることで、信頼度○○%の信頼区間の幅を計算することができるのです。
2つの集団を$A, B$と名付けると、母不適合品率の差の95%信頼区間の計算式は、以下のように表されます。
$A, B$はそれぞれの集団を意味し、$\bar{p}_{A}, \bar{p}_{B}$は標本不適合品率、$p_{A}, p_{B}$は母不適合品率、$n_{A}, n_{B}$はサンプルサイズを表します。
$Z$は標準正規分布の$Z$値を意味し、例えば信頼度95%の場合、$Z((1-α)/2)=1.96$となります。
計算式の構造は、1つの母不適合品率の場合と同じなので覚えやすいですね。
計算式の構造はほとんど同じだ
計算の手順
それでは、実際に母不適合品率の差の区間推定をやってみましょう。
とある製品の抜取検査を行ったところ、ラインAでは100個のうち2個の不良、ラインBでは200個のうち5個の不良が発見されたとき、ラインAとBの母不適合品率の差の95%信頼区間はいくらとなるでしょうか?
1.標本不適合品率を求める
サンプリングの結果から、それぞれの集団の標本不適合品率 $\bar{p}_{A}, \bar{p}_{B}$を求めます。
2.対応する$Z$値を求める
信頼度に対応する$Z$値を求めます。
今回の場合、求めたい信頼度は95%(0.95)となるので、確率Pが0.025(片側で2.5%)となるKp値を読み取ると1.96となります。
3.信頼区間を計算する
先ほどの式に信頼区間95%の$Z$値を入れると、以下の不等式が成立します。
平方根の中に含まれる$p_{A}, p_{B}$については、1つの母不適合品率の場合と同様に、それぞれの標本比率に置き換えて計算します。
そして、これを母比率の差$(p_{A}-p_{B})$に対して変換すると以下のようになります。
あとは、各値を代入すると、母比率の差の信頼区間を以下のように求めることができました。
計算式は長いけど変数は少ないから案外楽ちん
まとめ
- 母不適合品率の差の信頼区間の求め方
⇒標準正規分布の$Z$値を用いる - 計算の手順
⇒標本不適合品率を求める
対応する$Z$値を求める
信頼区間を計算する
最後まで読んでいただき、ありがとうございました。
コメント