この記事では、1つの母不適合数における統計的検定について、初心者の方にもわかりやすいよう例題を交えながら解説しています。
なお、統計的検定の概念とメリット、登場する用語の意味など、統計的検定(その1)の記事から段階を追って説明しています。
さまざまな検定の種類を網羅的に学習したい方は、ぜひ最初から読んでみてください。
不適合数とは?
定義
「不適合品」とは規格に適合しないもの、すなわち不良品のことを意味し、不適合数とは不良品の数のことを表します。
とある標本データから求めた「単位当たりの不良品の平均発生回数」を$λ$と表記します。
一方、母集団の不適合数を意味する「母不適合数」は$λ_{o}$と表記され、標本平均の$λ$と区別して表現されます。
母不適合数の検定では、標本データから得られた不適合数と母集団の不適合数との差異を調べるもので、サンプルサイズ$n$、不良数$λ$から求められます。
ポアソン分布との関係
ポアソン分布とは、ある特定の期間の間にイベントが発生する回数の確率を表した離散型の確率分布です。
稀な事象の発生確率を求める場合に活用され、事故や火災、製品の不具合など、身近な事例も数多くあります。
確率質量関数を表すと以下のようになります。
$e$はネイピア数(自然対数の底)、$λ$は平均の発生回数、$k$は確率変数としての発生回数を表し、「パラメータ$λ$のポアソン分布に従う」「$X~P_{o}(λ)$」と表現されます。
二項分布と同じくポアソン分布も統計学では頻出だよ
生産ラインで不良品が発生する事象もポアソン分布として取り扱うことができます。
そのため、母不適合数の検定を行う際にも、ポアソン分布の期待値や分散の考え方が適用されるので、ポアソン分布の基礎をきちんと理解しておきましょう。
母不適合数の検定
検定統計量
母不適合数の確率分布も不適合品率の場合と同様に標準正規分布$N(0,1)$に従います。
標準正規分布とは、正規分布を標準化したもので、標本平均から母平均を差し引いて中心値をゼロに補正し、さらに標準偏差で割って単位を無次元化する処理のことを表します。
詳しくは別の記事で紹介していますので、合わせてご覧ください。
標準正規分布では、分布の横軸($Z$値)に対して、全体の何%を占めているのか対応する確率が決まっており、エクセルのNORM.S.DIST関数や標準正規分布表で簡単に求められます。
そして、母不適合数の検定では、この$Z$値を検定統計量として用います。
$λ$は標本の単位当たり平均不適合数、$λ_{o}$は母不適合数、$n$はサンプルサイズを表します。
ポアソン分布では、期待値$E(X)=λ$、分散$V(X)=λ$なので、分母は$\sqrt{V(X)/n}$、分子は「標本平均-母平均」の形になっており、母平均の検定統計量と同じ構造の式であることが分かります。
検定の手順
それでは、実際に母不適合数の検定をやってみましょう。
1.仮説を設定する
まずは、検証したい目的に合致した帰無仮説$H_{0}$と対立仮説$H_{1}$を設定します。
不具合の発生回数に違いがあることを背理法で証明したいので、帰無仮説を「$H_{0}:λ=λ_{o}$」、すなわち「従来と発生回数の違いがない」と設定します。
また、対立仮説は本来の目的である証明したい仮説として、「発生回数の違いがある」とします。
$H_{0}:λ=λ_{o}$
$H_{1}:λ≠λ_{o}$(両側検定)
2.検定統計量を算出する
定義の数式に従い、検定統計量$Z$を求めます。
ここで注意が必要なのが、求めたいサンプルサイズに換算した単位当たりの不適合数を算出することです。
今回の場合、標本データのサンプルサイズは$n=12$(1カ月×12回)なので、単位当たりに換算すると不適合数の平均値$λ=6/12$となります。
サンプルを多く採った方がZ値が大きくなるってことだね
3.帰無仮説の棄却/採択を判定する
検定統計量の値から帰無仮説の棄却/採択を判定します。
判定の指標には、標準正規分布の$Z$値を用います。
通常、統計的検定では、有意水準$α=0.05$や$α=0.01$を基準として用います。
つまり、本当は帰無仮説が正しいのに、誤って棄却してしまう確率が$α=0.05$の場合は5%、$α=0.01$なら1%となる状態のことです。
エクセルで標準正規分布の累積分布関数の逆関数を表すNORM.S.INV関数を使えば、$α=0.05$における棄却域を以下のように求められます。
これを先ほどの検定統計量と比較すると、以下の関係であることが分かります。
5%の棄却域に入っていない状態、つまり帰無仮説が採択されます。
4.検定の結論を導く
検定の結果から、今回の結論を出します。
「従来と不具合の発生回数に違いがあるとは言えない」
まとめ
- 1つの母不適合数に関する検定統計量
⇒標準正規分布のZ値を用いる - 検定の手順
⇒仮説を設定する
検定統計量を算出する
帰無仮説の棄却/採択を判定する
検定の結論を導く
最後まで読んでいただき、ありがとうございました。
コメント