区間推定を習得する(その弐) 母分散の信頼区間の求め方

統計的推定

区間推定(その壱:母平均)の続編です。

この記事では、母分散の信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。

母分散の信頼区間は、この記事で完結して解説していますが、標本調査の考え方など、その壱から段階を追って説明しています。

さまざまな区間推定の種類を網羅的に学習したい方は、ぜひ最初から読んでみてください。

区間推定を習得する(その壱) 母平均の信頼区間の求め方
母平均の信頼区間を求める場合、母分散が既知の場合には標準正規分布、未知の場合にはt分布を使う方法に分かれます。この記事では、それぞれの方法に対する母平均の信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。

カイ二乗分布とは?

定義

母分散の信頼区間を求めるには、カイ二乗分布を使います。

まず、早速登場した「カイ二乗分布」という用語、名前を聞くだけで敬遠したくなりますよね・・。

区間推定を求めるのに細かい数式を覚える必要はないので、ここではカイ二乗分布の概念だけ覚えておいてください。

「カイ」は記号で「$χ$」と表され、以下の数式によって定義されます。

ここで、$Z_{1}~Z_{n}$は標準正規分布に従う互いに独立な確率変数を表します。

標準正規分布とは、正規分布において平均値$μ$を$0$、標準偏差$σ$を$1$として基準化したもので、$N(μ,σ^{2})$は$N(0,1)$と表記されます。

この$χ^{2}$が従う確率分布のことをカイ二乗分布と呼び、自由度$n-1$のカイ二乗分布に従うと表現されるのです。

確率変数の二乗和が従う分布なので、すなわち、「ばらつき」「分散」に関わる確率を求める場合に活用されます。

母分散の信頼区間を求めるほかに、独立性の検定適合度の検定など、同じく分散を扱う検定にも用いられます。

とらまる
とらまる

いろいろな使い道は覚えておこう

カイ二乗分布のグラフの特徴

カイ二乗分布のグラフは左右対称ではなく、右側に裾広がりの形状を示します。

以下のグラフは、自由度の違いによる確率密度関数の形状の違いを表したものです。

いずれも、右側に広がった分布を示していることが分かります。

二乗和を扱う統計量の分布なので、特に自由度が小さい場合に偏った形状が顕著に表れます。

ここまで説明したカイ二乗分布について、以下の記事で期待値や分散、エクセルでのグラフの書き方を詳しく解説していますので、合わせてご覧ください。

カイ二乗分布とは? 活用の用途、エクセル関数の使い方を解説
カイ二乗分布とは、標準正規分布N(0,1)を基にした確率変数の二乗和が従う確率分布のことです。この記事では、カイ二乗分布の定義と性質、活用の用途、期待値と分散の導出の仕方、エクセルやカイ二乗分布表から確率を求める手順について解説しています。

母分散の信頼区間の求め方

信頼区間の計算式

カイ二乗分布では、分布の横軸(カイ二乗値)に対して、全体の何%を占めているのか対応する確率が決まっており、エクセルのCHISQ.DIST関数カイ二乗分布表で簡単に求められます。

そして、このカイ二乗値を係数として用いることで、信頼度○○%の信頼区間の幅を計算することができるのです。

母分散の信頼区間の計算式は、以下のように表されます。

$σ^{2}$は母分散$v^{2}$は不偏分散$n$はサンプルサイズを表します。

$χ^{2}$はカイ二乗値$α$は信頼度を意味し、例えばサンプルサイズが$n=10$で信頼度95%$(α=0.05)$とすると、$α/2=0.025$、$χ^{2}(n-1, α/2)=19.02$となります。

カイ二乗分布の確率密度関数のイメージで書くと次のようになります。

ちなみに、平方和(平均値との差の二乗和)を自由度$n-1$で割ると不偏分散になるので、先ほどの式は次のように表現することもできます。

カイ二乗分布の定義の式(二乗和)に近い形となり、この統計量がカイ二乗分布に従うことのイメージが掴みやすくなったのではないかと思います。

計算の手順

それでは、実際に母分散の区間推定をやってみましょう。

以下は、とある製品を無作為に10個抽出し、寸法を測定した結果です。

この製品の寸法の分布が正規分布に従うとするとき、母分散の95%信頼区間はいくらとなるでしょうか?

1.不偏分散を求める

まずは標本のデータから不偏分散を計算します。

不偏分散と標本分散をうろ覚えの場合はこちらも参考にどうぞ。

母集団と標本の違い、なぜ品質管理で標本調査が有効なのか?
「母集団と標本の違いを知りたい」「標本調査をどう活用するのか」「どのようなメリットがあるのか」モノづくりの現場では、サンプルや時間に制約がある中での判断が求められます。標本調査の有効性と活用例、区間推定とサンプル数の目安について、具体例を交えて解説します。



2.カイ二乗値を求める

次に信頼度に相当するカイ二乗値をカイ二乗分布表から求めます。

カイ二乗分布表とは、横軸に確率$p$、縦軸に自由度$n$を取って、マトリックスの交差する箇所に対応するカイ二乗値が記載されている表です。

クリックで拡大

ここで表す確率$p$は、カイ二乗値に対する上側確率を意味します。

つまり、カイ二乗値がとある値よりも大きくなる確率を表しています。

一つ注意点として、カイ二乗分布は横軸に対して左右対称ではないので、信頼度に対して上側と下側のそれぞれに相当するカイ二乗値を求める必要があります。

例えば、信頼度95%(0.95)の上側確率にあたる自由度$9(=n-1)$のカイ二乗値は、$χ^{2}(9, 0.05/2)=19.02$、下側確率のカイ二乗値は、$χ^{2}(9, 1-0.05/2)=2.70$と読み取ることができます。

ちなみに、エクセルではCHISQ.INV.RT関数を用いることで、対応するカイ二乗値を求められます。

CHISQ.INV.RT関数とは、カイ二乗分布の上側(右側)確率の逆関数を表し、今回の事例の場合、$=CHISQ.INV.RT(0.05/2, 9)=19.02$として同じ結果が得られます。

関数なしでふつうに計算したら大変だよ・・

3.信頼区間を計算する

区間推定の定義の式に信頼区間95%のカイ二乗値を入れると、以下の不等式が成立します。

そして、これを$σ^{2}$に対して変換すると、次のようになります。

あとは、不偏分散、サンプルサイズを代入すると、母分散の信頼区間を求めることができます。

つまり、この製品の寸法の母分散は、信頼度95%の確率で0.024~0.167に収まるという推定結果になります。

まとめ

  • 母分散の信頼区間の求め方
    ⇒カイ二乗分布を用いる
  • 計算の手順
    ⇒①:不偏分散を求める
     ②:信頼度に対応するカイ二乗値を求める
     ③:母分散の推定値を計算する

その弐編は以上です。

最後まで読んでいただき、ありがとうございました。

スポンサーリンク
統計的推定
こてつをフォローする
この記事を書いた人
こてつ

【経歴】
関東在住の37歳、大手電機メーカの生産技術職。
これまで、研究開発、設計、生産技術、仕入先の品質管理を手掛ける。

【保有知識・技術分野】
統計学、信頼性工学、品質工学。
半導体、基板、有機材料、金属、セラミックスの材料、製造、加工技術。
部品加工(機械加工、化学処理)、組立技術、分析・物理解析技術。

【当サイトについて】
品質・生産の基礎知識をテーマに、用語の解説、使い方(作り方)、メリット、考え方のポイントを見習いエンジニア”とらまる”と一緒に分かりやすく解説しています。

こてつをフォローする
QCとらのまき

コメント