「一元配置実験ってどういう手法なの?」
「実験計画の注意点と手順を教えてほしい」
「分散分析と信頼区間の求め方を知りたい」
このような疑問や悩みをお持ちの方に向けた記事です。
一元配置実験は一つの因子を変化させて特性値への影響を調べるための実験手法で、実験計画法のなかでも最も基本的なものの一つです。
この記事では、一元配置実験を行うにあたっての一連の流れ、分散分析と信頼区間の計算手順、実験計画を決めるにあたっての注意点について解説しています。
ぜひ最後まで読んで参考にしていただければ幸いです。
また、Youtubeチャンネルでも一元配置実験の手順を解説していますので、あわせてご覧いただけると幸いです。
一元配置実験とは?
一元配置実験とは一つの因子を変化させて特性値への影響を調べるための実験手法です。
因子というのは、条件の変化によって特性値に影響を与えると考えられるもののことを意味し、例えば製品を加工する際の温度や圧力といった要因が該当します。
また、水準とは実験にあたって因子を変動させる場合に代表値として選んだ値のことで、例えば、100℃、120℃、140℃といったように自らが設定する条件を意味します。
一元配置実験は一つの因子を対象として、水準を3つ以上で変化させる場合に用いられる手法で、以下のような条件と結果の対応表が代表的な例として挙げられます。
やっていることはシンプルで、1つの因子の条件を変えて複数回の繰り返しデータを取るというもので、これまでから意識せずともやっていた方も多いのではないかと思います。
最適値を探す時によく使うやり方だね
なお、実験計画法の考え方やフィッシャーの3原則など基本から確認し直したい方は、以下の記事で詳しく解説していますので、合わせてご覧ください。
一元配置実験の手順
実験計画法の考え方
一元配置実験に限らず、実験計画法では分散分析の考え方を用いて水準間の有意差を調べます。
分散とは「データのばらつき」のことで、水準間の分散と水準内の分散の比を求めて、水準間の分散が十分に大きければ、水準の違いによる効果が大きいと判定します。
なぜ、分散を見る必要があるかというと、水準が3つ以上になる場合、データどうしを単純に比較できないからです。
例えば、水準が2つしかない場合、データどうしの差を取ってt検定を行えば、差がないと言えるか否か判断することができます。
しかし、水準が3つ以上になると、データの差をとる組み合わせ通り数が1通りでなくなるので、同じやり方を用いるわけにはいきません。
そこで、各水準において繰り返しデータを取得してばらつきを求め、これを指標にするという考え方が実験計画法では用いられるのです。
一連の流れ
具体例を用いた詳細の計算手順は後述しますので、ここでは一元配置実験の全体の流れを説明します。
補助表を作る
分散を求めるには、水準ごとの偏差平方和(平均値と各データの差分の平方和)を求める必要があります。
エクセルを用いれば偏差平方和も一瞬で計算できますが、電卓を用いた手計算で行う場合、これが結構大変な労力のかかる作業になるのです。
そこで、次の公式を用いることで偏差平方和を効率的に計算することができます。
これは、品質管理検定(QC検定)を受検の方には暗記必須の公式で、知っているのと知らないのとでは計算時間に雲泥の差が生じます。
この式の形から分かるとおり、各データの総和、各データの二乗の和を求めれば、あとは簡単な四則演算で偏差平方和を求めることができます。
そのため、補助表として事前に各データの和と二乗和を準備しておくことで、後の計算が非常に楽になります。
分散分析表を作る
次に水準間変動(群間変動、級間変動とも呼びます)と水準内変動についての分散分析表を作成します。
水準間変動とは「全体の平均と水準の平均との差」のことを表し、次の式で定義されます。
平均の差を二乗しているのは、プラス側とマイナス側の差がキャンセルされるのを防ぐためで、$n_{i}$はデータの個数分を合算するための項目です。
水準内変動とは「各データと水準内平均との差」を表し、次の式で定義されます。
最後に全変動とは「各データと全体平均との差」を表し、次の式で定義されます。
全変動、水準間変動、水準内変動の間には以下の関係式が成り立ちます。
また、分散分析表とは以下のような表で、最終的に分散の比の検定(F検定)を行うための検定統計量を求めるための表です。
F検定で水準の有意性を調べる
分散分析表からF検定の検定統計量を求められたら、F分布表から有意性を判定します。
検定統計量がある有意水準のしきい値よりも大きい場合、水準間変動が十分に大きいと判定され、その大小関係を比較するだけなので、特に難しく考える必要はありません。
各水準の点平均の推定値を求める
各水準の代表値として平均値を求めます。
単純な算術平均なので、特に問題ないと思います。
信頼区間を求める
最後に各水準の点平均を中心とした信頼区間の幅を求めます。
先ほど計算した点平均は取得したデータから求めた標本平均であり、母集団の平均値(母平均)の推定値に過ぎません。
そのため、母集団の平均値には推定の「幅」があり、例えば信頼度95%で○○~△△の範囲に収まるといった表現をします。
これは95%の確率で○○~△△の範囲に母平均が存在することを意味しています。
標本平均から母平均の幅を推定(区間推定と呼びます)するには、以下の計算式から求めることができます。
自由度と信頼度に対応するt値、サンプルサイズ、不偏分散から信頼区間の幅を求められます。
一元配置実験でも同じ形の式から信頼区間を求めることができます。
繰り返し回数が多いほど推定範囲を絞れるってことなんだ
なお、母平均の区間推定については以下の記事で詳しく解説していますので、合わせてご覧ください。
分散分析のやり方
それでは、具体例を用いて実際に分散分析表を作って、F検定までやってみましょう。
一元配置実験では繰り返しのある実験が前提で、さらに繰り返し数が水準ごとに同じ場合と異なる場合の2通りに分かれます。
やることは大差ありませんが、それぞれについて計算例を示します。
繰り返し数が同じ場合
水準ごとの総和と二乗和を求める
先ほど説明した通り、偏差平方和を求める前に補助表を作成します。
これには水準ごとの総和と二乗和を求める必要があるので、あらかじめ計算しておきます。
偏差平方和、自由度、分散(平均平方)、分散比を求める
補助表の値を使って、分散分析表を埋めていきます。
全変動の偏差平方和$S_{T}$は次の式で求められます。
また、水準間変動の偏差平方和$S_{A}$は定義の式を変換して、次の式で求められます。
変換の導出は少し複雑なので省略しますが、CTで表す成分を修正項と呼びます。
水準ごとの二乗和の平均値の総和から修正項を引くことで水準間変動の偏差平方和を求められる便利なもので、計算を大幅に簡略化できるため、ぜひ覚えておきましょう。
ここまで、偏差平方和の求め方が少し複雑でしたが、あとは、簡単な四則演算で表が埋められます。
F検定により有意性を判定する
分散比$F_{0}$を検定統計量として、F検定を行います。
判定基準となるF値は、自由度と有意水準が分かればF分布表から対応する値を読み取れば求められます。
今回の場合、有意水準5%で水準間変動に意味があるという結果が得られました。
有意性を数値で判断できるのは分かりやすいね
繰り返し数が異なる場合
繰り返し数が異なる場合も基本的な計算手順は同じです。
ところどころ、データ数が異なる影響で分母の$n$の値が変わるので注意が必要です。
信頼区間の計算のしかた
分散分析と同様に、繰り返し数が同じ場合と異なる場合でほぼ同じ流れなので、ここでは繰り返し数が異なる場合のみ説明します。
すでに説明した通り、信頼区間は次の式で求めることができます。
$V_{e}$は分散分析表ですでに計算済みなので、あとはt分布表から自由度に対応するt値を読み取って計算すれば完了です。
繰り返し数が異なる場合、分母の$n$の値が水準ごとに異なるので注意しましょう。
一元配置実験の注意点
ポイントを3つ整理しておきます。
水準は3つ以上必要
水準が2つの場合、t検定で水準間の有意差を比較します。
一元配置実験では、t検定で有意差を比較できない場合に、分散分析を使って「ばらつき」を比較するために用いられる手法で、水準3つ以上を設定するようにしましょう。
繰り返し実験が前提
一元配置実験では、実験の回数は繰り返しが前提です。
1回しかデータを取っていないと、ばらつきを求めることができません。
なお、繰り返しを行う場合もフィッシャーの3原則を忘れずに、とある水準をまとめて実施したり、毎回同じ順番で水準を変えたりしないよう注意が必要です。
水準は等間隔が望ましい
水準はできるだけ等間隔で設定することが望ましいです。
実験計画法では、水準の値そのものは解析に活用しないので、定量性にあまり意味はありません。
しかし、例えば一つの水準だけ大きく離れて設定すると、特定の水準だけに意図せぬ誤差要因が作用して、本質を見抜けなくなってしまう恐れがあります。
そのため、可能な限り水準の割り振りは均等性を保つようにしましょう。
まとめ
- 一元配置実験とは
一つの因子を変化させて特性値への影響を調べるための実験手法 - 一元配置実験の流れ
①:補助表を作る
②:分散分析表を作る
③:F検定で水準の有意性を調べる
④:各水準の点平均の推定値を求める
⑤:信頼区間を求める - 一元配置実験の注意点
・水準は3つ以上必要
・繰り返し実験が前提
・水準は等間隔が望ましい
最後までご覧いただきありがとうございました。
数式の苦手な方でも安心の入門編。
回帰分析、検定、実験計画法まで幅広く、エクセルを用いた実践方法も習得したい方に。
乱塊法、分割法もお任せ! QC検定1級の教材としてもおススメ。
コメント