実験計画法の基礎 二元配置実験の手順を解説(繰り返しなし)

実験計画法

※当サイトは、アフィリエイト広告を利用しています

「二元配置実験って一元配置とどう違うの?」
「繰り返しのありなしって何が違うの?」
「分散分析と信頼区間の求め方を知りたい」

このような疑問や悩みをお持ちの方に向けた記事です。

二元配置実験は二つの因子を変化させて特性値への影響を調べるための手法で、一元配置実験の次元を拡張したものです。

ただ、単に因子が二つになって実験の組み合わせ数が増えるだけではなく、因子どうしの相互作用を考慮しながら因子の効果の有無を見極めなければなりません。

また、二元配置実験では実験の繰り返しがある場合とない場合に分類され、因子の影響を調べられる範囲が異なります。

この記事では、繰り返しのない二元配置実験を対象として、一連の流れ一元配置実験との違い分散分析と信頼区間の計算手順について解説しています。

ぜひ最後まで読んで参考にしていただければ幸いです。

二元配置実験とは?

二元配置実験とは二つの因子を変化させて特性値への影響を調べるための実験手法です。

因子というのは、条件の変化によって特性値に影響を与えると考えられるもののことを意味し、例えば製品を加工する際の温度や圧力といった要因が該当します。

また、水準とは実験にあたって因子を変動させる場合に代表値として選んだ値のことで、例えば、100℃、120℃、140℃といったように自らが設定する条件を意味します。

次のような条件と結果の対応表が一例として挙げられます。

二つの因子を行と列に配置し、水準の数を掛け合わせて通り数を決めるもので、総当たり実験として感覚的にも理解しやすいのではないかと思います。

ここで、二元配置実験は実験の繰り返しがあるかないかで、二つのケースに分類されます。

フィッシャーの3原則によると実験の精度を高めるには反復試行が望ましいですが、時間とお金の都合から現実的に難しいこともあります。

このような場合に、二元配置実験では繰り返し試行を行わなくても、因子の主効果を調べることができるのです。

とらまる
とらまる

じゃあ、実験の量を減らせて単純に楽ちんなのかな

ただし、実験の手間を省けるだけの都合の良いものではありません。

繰り返しを行わないデメリットとして、因子どうしの相互的な影響(交互作用)を調べられないのです。

ただ、因子どうしの関連性が全くないことが自明な場合であれば有効に使える手段なので、特徴を踏まえて適切な手法を選びましょう。

なお、実験計画法の考え方やフィッシャーの3原則など基本から確認し直したい方、一元配置実験から学び直したい方は、以下の記事も合わせてご覧ください。

実験計画法とは?初心者必見!考え方と注意点、実験の種類を解説
実験計画法(DOE)は、ある因子の条件を複数の水準で変えて実験を行う際に、効率良く、かつ漏れのないようにデータを取得して、統計的に結果を判定する解析手法です。この記事では、実験計画法の基本的な考え方と注意点、主な実験方法の種類について解説しています。

交互作用とは?

さて、二元配置実験の特徴が分かったところで、先ほど登場した「交互作用」について説明しておきます。

交互作用とは、二つ以上の因子が組み合わさったときに、ある特定の条件で相乗的、あるいは相殺的に特性値に影響を及ぼす作用のことです。

例えば、添加剤の配合比率と加工温度のような関係が該当します。

添加剤の比率を段階的に変えた場合に、ある温度では全く効果が見られなかったとしても、別の温度では効果が現れ、特定の条件で特に大きな効果を示す場合があります。

因子が単独で作用する影響のことを「主効果」と呼び、これと対比する形で相互的な影響のことを「交互作用」と呼ぶのです。

それでは、繰り返しのない二元配置実験では交互作用の影響を調べられないのは、どうしてでしょうか?

それは、得られた実験結果が偶然によるものか必然なのか切り分けができないからです。

各条件につき、一回しかデータを取得しない場合ですと、その条件内でのばらつきの程度を比較することができません。

そのため、交互作用の有無を明確にしたい場合には繰り返しを行って、組み合わせ効果による変動の大小を解析する必要があるのです。

このように、一元配置実験では一つの因子の影響だけ考慮すれば良かったのですが、二元配置実験では交互作用の考え方が登場するので、違いを把握しておきましょう。

繰り返しのない二元配置実験の手順

実験計画法の考え方

二元配置実験に限らず、実験計画法では分散分析の考え方を用いて水準間の有意差を調べます。

分散とは「データのばらつき」のことで、水準間の分散と水準内の分散の比を求めて、水準間の分散が十分に大きければ、水準の違いによる効果が大きいと判定します。

なぜ、分散を見る必要があるかというと、水準が3つ以上になる場合、データどうしを単純に比較できないからです。

例えば、水準が2つしかない場合、データどうしの差を取ってt検定を行えば、差がないと言えるか否か判断することができます。

対応のある母平均の差の検定を例題で解説 ~統計的検定(その6)~
対応のある母平均の差に関する統計的検定を行う場合、t分布を用いて計算します。この記事では、母平均の差の検定について、帰無仮説と対立仮説の設定のしかた、検定統計量の計算方法、検定手順、エクセルの分析ツールの使い方を解説しています。

しかし、水準が3つ以上になると、データの差をとる組み合わせ通り数が1通りでなくなるので、同じやり方を用いるわけにはいきません。

そこで、各水準において繰り返しデータを取得してばらつきを求め、これを指標にするという考え方が実験計画法では用いられるのです。

一連の流れ

二元配置実験の解析手順を次に示します。

黒い文字で示すのは一元配置実験と同じ項目で、赤い文字で示すのが二元配置実験で新たに登場する手順です。

すでに一元配置実験で流れを習得済みの方は、「誤差変動にプーリングする」までスキップください。

補助表を作る

分散を求めるには、水準ごとの偏差平方和(平均値と各データの差分の平方和)を求める必要があります。

エクセルを用いれば偏差平方和も一瞬で計算できますが、電卓を用いた手計算で行う場合、これが結構大変な労力のかかる作業になるのです。

そこで、次の公式を用いることで偏差平方和を効率的に計算することができます。

これは、品質管理検定(QC検定)を受検の方には暗記必須の公式で、知っているのと知らないのとでは計算時間に雲泥の差が生じます。

この式の形から分かるとおり、各データの総和各データの二乗の和を求めれば、あとは簡単な四則演算で偏差平方和を求めることができます。

そのため、補助表として事前に各データの和と二乗和を準備しておくことで、後の計算が非常に楽になります。

分散分析表を作る

次に水準間変動(群間変動、級間変動とも呼びます)と水準内変動についての分散分析表を作成します。

まず、全変動とは「各データと全体平均との差」を表し、次の式で定義されます。



続いて、水準間変動とは「全体の平均と水準の平均との差」のことを表し、次の式で定義されます。

平均の差を二乗しているのは、プラス側とマイナス側の差がキャンセルされるのを防ぐためで、$n_{i},n_{j}$はデータの個数分を合算するための項目です。

最後に水準内変動とは「各データと水準内平均との差」を表し、次の式で定義されます。

全変動、水準間変動、水準内変動の間には以下の関係式が成り立ちます。

また、分散分析表とは以下のような表で、最終的に分散の比の検定(F検定)を行うための検定統計量を求めるための表です。

F検定で水準の有意性を調べる

分散分析表からF検定の検定統計量を求められたら、F分布表から有意性を判定します。

検定統計量がある有意水準のしきい値よりも大きい場合、水準間変動が十分に大きいと判定され、その大小関係を比較するだけなので、特に難しく考える必要はありません。

F分布とは? 活用の用途、エクセル関数の使い方を解説
F分布とは、2つのカイ二乗分布に従う確率変数の二乗和χ2値をそれぞれの自由度で割って比で表したF値が従う確率分布のことです。この記事では、F分布の定義と性質、活用の用途、期待値と分散の導出の仕方、エクセルやF分布表から確率を求める手順について解説しています。
2つの母分散の比の検定を例題で解説 ~統計的検定(その4)~
2つの母分散の比に関する統計的検定を行う場合、標本の不偏分散の比から求めたF値を検定統計量に用います。この記事では、2つの母分散の比の検定について、帰無仮説と対立仮説の設定のしかた、検定統計量の計算方法、検定手順を解説しています。

誤差変動にプーリングする

F検定の結果、有意でない因子が見られた場合には、特性値に有意な影響を及ぼさないものと判断し、誤差成分に含めて扱います。

具体的には、有意でない因子の偏差平方和を誤差成分の偏差平方和に加えることを意味し、これを「プーリング」と呼びます。

有意性の判定にはF分布の棄却判定値を用いますが、本当は効果があるのに誤って誤差成分に含めてしまわないよう、一般的には検定統計量が2以下の場合をプーリングします。

プーリングして消去するのは慎重にしよう

最適水準の点平均の推定値を求める

水準の代表値として平均値を求めます。

二元配置実験では最適水準を求める場合が多く、特性値が最大(または最小)となる組み合わせの点平均の推定値を求めます。

信頼区間を求める

最後に各水準の点平均を中心とした信頼区間の幅を求めます。

先ほど計算した点平均は取得したデータから求めた標本平均であり、母集団の平均値(母平均)の推定値に過ぎません。

そのため、母集団の平均値には推定の「幅」があり、例えば信頼度95%で○○~△△の範囲に収まるといった表現をします。

これは95%の確率で○○~△△の範囲に母平均が存在することを意味しています。

標本平均から母平均の幅を推定(区間推定と呼びます)するには、以下の計算式から求めることができます。

自由度と信頼度に対応するt値サンプルサイズ不偏分散から信頼区間の幅を求められます。

後ほど詳しく説明しますが、二元配置実験でも同じ形の式から信頼区間を求めることができます。

$μ$の上についている「^」は「ハット」と呼び、推定値を表すときに用いられる記号です。

なお、母平均の区間推定については以下の記事で詳しく解説していますので、合わせてご覧ください。

母平均の信頼区間の求めかたを例題で解説 ~区間推定(その1)~
母平均の信頼区間を求める場合、母分散が既知の場合には標準正規分布、未知の場合にはt分布を使う方法に分かれます。この記事では、それぞれの方法に対する母平均の信頼区間の計算方法、計算式の構成について、初心者の方にもわかりやすいよう例題を交えながら解説しています。

分散分析のやり方

それでは、具体例を用いて実際に分散分析表を作って、F検定までやってみましょう。

問題

解法の手順

水準ごとの二乗の和を求める

先ほど説明した通り、偏差平方和を求める前に補助表を作成します。

これには水準ごとの二乗の和を求める必要があるので、あらかじめ計算しておきます。

偏差平方和、自由度、分散(平均平方)、分散比を求める

補助表の値を使って、分散分析表を埋めていきます。

全変動の偏差平方和$S_{T}$は次の式で求められます。



また、水準間変動の偏差平方和$S_{A},S_{B}$は定義の式を変換して、次の式で求められます。

変換の導出は少し複雑なので省略しますが、CTで表す成分を修正項と呼びます。

水準ごとの二乗和の平均値の総和から修正項を引くことで水準間変動の偏差平方和を求められる便利なもので、計算を大幅に簡略化できるため、ぜひ覚えておきましょう。

ここまで、偏差平方和の求め方が少し複雑でしたが、あとは、簡単な四則演算で表が埋められます。

F検定により有意性を判定する

分散比$F_{0}$を検定統計量として、F検定を行います。

判定基準となるF値は、自由度と有意水準が分かればF分布表から対応する値を読み取れば求められます。

今回の場合、因子Aは有意水準5%、因子Bは有意水準1%で水準間変動に意味があるという結果が得られました。

誤差変動にプーリングする

今回は因子Aと因子Bともに有意であったため、プーリングは行いません。

仮にF検定により、いずれかの因子が有意でない、かつ$F_{0}$の値が2以下という結果が得られた場合には、特性に寄与しないものと判断し、誤差成分として一つにまとめてしまいます。

この時、分散比とF検定の棄却判定値が変わるので、プーリング後の分散分析表から再度$F_{0}$の値を検定し直します。

ここでお気づきの方もおられると思いますが、プーリング後の分散分析表は因子Aのみの一元配置実験の分散分析表と同じになります。

それもそのはず、因子Bの影響を無視できるのであれば、因子Bの実験は単に繰り返し試行を行ったものと同義であり、一元配置実験と同じことを意味しているのです。

最適水準の点平均の推定値を求める

先ほどの例に戻って、因子の有意性の判定が終わったら、次に最適水準の点平均の推定値を求めます。

今回の場合、特性値が大きいほど良いとして、質量が最大となる水準の推定値を求めます。

因子どうしの交互作用がない場合、まずは因子Aと因子Bのそれぞれに対して、特性値が最大となる水準を決定します。

今回の場合、因子Aは水準1(100℃)、因子Bは水準2(10%)が最も特性値が大きくなっています。

そして、各因子の最適水準を決定したら、以下の式により$x_{12}$の点平均の推定値を計算することができます。

因子Aと因子Bの平均値の平均値を取ったような感じで、最後に全平均を引いているのは、AとBの平均値を加算して2倍値になったのを補正しているようなイメージです。

なお、最適水準に限らず、水準の対象を変えれば同じ計算手順で任意の点平均を求めることができます。

ただし、二元配置実験の場合、組み合わせ通り数が多いので、最適水準以外の推定値を計算することにあまり実用性がなく、必要となるケースは比較的少ないと思います。

一元配置と比べて因子が二つになると考えることいっぱい・・

信頼区間の計算のしかた

信頼区間は先ほどにも少し登場しましたが、以下の式で求めることができます。

実験計画法に限らず、統計的推定でも基本的にはこの形の式しか登場しませんので、何度も復習して覚えてしまいましょう。

ただし、一元配置実験と異なり、因子が二つ以上となる場合には、繰り返し数の定義が少し複雑になります。

単純に実験の繰り返し回数を用いるのではなく、次の式で示す有効反復数($n_{e}$)を用います。

計算式には、伊奈の式田口の式の二種類がありますが、結局のところ同じ形にたどり着きますので、どちらを用いても構いません。

今回の場合、有効反復数は次のように求められます。



あとは、自由度と有意水準に対応するt値をt分布表もしくはエクセル関数などを用いて求めれば、信頼区間を算出することができます。

まとめ

  • 二元配置実験とは
    二つの因子を変化させて特性値への影響を調べるための手法
  • 交互作用とは
    二つ以上の因子が組み合わさったときに、ある特定の条件で相乗的、あるいは相殺的に特性値に影響を及ぼす作用
  • 繰り返しのない二元配置実験の流れ
    ①:補助表を作る
    ②:分散分析表を作る
    ③:F検定で水準の有意性を調べる
    ④:誤差変動にプーリングする
    ⑤:最適水準の点平均の推定値を求める
    ⑥:信頼区間を求める

最後までご覧いただきありがとうございました。

数式の苦手な方でも安心の入門編。

 


回帰分析、検定、実験計画法まで幅広く、エクセルを用いた実践方法も習得したい方に。

 


乱塊法、分割法もお任せ! QC検定1級の教材としてもおススメ。

 

スポンサーリンク
実験計画法
こてつをフォローする
この記事を書いた人

【経歴】
関東在住、40代、製造業(品質部門)。
これまで、研究開発、設計、生産技術、仕入先の品質管理を手掛ける。

【保有知識・技術分野】
統計学、信頼性工学、品質工学。
半導体、基板、有機材料、金属、セラミックスの材料、製造、加工技術。
部品加工(機械加工、化学処理)、組立・実装技術、分析・物理解析技術。
QC検定1級保有。

【当サイトについて】
品質・生産の基礎知識をテーマに、用語の解説、使い方(作り方)、メリット、考え方のポイントを分かりやすく解説しています。
某メーカ様の品質教育用の資料としてもご活用いただいております。
QC検定(品質管理検定)の試験対策、おすすめ勉強法も紹介しています。

こてつをフォローする
QCとらのまき

コメント