幾何分布とは? 期待値と分散の導出、エクセルでの計算のしかた

統計学の基礎

「幾何分布ってどのような分布なの?」
「期待値と分散の計算の仕方を知りたい」
「エクセルでグラフ化したい」

このような疑問や悩みをお持ちの方に向けた記事です。

幾何分布とは、成功か失敗のいずれかとなる試行において、初めて成功するまでの試行回数を確率変数とした離散型の確率分布を表します。

コイン投げで初めて表が出るまでの回数や、ゲームのガチャで初めてSSRが出るまでの回数など身近な例も多く、計算の仕方を理解しておくと日常生活でも役立つと思います。

この記事では、幾何分布の定義、二項分布や指数分布との違い、期待値と分散の導出の仕方、エクセルでグラフ化する手順について解説しています。

初心者の方にもわかりやすいよう、できるだけ細かく手順を踏んで説明しますので、参考になればうれしいです。

幾何分布とは?

幾何分布の定義

成功か失敗のいずれかで表される試行のことをベルヌーイ試行と呼びます。

ベルヌーイ試行を1回行う場合において、成功する確率をpとすると、失敗する確率は1-pとなります。

そして、これを何回も繰り返した場合において、初めて成功するまでの回数の分布を表したものを幾何分布と呼び、以下の数式で定義されます。

pは成功確率kは成功回数を表し、「確率変数Xは幾何分布Geo(p)に従う」と表現されます。

とらまる
とらまる

なんで「幾何」っていう名前なんだろう?

「幾何」というフレーズがイメージと結びつきにくいですが、幾何分布の数式が等比数列であることに由来しています。

等比数列とは、最初の項に一定の数値をかけていった数列のことで、幾何分布の数式も等比数列の一つです。

そして、等比数列の英語Geometric Sequenceが語源となって、幾何分布(Geometric Distribution)と呼ばれています。

幾何分布における確率変数Xは、成功回数kであり、1回、2回・・と数えることのできる計数値です。

そのため、例えば1から2の間の小数点以下の変数は取らない、離散的な変化をする性質の確率分布となっています。

このような離散型の確率分布が示す確率のことを確率質量関数と呼び、P(X=k)として表されます。

離散型確率分布や確率質量関数ついては、別の記事で詳しく解説していますので、合わせて参考にしていただければと思います。

確率分布とは? 離散型と連続型の特徴と違いを解説
確率分布とは、とある確率に従って決まる変数と、その発生確率との対応を表した分布のことです。この記事では、統計学が初めての方でも理解できるよう、確率分布の定義、離散型、連続型確率分布の特徴について、わかりやすく解説しています。

二項分布との違い

幾何分布と混同しがちな分布として、二項分布があります。

二項分布はベルヌーイ試行を何回も繰り返した場合における成功回数の分布を表し、以下の数式で定義されます。

pは成功確率kは成功回数nは試行回数を表します。

二項分布の場合、「試行回数に対する成功の回数」を表すので、成功の回数が1回に限った分布ではありません。

これに対し、幾何分布では「初めて成功するまでの回数」を意味するので、例えば、k回目に成功するとしたら、1回目からk-1回目までは失敗し続ける状態を表します。

二項分布とは? 期待値と分散の導出、エクセル関数の使い方
二項分布とは、成功か失敗のいずれかとなる試行において、成功回数を確率変数とした離散型の確率分布を表します。この記事では、二項分布の定義、期待値と分散の導出の仕方、エクセルでグラフ化する手順について、例題と合わせて解説しています。

指数分布との関係

指数分布の定義

幾何分布と性質の近い分布として、指数分布があります。

指数分布とは、とある事象の発生間隔を表す連続型の確率分布です。

例えば、とある店の来客の間隔や、とある製品が壊れる間隔、次に電話が鳴るまでの時間など、身近な事例に活用されることも多く、時間を確率変数に取ることが特徴です。

以下に指数分布の確率密度関数の数式を示します。

eはネイピア数(自然対数の底)λは所定の期間における平均の発生回数を表します。

つまり、平均の発生回数が分かれば、次に事象が発生するまでの間隔を求めることができるのです。

指数分布とは? 期待値と分散の導出、エクセル関数の使い方
指数分布とは、イベントの発生間隔を表す連続型の確率分布です。とある製品が壊れる間隔など身近な事例も多く、時間を確率変数に取ることが特徴です。この記事では、指数分布の定義、ポアソン分布との違い、期待値と分散の導出の仕方、エクセルでグラフ化する手順について解説しています。

幾何分布の極限が指数分布

指数分布の定義である「次に起こるまでの間隔」について、もう少し考えてみましょう。

「次に起こるまで」ということは、裏を返すと「その時間までは発生しない」ことを意味します。

つまり、とあるタイミングの直前までは発生しない状態が続き、そして初めて事象の発生に至ります。

幾何分布と何か似ていると思いませんか?

実は、確率変数が回数のように離散的か、時間のように連続的かの違いだけで、幾何分布と指数分布ともに、次に事象が発生するまでの間隔を表す確率分布なのです。

すなわち、幾何分布の極限を取ると指数分布になるという性質を持っているのです。

繋がりを知っておけば覚えやすいね

以下に導出の過程を記載しますので、興味のある方は見てみてください。

期待値と分散の導出

幾何分布における期待値E(X)と分散V(X)は、以下の数式で求めることができます。

少し難しいですが、導出過程に興味のある方は参考にどうぞ。

期待値が確率の逆数というのは何となくイメージと合うね

なお、E(X)とV(X)の意味、V(X)の導出の過程については、別の記事で解説していますので、合わせてご覧ください。

確率密度関数とは? 定義と活用法、期待値と分散の計算式を解説
確率密度関数とは、確率変数が連続的な値を取る分布において、発生のしやすさを関数に表したものです。この記事では、確率密度関数の定義、活用の用途、期待値と分散の計算の仕方について、初心者の方にもわかるよう例題を用いて基本から解説しています。

エクセルでのグラフの書き方

エクセルでの幾何分布の確率の求め方、グラフの書き方を紹介します。

他の主要な確率分布はだいたい専用の関数があるのですが、幾何分布を計算できる関数は少なくともExcel 2019までのバージョンでは存在しません。

とは言っても、幾何分布の場合は単純な等比数列なので、正規分布やポアソン分布などのように複雑な計算式を用いる必要がありません。

そのため、数式を直接入力して計算するようにしましょう。

例えば、p=0.1として、確率変数X=kにおける確率質量関数P(X)を求めると以下のようになります。

また、同様に確率変数X=kにおける累積分布関数F(X)を求めると以下になります。

累積分布関数は、確率変数xの値が大きくなるにつれて、1に収束することが見て取れます。

これは、確率の合計値が1になることを表しており、この性質がグラフからも分かります。

以下は、pの値を変えたときの幾何分布の形状の違いを示しています。

いずれも、確率変数の増加に対し、単調減少を示しますが、発生確率pの値が大きいほど減少の傾斜が急峻であることが分かります。

これは、発生確率が高いほど、回数の少ない段階で初めて事象の起こる確率が高くなることを意味しており、その性質がグラフの形状からも見て取れるということです。

例題

クリックで拡大
クリックで拡大

まとめ

  • 幾何分布
    ⇒成功か失敗のいずれかとなる試行において、初めて成功するまでの試行回数を確率変数とした離散型の確率分布
    ⇒コイン投げで初めて表が出るまでの回数、ゲームのガチャで初めてSSRが出るまでの回数など
  • 二項分布との違い
    ⇒二項分布は「試行回数に対する成功の回数」を表す分布
    ⇒幾何分布は「初めて成功するまでの回数」を表す分布
  • 指数分布との関係
    ⇒指数分布、幾何分布ともに、次に事象が発生するまでの間隔を表す分布
    ⇒幾何分布の極限を取ると指数分布になる
  • 期待値
    ⇒1/p
  • 分散
    ⇒(1-p)/p2

普段、スマホゲームのガチャなどで「何回やったら当たりが出るんだろう?」と素朴な疑問を持ったことはありませんか。

実際に確率に出してみると、案外望みがあったり、反対に絶望的に低かったり、感触が掴めるかもしれません。

ぜひ身近なネタで活用してみてください。

最後まで読んでいただき、ありがとうございました。

この記事で紹介した幾何分布は、統計的品質管理を実践する上での基本要素の一つです。

製造業に携わるエンジニアであれば、その他の統計的手法はもちろんのこと、品質管理、生産の基礎知識を幅広く身につけておく必要があります。

社内講座などの機会が設けられている場合は、ぜひ若手のうちから積極的に活用して受講することをおススメします。

ただ、多くの社員を対象とする社内講座の場合、皆さん一人ひとりのレベルに適した学習ができない場合もあります。

忙しい日々の限られた勉強の時間を最大限に活かすためにも、自分の教育プランは自分で管理することを意識して、能動的に学習することも検討してみてはいかがでしょうか。

製造業の若手エンジニアに伝えたい、自分への長期投資を始めよう
製造業の若手エンジニアの皆さん。自分の育成計画はきちんと自分で管理できていますか?会社の教育制度は決してあなた一人のために準備されたものではありません。この記事では、将来の健全なエンジニア生活の確保を目指して、自己投資が必要な理由とメリット、効率的な勉強方法を紹介しています。
スポンサーリンク
統計学の基礎
こてつをフォローする
この記事を書いた人
こてつ

【経歴】
関東在住、30代後半、大手電機メーカの生産技術職。
これまで、研究開発、機構設計、生産技術、仕入先の品質管理を手掛ける。

【保有知識・技術分野】
統計学、信頼性工学、品質工学。
半導体、基板、有機材料、金属、セラミックスの材料、製造、加工技術。
部品加工(機械加工、化学処理)、組立・実装技術、分析・物理解析技術。
QC検定1級保有。

【当サイトについて】
品質・生産の基礎知識をテーマに、用語の解説、使い方(作り方)、メリット、考え方のポイントを分かりやすく解説しています。
某メーカ様の品質教育用の資料としてもご活用いただいております。
QC検定(品質管理検定)の試験対策、おすすめ勉強法も紹介しています。

こてつをフォローする
QCとらのまき

コメント