確率分布とは？　離散型と連続型の特徴と違いを解説

統計学の基礎

2024.03.24 2021.09.23

「確率分布の定義がよく分からない」
「確率分布の種類と特徴を教えて」

こんな疑問や悩みをお持ちの方に向けた記事です。

確率分布って名前を見るだけでも難しそうで、定義をあらためて確認することも敬遠しがちですよね。

しかし、確率分布は正規分布や二項分布などの基礎となる考え方で、統計学を学んでいく上では必要不可欠の知識です。

この記事では、統計学が初めての方でも理解できるよう、確率分布の定義、種類、その特徴について、わかりやすく解説していますので、参考になればうれしいです。

Contents

確率変数とは
確率分布とは
離散型確率分布
連続型確率分布
まとめ

確率変数とは

まず最初に、確率変数について説明します。

JIS Z 8101-1によると、確率変数は以下のように定義されています。

どのような値となるかが、ある確率法則によって決まる変数。確率法則は確率分布で記述される。
引用元：JIS Z 8101-1：1999 統計－用語と記号ー第1部：確率および一般統計用語

つまり、値が一つに決まったものではなく、とある確率に従って決まる変数のことを意味し、一般的な表記としては、確率変数をX、その確率をP（X）と表します。

確率変数の一般的な例としては、サイコロの目があります。

サイコロの目は、1から6までの値があり、偏りがなければ全て1/6の確率でいずれかの値を取ります。

この場合、サイコロの目が確率変数Xであり、それぞれの目の発生確率P（X）は以下のように表されます。

その他の例としては、コイン投げがあり、確率変数として表を1、裏を0とした場合に、以下のように記載されます。

確率分布とは

同じくJIS Z 8101-1によると、以下のように定義されています。

確率変数がある値となる確率、又はある集合に属する確率を与える関数。その確率変数が定義されている集合全体に対する確率は 1 である。
引用元：JIS Z 8101-1：1999 統計－用語と記号ー第1部：確率および一般統計用語

つまり、確率変数とその発生確率の対応を表した分布を意味します。

先ほどのサイコロの事例で説明すると、1の目の確率は1/6、2の確率は1/6、3の確率は1/6・・・と、それぞれの変数に対応する確率が存在します。

このように、サイコロの目（確率変数）に対する発生確率の分布を表したものが確率分布となります。

そして、分布全体の合計値は、すべての確率変数の発生確率の合計になるので、必ず1になります。

とらまる

とらまる

出やすさを表したものってことだね

離散型確率分布

離散型とは、確率変数が不連続な値を取る分布のことで、先ほどのサイコロの目を始めとして、個数などの計数値が変数となります。

代表例としては、二項分布やポアソン分布があります。

確率変数Xがある値xを取る場合の確率を関数にしたものを確率質量関数f（x）と呼びます。

集合全体の確率の合計が1であることは、以下の数式で表されます。

連続型確率分布

連続型とは、確率変数が連続的な値を取る分布のことで、長さや質量といった計量値が変数となります。

代表例としては、正規分布や指数分布があります。

離散型との違いとしては、確率変数の「点」での確率が存在しないことです。

例えば、サイコロの目の場合、1～6の6種類のいずれかに割り振られますが、長さの場合は、どうなるでしょう。

長さ1mの確率といっても、小数点以下をカウントした場合、0.999や1.001などは別の値になってしまいます。

そのため、ジャスト1mとピンポイントでの確率は存在せず、理論上では0ということになります。

それでは、確率分布は全てゼロになるのかというと、それも間違いで、連続型確率分布では分布を示すf（x）に確率密度関数が用いられます。

確率密度関数とは、確率とは次元が異なりますが、発生のしやすさを関数に表したものであり、とある微小な確率変数の幅に対する発生確率のようなイメージのことです。

あくまでも相対的な発生のしやすさを表しているため、確率密度関数の値は1以上になることもあります。

なお、確率変数がマイナスの値や小数点以下の値も取るので、合計が1を示す数式は以下のように表されます。

式の見た目は違うけど同じ意味を表しているんだね

まとめ

確率変数
⇒値が一つに決まったものではなく、とある確率に従って決まる変数
確率分布
⇒確率変数とその発生確率の対応を表した分布
⇒分布全体の確率の合計値は1になる
離散型確率分布
⇒確率変数が不連続な値を取る分布で、確率質量関数を用いる
⇒二項分布やポアソン分布など
連続型確率分布
⇒確率変数が連続的な値を取る分布で、確率密度関数を用いる
⇒正規分布や指数分布など

離散型と連続型の確率分布は、色々な種類に分かれる分布の基本に当たるので、しっかりと定義と特徴をおさえておきましょう。

コメント

メニュー
ホーム
検索
トップ
サイドバー
プロフィール

こてつ

【経歴】
関東在住、４０代、製造業（品質部門）。これまで、研究開発、設計、生産技術、仕入先の品質管理を手掛ける。

【保有知識・技術分野】
統計学、信頼性工学、品質工学。
半導体、基板、有機材料、金属、セラミックスの材料、製造、加工技術。
部品加工（機械加工、化学処理）、組立・実装技術、分析・物理解析技術。
QC検定１級保有。

【当サイトについて】
品質・生産の基礎知識をテーマに、用語の解説、使い方（作り方）、メリット、考え方のポイントを分かりやすく解説しています。
某メーカ様の品質教育用の資料としてもご活用いただいております。
QC検定（品質管理検定）の試験対策、おすすめ勉強法も紹介しています。
カテゴリー
人気記事

 FTAとは？　初心者必見！失敗しないFTAの作り方のコツ教えます 64.8k件のビュー

 特性要因図とは？　用途と活用例、作り方の手順をまとめて解説 41.5k件のビュー

 DRBFMとは？　実践に使える記入例あり！目的と進め方を解説 39.5k件のビュー

 QCストーリーとは？　3つの型の特徴、進め方のポイントを解説 34.3k件のビュー

 FMEAとは？　初心者必見！FMEAのメリットと作成手順を解説 32.4k件のビュー

 管理図とは？　種類と選び方、作り方、異常の見つけ方を徹底解説 30.4k件のビュー

 QC検定3級対策　模擬問題　～チェックシート編～ 28.2k件のビュー

 QC検定3級に挑む　～過去問から出題傾向を徹底分析～ 24.8k件のビュー

 QC検定2級に挑む　～過去問から出題傾向を徹底分析～ 23.6k件のビュー

 QC工程表とは？　初心者必見！目的、様式、作り方まとめて解説 22.4k件のビュー
スポンサーリンク

スポンサー募集

検索