離散確率分布

提供: miniwiki
移動先:案内検索
ファイル:Discrete probability distrib.svg
離散確率分布の確率質量関数。単集合 {1}、{3}、{7} の確率はそれぞれ 0.2、0.5、0.3。これらの点を含まない集合の確率はゼロである。
ファイル:Discrete probability distribution illustration.png
上から順に、離散確率分布、連続確率分布、連続部分と離散部分がある確率分布の累積分布関数

離散確率分布: discrete probability distribution)は、確率論統計学において、観測される値が事前に定義された一連の値に限定される場合の確率分布である。とりうる値は有限個の数であるか、高々可算集合である。

定義

確率論において確率分布離散であるとは、それが確率質量関数で定義できる場合である。したがって確率変数 X の分布が離散的で、X離散確率変数と呼ばれるのは、次が成り立つ場合である。

[math]\sum_u \Pr(X=u) = 1[/math]

uX のとりうる値を全て通る。

確率変数が離散であるとき、非可算の実数の総和(全ての有限部分和の最小上界)は常に無限大に発散するため、確率がゼロでない値の集合有限または可算無限である。

一般にこのようなとりうる値の集合は位相幾何学的な離散集合であり、その全ての点は孤立点である。しかし、この可算集合が実数直線上で稠密であるような離散確率変数も存在する。

統計学的モデリングでよく知られた離散確率分布としては、ポアソン分布ベルヌーイ分布二項分布幾何分布負の二項分布などがある。さらに離散一様分布は、コンピュータプログラムで無作為な選択を行う際によく使われる。

代替の説明

上記と等価的に、離散確率変数をその累積分布関数 (CDF) がジャンプ不連続によってのみ増加するような確率変数と定義することもできる。すなわち、そのCDFは不連続な点でのみ増加し、不連続点と不連続点の間は一定である。このジャンプ不連続が起きる点はまさに、その確率変数がとりうる値に対応している。ジャンプ不連続点の数は有限または可算無限である。そのようなジャンプの位置は位相幾何学的に離散とは限らない。例えば、CDFが全ての有理数の位置でジャンプすることも考えられる。

以上から、離散確率分布はディラックのデルタ関数を使って確率密度関数を一般化したものとして表現することが多く、それによって連続分布と離散分布を統一的に扱うことができる。これは、連続部分と離散部分がある確率分布を扱う際に特に便利である。

指示関数を使った表現

離散確率変数 X について、u0, u1, ... をその変数がゼロでない確率でとりうる値とする。これを次のように表現する。

[math]\Omega_i=\{\omega: X(\omega)=u_i\},\, i=0, 1, 2, \dots[/math]

これらは素集合であり、前掲の式から次が導かれる。

[math]\Pr\left(\bigcup_i \Omega_i\right)=\sum_i \Pr(\Omega_i)=\sum_i\Pr(X=u_i)=1[/math]

また、u0, u1, ... 以外の任意の値を X がとる確率はゼロであり、そのことから X を確率がゼロでない集合について次のように表すこともできる。

[math]X=\sum_i \alpha_i 1_{\Omega_i}[/math]

ここで [math]\alpha_i=\Pr(X=u_i)[/math] であり、[math]1_A[/math]A指示関数である。これを離散確率変数の別の定義として使うこともできる。

関連項目

en:Probability distribution#Discrete probability distribution