幾何分布
確率質量関数 450px | |
累積分布関数 450px | |
母数 |
左:[math]0 \lt p \lt 1[/math] の成功確率(実数) 右:[math]0 \lt p \leq 1[/math] の成功確率(実数) |
---|---|
台 |
左:k 回の試行, [math]k \in \{1,2,3,\dots\}\![/math] 右:k 回の失敗, [math]k \in \{0,1,2,3,\dots\}\![/math] |
確率質量関数 |
左:[math](1 - p)^{k-1}\,p\![/math] 右:[math](1 - p)^{k}\,p\![/math] |
累積分布関数 |
左:[math]1-(1 - p)^k\![/math] 右:[math]1-(1 - p)^{k+1}\![/math] |
期待値 |
左:[math]\frac{1}{p}\![/math] 右:[math]\frac{1-p}{p}\![/math] |
中央値 |
左:[math]\left\lceil \frac{-1}{\log_2(1-p)} \right\rceil\![/math] 右:[math]\left\lceil \frac{-1}{\log_2(1-p)} \right\rceil\! - 1[/math] [math]\left\lceil \frac{-1}{\log_2(1-p)} \right\rceil\![/math] が整数でなければ唯一ではない |
最頻値 |
左:[math]1[/math] 右:[math]0[/math] |
分散 | 両方とも [math]\frac{1-p}{p^2}\![/math] |
歪度 | 両方とも [math]\frac{2-p}{\sqrt{1-p}}\![/math] |
尖度 | 両方とも [math]6+\frac{p^2}{1-p}\![/math] |
エントロピー | 両方とも [math]\tfrac{-(1-p)\log_2 (1-p) - p \log_2 p}{p}\![/math] |
モーメント母関数 |
左:[math]\frac{pe^t}{1-(1-p) e^t}\![/math], for [math]t\lt -\ln(1-p)\![/math] 右:[math]\frac{p}{1-(1-p)e^t}\![/math] |
特性関数 |
左:[math]\frac{pe^{it}}{1-(1-p)\,e^{it}}\![/math] 右:[math]\frac{p}{1-(1-p)\,e^{it}}\![/math] |
幾何分布(きかぶんぷ、英: geometric distribution)は、離散型確率分布で、次の2通りの定義がある。
- ベルヌーイ試行を繰り返して初めて成功させるまでの試行回数 X の分布。台は { 1, 2, 3, ...}
- ベルヌーイ試行を繰り返して初めて成功させるまでに失敗した回数 Y=X-1 の分布。台は { 0, 1, 2, 3, ...}
問題とする事柄によってこれら2つの幾何分布から都合の良い方を選ぶ。混同を避けるために幾何分布について言及するときは定義を明らかにするのが賢明である。しかし多くの場合前者(X の分布)を指す。
各成功確率 p である独立ベルヌーイ試行について
- [math]\Pr(X = k) = p(1-p)^{k-1}, \qquad \Pr(X \leq k) = 1-(1-p)^{k}[/math]
for k = 1, 2, 3, ....
- [math]\Pr(Y = k) = p(1-p)^{k}, \qquad \Pr(Y \leq k) = 1-(1-p)^{k+1}[/math]
for k = 0, 1, 2, 3, ....
例えば、サイコロの1の目が出るまで繰り返し投げるとする。投げる回数の台は無限集合 { 1, 2, 3, ...} を取り、p = 1/6 の幾何分布に従うという。
Contents
性質
- [math]\mathrm{E}(X) = \frac{1}{p}, \qquad\mathrm{var}(X) = \frac{1-p}{p^2}.[/math]
確率変数Yの期待値、分散
- [math]\mathrm{E}(Y) = \frac{1-p}{p}, \qquad\mathrm{var}(Y) = \frac{1-p}{p^2}.[/math]
無記憶性
幾何分布の重要な性質として、無記憶性と呼ばれるものがある。幾何分布では、いかなるパラメータ p に対しても
[math] \forall n, k \in \mathbb{N}, \ \ \ P(X \gt n + k | X \gt n) = P(X \gt k) [/math]
なる等式が成り立つ。これはコイントスを例にすると、コイントスを繰り返して少なくとも n 回表が出なかったという情報が与えられたときに、表が出るまでに投げる回数が n + k を超える条件付き確率は、情報が与えられない場合の確率(すなわち、今すべてを忘れて改めてコイントスを開始して、表が出るまでに投げる回数が k 回を超える確率)に等しいという意味である。
各種のギャンブルにおいて負けが続くと、しばしば「運がたまっている」とか「そろそろ勝ちが巡ってくる」といった考えに陥りがちである。しかし、試行の独立性を仮定する限りにおいては、この考えは誤謬であり、負けが続いているという情報は未来の確率に何の影響も与えないということが、無記憶性からわかる。
この逆、すなわち無記憶性を持つ離散型確率分布が幾何分布のみであることも、比較的容易に示される。
ゼータ分布との関係性
幾何分布の確率質量関数は [math](1 - p)^{k}[/math] に比例するが、[math]k \ge 1[/math] に限定し k の対数を取ると [math](1 - p)^{\log k} = k ^ {\log(1 - p)}[/math] となり、[math]s = -\log(1 - p)[/math] と置いた上で、[math]s \gt 1[/math] であれば、さらに p に依存した数をかけて確率分布にすることによりゼータ分布 [math]k^{-s}/\zeta(s)[/math] になる。[math]s = 1[/math] ならば k に上限を設けることでジップ分布になる。