ポアソン分布
累積分布関数 Plot of the Poisson CDF 横軸は[math]k[/math]パラメータで、累積分布関数は整数値[math]k[/math]においてのみ定義され、整数値以外では平らとなる。 これは、ポアソン分布が整数値でのみ定義されるためである。 | |
母数 | [math]\lambda \gt 0[/math] |
---|---|
台 | [math]k \in \{ 0, 1, 2, 3, \dotsc \}[/math] |
確率質量関数 | [math]\frac{\lambda^k}{k!}\cdot e^{-\lambda}[/math] |
累積分布関数 |
[math]k \ge 0[/math] について、 |
期待値 | [math]\lambda\,\![/math] |
中央値 | [math]\approx \left\lfloor \lambda+\frac{1}{3}-\frac{0.02}{\lambda} \right\rfloor[/math] |
最頻値 | [math]\lfloor\lambda\rfloor[/math] |
分散 | [math]\lambda[/math] |
歪度 | [math]\lambda^{-1/2}[/math] |
尖度 | [math]\lambda^{-1}[/math] |
エントロピー |
[math]\begin{align}
\lambda \left[1-\log(\lambda)\right] \\ + e^{-\lambda} \sum_{k=0}^\infty \frac{\lambda^k\log(k!)}{k!}
\end{align}[/math] |
モーメント母関数 | [math]\exp(\lambda (e^t-1))[/math] |
特性関数 | [math]\exp(\lambda (e^{it}-1))[/math] |
統計学および確率論においてポアソン分布 (英: Poisson distribution)とは、数学者シメオン・ドニ・ポアソンが1838年に確率論とともに発表した、所与の時間間隔で発生する離散的な事象を数える特定の確率変数 X を持つ離散確率分布のことである。ある離散的な事象に対して、ポアソン分布は所与の時間内での生起回数の確率を示し、指数分布は生起期間の確率を示す[1]。
Contents
定義
定数 λ > 0 に対し、自然数を値にとる確率変数 X が
- [math]P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}[/math]
を満たすとき、確率変数 X はパラメータ λ のポアソン分布に従うという。
ここで、e はネイピア数 (e = 2.71828⋯)であり、k! は k の階乗を表す。また、λ は所与の区間内で発生する事象の期待発生回数に等しい。
P(X = k) は、「所与の時間中に平均で λ 回発生する事象がちょうど k 回(k は非負の整数)発生する確率」に相当する。例えば、事象が平均で2分間に1回発生する場合、10分間の中で事象が発生する回数は、λ = 5 のポアソン分布モデルを使って求められる。
性質
平均・分散
ポアソン分布の平均 E[X] および分散 V[X] は、λ に等しい[2]。
- [math]\begin{align} \mathrm{E}[X]&=\lambda,\\ \mathrm{V}[X]&=\lambda. \end{align}[/math]
最頻値
ポアソン分布の最頻値は、λ 以下の最大の整数である。
モーメント母関数
平均 λ のポアソン分布のモーメント母関数 MX(t) は、
- [math]M_{X}(t) = \mathrm{E} \left[e^{tX}\right]=\sum_{k=0}^\infty e^{tk} P(X=k)=\sum_{k=0}^\infty e^{tk} {\lambda^k e^{-\lambda} \over k!} =e^{\lambda(e^t-1)}[/math]
で与えられる。
モーメント
ポアソン分布の高次モーメントは、λ を含むトゥシャール多項式であり、二項係数を持つ。
- [math]\begin{align} m_1 &=E[X] = \lambda, \\ m_2 &=E[X^2] = \lambda^2 + \lambda, \\ m_3 &=E[X^3] = \lambda^3 + 3\lambda^2+\lambda, \\ &\vdots \end{align}[/math]
ポアソン分布の n 次の階乗モーメントは λn である。
- [math] \mathrm{E}[X(X-1) \dotsb (X-n+1)]= \lambda^n . [/math]
キュムラント
ポアソン分布の n 次のキュムラント κn は全て、平均 λ と等しい。
- [math] \kappa_n= \frac{\partial^n}{\partial t^n}\log{(M_X(t))}\biggr\vert_{t=0}= \lambda. [/math]
再生性
ポアソン分布は再生性を有する。すなわち X と Y が独立な確率変数であり、それぞれパラメータ λ, μ を持つポアソン分布に従うとき、 確率変数の和 X + Y はパラメータ λ + μ のポアソン分布に従う。
その他
ポアソン分布は無限分解可能な確率分布である。
近似
λ が十分に大きい(たとえば λ > 1000)ならば、平均 λ, 標準偏差 √λ の正規分布はこのポアソン分布の非常に優れた近似となる。おおよそ λ > 10 であれば、適切な連続な分布への修正がなされている場合に限り、正規分布はこのポアソン分布の優れた近似となる。例えば P(X ≤ x) に関して、x が非負の整数ならば、P(X ≤ x + 0.5) と置換することができる。
ポアソン過程
λ は、単位時間当たりの事象の平均発生回数などの割合と見なされる場合があり、到着率とよばれる。このとき、Nt を時刻 t より前に発生した事象の回数とすると、
- [math]P(N_t=k)=\frac{e^{-\lambda t}(\lambda t)^k}{k!}[/math]
となる。この式を満たすものをポアソン過程という。さらに、最初の事象が発生するまでの待機時間 T は、指数分布による連続確率変数である。この確率分布は、次のように導くことができる。
- [math]P(T\gt t)=P(N_t=0).[/math]
時間を含む場合、すなわち1次元ポアソン過程では、各時間内で事象が発生する回数を確率変数とする離散ポアソン分布と、待機時間を確率変数とする連続アーラン分布の両方を含んでいる。1よりも高い次元のポアソン過程についても同様である。
事象
- 具体的な例
ポアソン分布は、ポアソン過程に関連して発生する。 これは、離散的な自然現象(所与の領域内や所与の時間内において、0回、1回、2回、3回… と発生する現象)に該当するものであり、現象が発生する確率は、時間ないし空間内において一定である。また、時間または空間における発生間隔は指数分布になる。次に、その例を示す。
- 1時間に特定の交差点を通過する車両の台数。
- 1ミリリットルの希釈された水試料中に含まれる特定の細菌の数(細菌数検査における最確法)。
- 単位面積あたりの雨粒の数。
- 1ページの文章を入力するとき、綴りを間違える回数。
- 1日に受け取る電子メールの件数。
- 1時間あたりの電話がかかってくる件数。
- ある一定の時間内の店への来客数。
- 1分間のWebサーバへのアクセス数。
- 1キロメートルあたりのある通り沿いのレストランの軒数。
- 1ヘクタールあたりのエゾマツの本数。
- 1立方光年あたりの恒星の数。
- 単位時間あたりの放射線の計数値であるカウント毎分やカウント毎秒(半減期による減衰や外部からの放射能などによる変動がないと仮定して)。
- 歴史的例
上記の例のほか、歴史的に有名な事例としては、ロシア生まれでドイツで活躍した経済学者、統計学者のボルトキーヴィッチ (テンプレート:Ru) による「プロイセン陸軍で馬に蹴られて死亡した兵士数」の例が知られている。ボルトキーヴィッチは著書"Das Gesetz der kleinen Zahlen "(The Law of Small Numbers)[3]において、プロイセン陸軍の14の騎兵連隊の中で、1875年から1894年にかけての20年間で馬に蹴られて死亡する兵士の数について調査しており、1年間当たりに換算した当該事案の発生件数の分布がパラメータ0.61のポアソン分布によく従うことを示している。
- 事象の特徴
上記のように、稀にしか起こらないような現象を大量に観測した結果がポアソン分布に従う例は極めて多く見られる。このようなポアソン分布に従う事象の中で、時間の経過とともに発生する事象の特徴は次のようにまとめられる。
- (希少性):時間幅 [math]\Delta t[/math] の間に着目している事象がちょうど1回起こる確率が [math]\lambda\Delta t+o(\Delta t)[/math]、2回以上起こる確率が [math]o(\Delta t)[/math]
- (定常性):事象の起きる確率は、どの時間帯で同じ
- (独立性):事象の起きる確率は、それ以前に起こった事象の回数や起こり方には無関係
ここで、o(Δt) は Δt に対して高位の無限小を表しており、Δt のスケールに注目したときに無視できる微小量であることを表す。
極限定理
パラメータが n と p = λ/n である二項分布において、λ を一定に保ったまま n を無限大に近づけると、その分布は平均 λ のポアソン分布に近づく。すなわち、
- [math]\lim_{\lambda=np, n\to\infty}{n \choose k} p^k (1-p)^{n-k}= \frac{\lambda^k e^{-\lambda}}{k!}[/math]
が成り立つ。これをポアソンの極限定理という。この定理の名は、数学者シメオン・ドニ・ポアソンが1837年に著書 "Recherches sur la probabilite des jugements" (Researches on the Probabilities)[4]の中で結果を与えたことに由来する。なお、この中で、二項分布の極限としてポアソン分布が初めて導出されている。
導出の詳細を次に示す。計算には、以下の関係式を用いる。
- [math]\lim_{n\to\infty}\left(1-\frac{\lambda }{n}\right)^n=e^{-\lambda}.[/math]
ここで p = λ/n とすると、
- [math]\begin{align} \lim_{n\to\infty} P(X=k)&=\lim_{n\to\infty}{n \choose k} p^k (1-p)^{n-k}\\ &=\lim_{n\to\infty}{n! \over (n-k)!k!} \left({\lambda \over n}\right)^k \left(1-{\lambda\over n}\right)^{n-k}\\ &=\lim_{n\to\infty} \underbrace{\left({n \over n}\right)\left({n-1 \over n}\right)\left({n-2 \over n}\right) \cdots \left({n-k+1 \over n}\right)} \underbrace{\left({\lambda^k \over k!}\right)}\underbrace{\left(1-{\lambda \over n}\right)^n}\underbrace{\left(1-{\lambda \over n}\right)^{-k}}. \end{align}[/math]
n を無限大に近づけると、4つの下波括弧のうち、最初の下波括弧の部分は、1に近づく。2番目の下波括弧の部分には n が出現しないので、そのままである。3番目の下波括弧の部分は、e−λ に近づく。最後の下波括弧の部分は、1に近づく。
したがって極限は存在し、
- [math]{\lambda^k e^{-\lambda} \over k!}[/math]
となる。
少数の法則
法則という言葉は、確率分布の同義語として使われることがあり、法則収束は分布の収束を意味する。したがってポアソン分布は、滅多に起こり得ない希少な事象の発生数の確率分布であることから、少数の法則と呼ばれることがある。
脚注
- ↑ “指数分布とポアソン分布のいけない関係” (日本語). . 2012年1月27日閲覧.
- ↑ 土居正明 (pdf). 二項分布と Poisson 分布の平均・分散 (Report) . ポアソン分布の平均と分散の導出
- ↑ Ladislaus von Bortkiewicz (1898), Das Gesetz der kleinen Zahlen, University of Wasington Library, Leipzig Druck und Verlag von B.G.Teubner 復刻版が2010年にNabu Pressより発売されている
- ↑ Par Simeon Denis Poisson (1857), Recherches sur la probabilité des Jugements, Des Regles Generares du Calcul des Probabilites, Bacheliar, Impremeur-Libraire.