ディリクレ分布
確率密度関数 325px ディリクレ分布(K=3)の、様々なパラメータベクトルαにおける確率密度関数。左上から時計回りにα=(6, 2, 2), (3, 7, 5), (6, 2, 6), (2, 3, 4)。 | |
累積分布関数 なし | |
母数 |
[math]K \ge 2[/math] 変量の個数 (整数) [math]\alpha_1, \ldots, \alpha_K[/math] 集中度母数, ここで [math]\alpha_i \gt 0[/math] |
---|---|
台 | [math]x_1, \ldots, x_K[/math] 、ここで、 [math]x_i \in [0,1][/math] かつ [math]\sum x_i = 1[/math] |
テンプレート:確率分布/リンク 密度 |
[math]\frac{1}{\mathrm{B}(\boldsymbol\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1} [/math] ここで、 [math]\mathrm{B}(\boldsymbol\alpha) = \frac{\prod_{i=1}^K \Gamma(\alpha_i)}{\Gamma\bigl(\sum_{i=1}^K \alpha_i\bigr)}[/math] [math]\boldsymbol\alpha=(\alpha_1,\ldots,\alpha_K)[/math] |
期待値 |
[math]\operatorname{E}[X_i] = \frac{\alpha_i}{\sum_k \alpha_k}[/math] [math] \operatorname{E}[\ln X_i] = \psi(\alpha_i)-\psi(\textstyle\sum_k \alpha_k)[/math] (ここで、ψ(・)はディガンマ関数) |
最頻値 | [math]x_i = \frac{\alpha_i - 1}{\sum_{i=1}^K\alpha_i - K}, \quad \alpha_i \gt 1. [/math] |
分散 |
[math]\mathrm{Var}[X_i] = \frac{\alpha_i (\alpha_0-\alpha_i)}{\alpha_0^2 (\alpha_0+1)},[/math] where [math]\alpha_0 = \sum_{i=1}^k\alpha_i[/math] [math]\mathrm{Cov}[X_i,X_j] = \frac{- \alpha_i \alpha_j}{\alpha_0^2 (\alpha_0+1)}~~(i\neq j)[/math] |
エントロピー | (see en:Dirichlet distribution#Entropy) |
ディリクレ分布(ディリクレぶんぷ、英: Dirichlet distribution)は、連続型の確率分布である。ベータ分布を多変量に拡張して一般化した形をしており、そのため多変量ベータ分布とも呼ばれる。ディリクレ分布の確率密度関数は、同時に発生することのない [math]K[/math] 個の事象がそれぞれ [math]\alpha_i-1[/math] 回発生したときに、各事象の起こる確率が [math]x_i[/math] である確率を与える(ただし、[math]\alpha_i[/math]は整数である必要はない)。つまり、試行の回数が無限大なら各事象の発生の相対頻度は [math]x_i[/math] になるが、試行回数が有限だと、そこにずれが生じる。そのずれを表すモデルである。
定義と性質
[math]\boldsymbol\alpha=(\alpha_1,\ldots,\alpha_K)[/math] をパラメータ、実数ベクトル [math]\bold{x}=(x_1,\ldots,x_K)[/math] を確率変数 とするときの[math]K-1[/math]次ディリクレ分布の確率密度関数は以下の式で定義される。
- [math]P(\bold{x};\boldsymbol\alpha)=\frac{1}{B(\boldsymbol\alpha)}\prod_{i=1}^K x_i^{\alpha_i-1}[/math]
ここで [math]\bold{x}[/math]はK-1次元単体上の点であり、[math]x_i \ge 0[/math]、[math]\sum x_i=1[/math]を満たす。また、[math]\alpha_i \gt 0[/math] であり、[math]B(\boldsymbol\alpha)[/math] は多変量に拡張したベータ関数で、以下の式で定義される。
- [math]B(\boldsymbol\alpha)=\frac{\prod_{i=1}^K\Gamma(\alpha_i)}{\Gamma(\sum_{i=1}^K\alpha_i)}[/math]
このとき、[math]x_i[/math] の期待値は [math]\frac{\alpha_i}{\sum_{i=1}^K\alpha_i}[/math]、同じく分散は [math]\frac{\alpha_i\sum_{j\neq i}\alpha_j}{(\sum_{i=1}^K\alpha_i)^2(1+\sum_{i=1}^K\alpha_i)}[/math] である。
確率密度関数の台
ディリクレ分布の確率密度関数の台はK次元ベクトルxの集合であって、xの各要素が(0, 1)の開区間に含まれ、かつその要素の合計が1になるようなもの集合である。これは、[0,1]の区間を互いに交わらず大きさが0でないK個の集合に分割していると見ることができる。この他の見方として、ディリクレ分布の定義域それ自体が確率密度関数であるというものがある。すなわち、K個の分割それ自体が離散分布であるとする考え方である。このような台を専門的にはK-1次元単体((K-1)-simplex)と呼ぶ。
特殊な場合
最も単純な特殊例として対称ディリクレ分布が挙げられる。対称ディリクレ分布においては、パラメータベクトル[math]\boldsymbol\alpha[/math]の要素が全て同じ値である。ここで、パラメータベクトルの要素が全てαであるとすれば、対称ディリクレ分布は次の形で書き表される。
- [math]P(\bold{x}; \alpha) = \frac{\Gamma(\alpha K)}{\Gamma(\alpha)^K} \prod_{i=1}^K x_i^{\alpha-1}[/math]
仮にα=1であるとすると、ディリクレ分布は(K-1)次元単体上の一様分布になる。
参考文献
- 蓑谷千凰彦, 統計分布ハンドブック, 朝倉書店 (2003).
- B. S. Everitt (清水良一訳), 統計科学辞典, 朝倉書店 (2002).