尖度

提供: miniwiki
移動先:案内検索

尖度(せんど、: kurtosis)は、確率変数確率密度関数や頻度分布の鋭さを表す数字である。正規分布と比べて、尖度が大きければ鋭いピークと長く太い裾を持った分布を持ち、尖度が小さければより丸みがかったピークと短く細い尾を持った分布であるという事が判断できる。日本工業規格では、とがり(kurtosis)として平均値まわりの 4 次のモーメントµ4と標準偏差σの 4 乗の比 μ44 と定義している[1][2]

2種類の定義

正規分布の尖度を0とする定義と3とする定義があることに注意。2つの定義の違いは、正規分布との乖離をみるために使われることに起因している。一般には0とすることが多い。Excelの分析ツール等は正規分布の尖度を0としている[3]。英語版のWikipediaでも、正規分布の尖度は0としている。東京大学出版会の「統計学入門」(ISBN 4130420658)やNumerical Recipesなども正規分布の尖度は0である。

モーメントによる定義

確率変数[math]X[/math]の分布関数を[math]F(X)[/math]

[math]\mu=E[X]=\int X dF(x)[/math]
[math]\mu_r=E[(X-\mu)^r]=\int (X-\mu)^r dF(x)[/math]([math]r[/math]は正整数)

とする。このとき、分布関数[math]F(X)[/math]の尖度[math]\beta_2[/math]は以下である。(各積分値が存在すると仮定する)

正規分布の尖度を0とする定義では、

[math]\beta_2=\frac{\mu_4}{{\mu_2}^2} - 3[/math]

正規分布の尖度を3とする定義では、

[math]\beta_2=\frac{\mu_4}{{\mu_2}^2}[/math]

キュムラントによる定義

確率変数[math]X[/math][math]r[/math]次のキュムラント[4][math]\kappa_r[/math]とすると尖度[math]\beta_2[/math]は以下で定義される。

正規分布の尖度を0とする定義では、

[math]\beta_2=\frac{\kappa_4}{{\kappa_2}^2}[/math]

正規分布の尖度を3とする定義では、

[math]\beta_2=\frac{\kappa_4}{{\kappa_2}^2}+3[/math]

計算例

正規分布の尖度。モーメント母関数は

[math]log(M_X(t))=\mu t+ \sigma^2t^2/2[/math]

より[math]\kappa_1=\mu, \kappa_2=\sigma[/math],3次以上のキュムラント[math]\kappa_r=0(r\ge 3)[/math]はすべて0であることがわかる。従って正規分布の尖度[math]\beta_2=0[/math](または3)となる。

尖度の意味

以下に正規分布とそれより尖度が大きくおなじ平均と標準偏差をもつ確率密度関数を示す。

模式的であるが、平均の周りでは尖りが大きく裾を引いた分布であることがわかる。 厳密には、尖度と表現するのは間違いであり、本来は裾の重さというべきであることは明らかであろう。詳細は参考文献を見られたい。

特殊な分布

[math]p(x) = \frac{1}{\alpha\,\mathrm{\Beta}\!\left(m-\frac12, \frac12\right)} \left[1 + \left(\frac{x-\lambda}{\alpha}\right)^{\!2\,} \right]^{-m} \![/math]

では両者(裾の重さと平均の周りでは尖り)の概念は一致するが、一般の分布では一致しないのは明らかである。

標本モーメントによる母集団の尖度推定

ここでは、標本の大きさ[math]n[/math]の標本に基づく母集団の尖度の推定を考える。

厳密な意味での標本における尖度についての不偏推定量の研究はこのウィキペディアの範疇を超えるので省略する。

一般には尖度の定義の分母分子の不偏推定量をもって母集団の尖度の推定量とする方法がもっとも多く使用される。具体的には、母集団のキュムラントの不偏推定量であるk-statistics(k統計量)[5]を使った計算方法である。r次のk統計量を[math]k_r[/math]、平均周りのr次のモーメントを[math]m_r=\frac{1}{n}\sum_{i=1}^{n}(x_i-\overline{x})^r[/math]とすれば、

[math] k_2=\frac{n}{n-1}m_2[/math]
[math]k_4=\frac{n^2}{(n-1)(n-2)(n-3)}\left\{(n+1)m_4-3(n-1){m_2}^2 \right\}[/math]

なので、上記2式をキュムラントによる定義に代入して推定量とする方法である。

最終的には[math]\beta_2[/math]の推定量[math]b_2[/math]について次を得る。

[math]b_2=\frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i} \left(\frac{x_i-\overline{x}}{s}\right)^4 -\frac{3(3n-5)}{(n-2)(n-3)}[/math]
ここに[math]s=\sqrt{\frac{n}{n-1}m_2}[/math](標本標準偏差)

または3を引いた形式では以下となる。

[math]\frac{n(n+1)}{(n-1)(n-2)(n-3)} \sum_{i} \left(\frac{x_i-\overline{x}}{s}\right)^4 -3\frac{(n-1)^2}{(n-2)(n-3)}[/math]

分布と尖度

分布 尖度
ラプラス分布 3
双曲線正割分布 2
ロジスティック分布 1.2
正規分布 0
二乗余弦分布 −0.593762…
ウィグナー半円分布 -1
一様分布 -1.2

上記の分布は歪度は全て0である。

脚注

  1. JIS Z 8101-1 : 1999, 1.20 とがり kurtosis.
  2. JIS Z 8101-1 : 2015, 1.21 とがり.
  3. 関連項目に挙げたが、歪度([math]\beta_1=E{(X-\mu)^3}/[E{(X-\mu)^2}]^{(3/2)}[/math])、分散([math]\sigma=E{(X-\mu)^2}[/math])は不等式による制限関係があるので、注意する必要がある。当然の事ながら標本における歪度、尖度は互いに独立ではない。 参考までにコーシーシュワルツの不等式を考えれば尖度[math]\beta_2[/math]は明らかに1より大きく、3を引いた意味での尖度は-2以上の値をとることは明らかであろう。
  4. 簡単に言えば、モーメント母関数[math]M_X(t)[/math]の対数をとった関数を[math]t=0[/math]の周りで形式的に展開し、tについて整理し、[math]r[/math]次の係数が[math]\kappa_r[/math]である。
  5. 具体的には[math]E\{k_r\}=\kappa_r[/math]となる性質がある。

参考文献

関連項目