ウィルソンの連続性補正に伴う得点区間

提供: miniwiki
移動先:案内検索

ウィルソンの区間は正規近似区間の改良型である(実際の範囲確率は額面の値に近い)。エドウィン・ビドウェル・ウィルソン (1927)によって最初に開発された[1]

[math] \frac{1}{1 + \frac{1}{n} z^2} \left[ \hat p + \frac{1}{2n} z^2 \pm z \sqrt{ \frac{1}{n}\hat p \left(1 - \hat p\right) + \frac{1}{4n^2}z^2 } \right] [/math]

この区間は極端な確率と標本数の少ない試行に対しても良い特性を持っている。

これらの特性は二項分布モデルから派生したものから獲得された。二項集団の確率を[math]P[/math]、その分布が標準偏差[math]\scriptstyle \sqrt{\frac{1}{n}P \left(1 - P \right)}[/math]の正規分布で近似される場合を考える。しかしながら、観察される値の真の数値の分布は二項分布ではない。むしろ、観測される[math]\hat p[/math]は、下限の境界が[math]P[/math]と等しい区間の誤差を持ち、逆もしかりである[2]

ウィルソン区間は2つのカテゴリーからなるピアソンのカイ二乗検定からも求めることができる。

[math] \left\{ \theta \bigg| y \le \frac{\hat p - \theta}{\sqrt{\frac{1}{n} \theta \left({1 - \theta} \right)}} \le z \right\} [/math]

上の式を[math]\theta[/math]について解くことによってウィルソン区間を求めることができる。 不等式の中間における検定は得点検定(英語)と呼ばれるので、ウィルソン区間はしばしばウィルソンの得点区間と呼ばれる。

ウィルソン区間の中心は

[math] \frac {\hat p + \frac{1}{2n} z^2} { 1 + \frac{1}{n} z^2} [/math]

[math]\hat p = \scriptstyle \frac{X}{n}[/math][math]\scriptstyle \frac{1}{2}[/math]の加重平均として示される。[math]\hat p[/math]は標本数が増すに連れて大きく加重される。95%区間については、ウィルソン区間は[math]\hat p[/math]の代わりに[math]\tilde p \,=\, \scriptstyle \frac{X + 2}{n + 4}[/math]を用いた正規近似区間とほとんど同一である。

ウィルソンの連続性修正を伴う得点区間

ウィルソン区間は最小の範囲確率を名目値と整合させるために、連続性補正を用いて調整されることがある。

ウィルソン区間がピアソンのカイ二乗検定によく似ているように、連続性補正を伴うウィルソン区間はイェイツの連続性補正と同等のものである。

次の連続性補正を伴うウィルソンの得点区間の上限と下限を与える式はニューカム(1998)のものをもとに作られたものである[3]

[math] w^- = \operatorname{max}\left\{0, \frac { 2n\hat p + z^2 - [z \sqrt{z^2 - \frac{1}{n} + 4n\hat p(1 -\hat p)+(4\hat p - 2)}+1] } { 2(n+z^2) }\right\} [/math]
[math] w^+ = \operatorname{min}\left\{1, \frac { 2n\hat p + z^2 + [z \sqrt{z^2 - \frac{1}{n} + 4n\hat p(1 -\hat p)-(4\hat p - 2)}+1] } { 2(n+z^2) }\right\} [/math]

他の間隔との比較

これらの信頼区間と二項比率に対する他のものとを比較した報告は複数存在する[2][3][4][5]。アグレスティとコウル (1998)[6]およびロス(2003)[7]の両者はクロッパー-ピアソン区間のような正確な手法は他の近似と同様にうまく機能しないだろうと指摘している。

これらの多くの区間はR言語を使用したパッケージbinom で計算することができる。

脚注

  1. Wilson, E. B. (1927). “Probable inference, the law of succession, and statistical inference”. Journal of the American Statistical Association 22: 209–212. JSTOR 2276774. 
  2. 2.0 2.1 Wallis, Sean A. (2013). “Binomial confidence intervals and contingency tests: mathematical fundamentals and the evaluation of alternative methods”. Journal of Quantitative Linguistics 20 (3): 178–208. doi:10.1080/09296174.2013.799918. http://www.ucl.ac.uk/english-usage/staff/sean/resources/binomialpoisson.pdf. 
  3. 3.0 3.1 Newcombe, R. G. (1998). "Two-sided confidence intervals for the single proportion: comparison of seven methods". Statistics in Medicine 17 (8): 857–872.
  4. Reiczigel J. (2003) Confidence intervals for the binomial parameter: some new considerations. Statistics in Medicine, 22, 611–621.
  5. Sauro J., Lewis J.R. (2005) "Comparison of Wald, Adj-Wald, Exact and Wilson intervals Calculator". Proceedings of the Human Factors and Ergonomics Society, 49th Annual Meeting (HFES 2005), Orlando, FL, p2100-2104
  6. Agresti, Alan; Coull, Brent A. (1998). “Approximate is better than 'exact' for interval estimation of binomial proportions”. The American Statistician 52: 119–126. doi:10.2307/2685469. JSTOR 2685469. 
  7. Ross, T. D. (2003). “Accurate confidence intervals for binomial proportion and Poisson rate estimation”. Computers in Biology and Medicine 33: 509–531. doi:10.1016/S0010-4825(03)00019-2. 

関連項目