母集団
統計学における母集団(ぼしゅうだん、英: population)とは、調査対象となる数値、属性等の源泉となる集合全体を言う。統計学の目的の一つは、観測データの標本から母集団の性質を明らかにすることである[1]。
Contents
概要
統計的規則性を明らかにしたい対象について、観察可能なすべての潜在的な観測値の集合を母集団と呼ぶ。なお、母集団の要素の数を母集団の大きさ[2]と呼び、標本調査法では大文字の [math]N[/math] で表すのが慣例である。日本工業規格では、「考察の対象となる特性をもつすべてのものの集団」と定義している[3]。
大量の要素からなる標本(大標本)の存在を前提とする記述統計学[4]においては、標本と母集団の区別は不明確である(ほぼ同一視される)[5]。
ただし、以下のようなほとんど多くの場合について、その母集団を完全に知ることはできない[6]。
- 日本人全体が調査対象であるといったように母集団が非常に多くの要素または無限大の要素からなる場合、
- 母集団自体はあまり多くの要素は含まないものの、製品の破壊強度の検査といったように、全体の調査が意味を持たなかったり、個々の調査が高価であるため予算上の制約から全体の調査が不可能である場合、
- 来年の経済成長率のように将来に起こるため、現在は測定が不可能な要素を含む場合など。
こういった場合、調査対象の少ない要素の標本(小標本)を選び出した上で分析し、そこから母集団を推測するという手法が取られる。このような小標本を元に母集団の性質を推測する統計学を、記述統計学に対して推測統計学と呼ぶ。
母集団の特性を表す数値的尺度
統計学の目的の一つは、実験あるいは観測によって得られたデータに含まれている情報を縮約することである[7]。数値的尺度として縮約される情報としては、
の二つに大きく分けることができる。
ほとんど多くの場合、観測現象の母集団は観念的な存在であるので、現実の観測データの集合である標本とは異なり、数値的尺度を実際に計算することはできない。しかし、母集団の存在を仮定すれば、その定量化することができる。なお、これら数値的尺度は母集団に対してその分布が存在すれば、その分布の母数(パラメータ)ともなる。
なお、観測現象のある標本の標本平均(または分散)をなにか真の値の近似値としてみるとき、その真の値とは母平均(分散)のことを指す。
脚注
参考文献
- 蓑谷 千凰彦 『統計学入門』1、東京図書、1994年。
- 蓑谷 千凰彦 『統計学のはなし』 東京図書、1987年。
- 蓑谷 千凰彦 『推定と検定のはなし』 東京図書、1988年。
- 『統計学入門』 東京大学教養学部統計学教室(編)、東京大学出版会、1991年。
- 西岡康夫 『数学チュートリアル やさしく語る 確率統計』 オーム社、2013年。ISBN 9784274214073。
- 日本数学会 『数学辞典』 岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999)
- JIS Z 8101-1:2015 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (2015)
- 伏見康治 『確率論及統計論』 河出書房、1942年。ISBN 9784874720127。