平均

提供: miniwiki
2018/8/17/ (金) 22:28時点におけるAdmin (トーク | 投稿記録)による版 (1版 をインポートしました)
(差分) ← 古い版 | 最新版 (差分) | 新しい版 → (差分)
移動先:案内検索

平均(へいきん、: mean, : Mittelwert, : moyenne)または平均値(へいきんち、mean value)は、観測値の総和を観測値の個数で割ったものである[1]

例えば A、B、C という3人の体重がそれぞれ 55 kg、60 kg、80 kg であったとすると、3人の体重の平均値は (55 kg + 60 kg + 80 kg)/3 = 65 kg である。

特に断らずに平均という場合の多くはこのような加算して個数で割ったものである。

平均を用いる際の注意

社会調査では、平均を代表値として使うことがある。社会調査では平均が中央値最頻値中点値と比べて調査の目的に適切かどうかを検討する必要がある。例を挙げる。

世帯の貯蓄の事例では、一部の大金持ちの巨大な貯蓄が平均値を引き上げてしまう。最も多い数の貯蓄額(最頻値)が仮に300万円だとしても平均は700万円くらいになる。従って、一般的な世帯の貯蓄について考察するのが目的ならば中央値や最頻値を用いる。また、とびぬけた値がごく少数の場合には、最大と最小を除外した刈込平均(トリム平均English版)を用いることもある。

分布が左右対称でない時、中央値、最頻値をもちいるとよい。平均が中央値、最頻値、中点値と乖離している場合は刈込平均を含めた平均以外の使用を考えるとよい[2]

統計学

統計学では、観測データから算術的に計算して得る統計指標値という。 算術平均を統計学では相加平均と呼んでいる。

母平均と標本平均

統計学では平均には「母平均」と「標本平均」がある。母平均は母集団の全ての要素に関する相加平均である。標本平均は、選んだ標本(母集団の部分集合)の要素に関する相加平均である。母平均をμと書き、標本平均を m と書いて区別する場合がある[3][4]

相加平均

算術平均(さんじゅつへいきん、: arithmetic mean, : arithmetisches Mittel, : moyenne arithmétique)とも呼ぶ。単に平均といった場合は相加平均を意味する。

相加平均を

[math]\mu = \frac 1 n \sum_{i = 1}^n x_i = \frac{x_1+x_2 + \cdots+x_n}{n}[/math]

と定義する。あるいは

[math]n \mu = \sum_{i = 1}^n x_i = x_1+x_2 + \cdots+x_n [/math]

と表す。

[math]x_1, x_2, \cdots , x_n [/math] の相加平均を [math]\bar x [/math] とも表す。

相加平均は、加法とスカラー倍が可能であるような量(実数, 複素数, ベクトル等)について定義する。

一般化平均

相乗平均

相乗平均(そうじょうへいきん)または幾何平均(きかへいきん、: geometric mean, : geometrisches Mittel, : moyenne géométrique)を

[math] \mu_\mathrm G = \sqrt[n]{ \prod_{i=1}^n x_i } = \sqrt[n]{x_1x_2\cdots x_n}[/math]

と定義する。相乗平均は相加平均、幾何平均は算術平均と対になった用語である。

あるいは

[math] \mu_\mathrm G {}^n = \prod_{i=1}^n x_i = x_1x_2\cdots x_n [/math]

とも表せる。

対数を取ると

[math] \mu_\mathrm G = \exp \left( \frac 1 n \sum_{i=1}^n \log x_i \right) [/math]

[math] n \log \mu_\mathrm G = \sum_{i=1}^n \log x_i [/math]

となり、相乗平均は、対数の算術平均の指数関数である。あるいは、相乗平均の対数は対数の算術平均である。

データに1つ以上の0があるときは、相乗平均は0となる。データが実数であっても、積が負になる場合は、相乗平均は複素数になる可能性がある。

相乗平均は、積と累乗根が可能であるような量(実数, 複素数)について定義できる。

調和平均

調和平均(ちょうわへいきん、: harmonic mean)を、

[math] \mu_\mathrm H = \frac n { \sum_{i=1}^n \frac 1 x_i } = \frac{n}{\frac{1}{x_1}+\frac{1}{x_2} + \cdots+ \frac{1}{x_n}}[/math]

と定義する。あるいは

[math] \frac n { \mu_\mathrm H }= \sum_{i=1}^n \frac 1 { x_i } = \frac{1}{x_1}+\frac{1}{x_2} + \cdots+ \frac{1}{x_n} [/math]

とも表せる。

調和平均は、逆数の算術平均の逆数である。あるいは、逆数の算術平均は調和平均の逆数である。

しかし、

データに1つ以上の0があるとき、調和平均の定義式はそのままでは使えないが、0への極限を取ると、調和平均は0となる( [math]x_i \rarr 0[/math] のとき [math] \mu_\mathrm H \rarr 0 [/math] )。データに負数があっても調和平均は計算することができる。ただし、正負が混在している場合に逆数の和が0になることがあり、その場合の極限は発散する。

一般化平均

算術平均、相乗平均、調和平均は同じ式

[math] \mu_m = \sqrt[m] { \frac 1 n \sum_{i=1}^n x_i{}^m }[/math]

あるいは

[math] n \mu_m {}^m = \sum_{i=1}^n x_i{}^m [/math]

で表せる。この式を一般の実数 m に対し定義した値を一般化平均と呼ぶ。

m = 1 で算術平均、m = −1 で調和平均となり、m → 0 への極限が相乗平均である。これらのほか、m = 2 の場合を二乗平均平方根 (RMS) と呼び、物理学や工学で様々な応用をもつ。m → ∞ への極限は最大値m → −∞ への極限は最小値である。

一般化平均は、ベクトル [math](x_1,\ldots,x_n)[/math]m-ノルム[math]\sqrt[m]{n}[/math] で割った結果に一致する。

データの m 乗の平均、つまり、一般化平均の m

[math] \mu_m {}^m = \frac 1 n \sum_{i=1}^n x_i{}^m [/math]

m 乗平均と呼ぶ。

m 乗平均・一般化平均の応用として、例えば統計学では分散標準偏差がある。それぞれ m = 2 の場合の m 乗平均・一般化平均により定義されている。(ただし、相加平均を引いた後 m 乗平均・一般化平均を取る)。

一般化平均はさらに一般化が可能で、全単射な関数 f により

[math]\mu_f = f^{-1}\left({\frac{1}{n}\sum_{i=1}^n{f(x_i)}}\right) [/math]

という平均が定義できる。恒等関数 f(x)= x により相加平均が、逆数 f(x)= 1/x により調和平均が、対数関数 f(x)= log x により相乗平均がそれぞれ表されている。

定義域

一般の実数 m による一般化平均は、全てが非負の実数であるデータに対してのみ定義される。これは、一般化平均の式に現れる m 乗根(冪関数)が負数に対し定義できないためである。例外は、冪関数を使わずに計算できる算術平均と調和平均 (m = ±1) である。m ≠ ±1 の場合、1つ以上の負数が含まれるデータに対し、一般化平均の定義式は実数を返さないか、実数を返したとしても結果は解釈が難しい。

m < 0 の場合、1つ以上の0が含まれるデータに対し一般化平均の定義式は使えないが、調和平均同様、0への極限を取ると一般化平均は0となる。幾何平均(m = 0 の一般化平均)も0となるので、m ≦ 0 の場合に一般化平均は0となる。

具体例

  • 相乗平均
    • 78年の経済成長率20%、79年の経済成長率80%の場合、この2年間の平均成長率は[math]\sqrt{1.2 \times 1.8}= 1.469693846...[/math]より、約47%
  • 調和平均
    • 往は時速60km 復は時速90kmの場合の往復の平均速度は [math]\frac 2 { 1 / 60_\mathrm{km} + 1 / 90_\mathrm{km} }=72_\mathrm{km} [/math] である。
    • 並列接続された電気抵抗の抵抗値などを考える場合に用いる(直列回路と並列回路)。

関係式

相加平均≧相乗平均≧調和平均

n 個のデータが全て正の時、次のような大小関係が成り立つ。

相加平均 ≥ 相乗平均 ≥ 調和平均
[math]\frac{x_1+x_2+\cdots+x_n}{n} \ge \sqrt[n]{x_1x_2\cdots{}x_n} \ge \frac{n}{\frac{1}{x_1}+\frac{1}{x_2}+\cdots\frac{1}{x_n}}[/math]

等号成立のための必要十分条件は、

[math]x_1 = x_2 = \cdots = x_n [/math]

である。

左側の不等式は、「対数を使った関係式」にlogの凸性ジェンセンの不等式)を適用すれば証明できる(数学的帰納法を使った別証明も知られている)。 右側の不等式は、調和平均が逆数の相加平均の逆数という事実を左側の不等式に適用すれば証明できる。

相加平均と調和平均の相乗平均

データ数nが2のときの相加平均、相乗平均、調和平均をそれぞれAGHとすると、

[math]A = \frac {{x_1} + {x_2}} {2}, \quad G = \sqrt {{x_1}{x_2}}, \quad H = \frac {{2} {x_1} {x_2}} {{x_1} + {x_2}}.[/math]

なので、

[math]G = \sqrt {{A} {H}}[/math]

が成立する。すなわち、もとのデータの相乗平均は相加平均と調和平均の相乗平均に等しくなる。

様々な平均

加重平均

観測される値それぞれに重みがある時には、単に相加平均をとるのでなく重みを考慮した平均をとるのが便利である。各データ xi に、重み wi がついているときの加重平均(重み付き平均)は

[math]\cfrac{w_1x_1+\cdots+w_nx_n}{w_1+\cdots+w_n}[/math]

と定義される。全ての重みが等しければ、これは通常の相加平均である。

例えば重み付き最小二乗法では、誤差の小さなデータに大きな重みを与えた残差の加重平均を最小化[注 1]することで、尤度の最大化を図る。重点サンプリングEnglish版によって期待値をモンテカルロ推定するときは、求めたい期待値に関する確率密度とサンプルの確率密度の比を重みとした加重平均を推定量とする。

相乗平均についての重み付き平均は

[math]\left({x_1}^{w_1} \cdots {x_n}^{w_n}\right)^{1/p}[/math]

と定義される。ただし、[math]p=\sum_{i=1}^n w_i[/math] とする。

連続分布の相加平均

観測されるデータ x(t) が区間 [a, b] 上に連続的に分布しているとき、その相加平均は積分

[math]\frac{1}{b-a} \int_a^b x(t)\,dt[/math]

と定義される。これは離散分布の相加平均に対して、無限個の平均を算出する操作を極限により表したものである。

ベクトルの平均

ベクトル[math]\mathbf{x}_1,\ldots,\mathbf{x}_n[/math]に対し、 [math]\mathbf{x}_1,\ldots,\mathbf{x}_n[/math]の(相加)平均を、

[math]\frac{\mathbf{x}_1+\cdots+\mathbf{x}_n}{n}[/math]

により定義する。

相加平均と違い、相乗平均や調和平均はベクトルの場合に一般化できない。

ベクトルの数が3の場合、[math]\mathbf{x}_1,\mathbf{x}_2,\mathbf{x}_3[/math]の平均は、 [math]\mathbf{x}_1,\mathbf{x}_2,\mathbf{x}_3[/math]の作る三角形の重心に一致する。 ベクトルの数が4の場合も同様で、[math]\mathbf{x}_1,\cdots,\mathbf{x}_4[/math]の平均は、 [math]\mathbf{x}_1,\cdots,\mathbf{x}_4[/math]の作る四面体の重心に一致する。

この事実は一般にベクトルの数が n の場合も拡張でき、[math]\mathbf{x}_1,\cdots,\mathbf{x}_n[/math]の平均は、 [math]\mathbf{x}_1,\cdots,\mathbf{x}_n[/math]の作るn-単体の重心に一致する。

また、後述するように、ベクトルの平均は物理学における質点の重心と関係がある。

加重平均も同様にベクトルに拡張でき、

[math]\frac{w_1\mathbf{x}_1+\cdots+w_n\mathbf{x}_n}{w_1+\cdots+w_n}[/math]

と定義される。

m 乗平均・一般化平均はスカラー

[math]\frac{\|\mathbf{x}_1\|^m+\cdots+\|\mathbf{x}_n\|^m}{n}, \quad \sqrt[m]{\frac{\|\mathbf{x}_1\|^m+\cdots+\|\mathbf{x}_n\|^m}{n}} [/math]

として定義される。ただしここで[math]\|\cdot\|[/math]は、ベクトルのノルムである。

m = 2 の場合、[math]\|\mathbf{x}\|^2[/math] は内積 [math]\langle\mathbf{x},\mathbf{x}\rangle[/math] に一致するので、m = 2 の場合の m 乗平均や一般化平均が特に重要である。たとえば物理学では速さの平均値として、m = 2 の場合の一般化平均を使うことがある。

ベクトルの加重平均の概念には、物理的な解釈を与えることができる。質点 [math]P_1,\ldots,P_n[/math] がそれぞれ位置 [math]\mathbf{x}_1,\ldots,\mathbf{x}_n[/math] にあり、それぞれの質量が [math]m_1,\ldots,m_n[/math] であるとき、[math]P_1,\ldots,P_n[/math] の重心は、加重平均

[math]\cfrac{m_1\mathbf{x}_1+\cdots+m_n\mathbf{x}_n}{m_1+\cdots+m_n}[/math]

に一致する。

よって特にベクトルの(相加)平均は、質量1の質点達の重心に一致する。

算術幾何平均

[math]a_0, b_0\,[/math] を、[math]a_0 \gt b_0\,[/math] を満たす2つの非負実数とする。 [math]a_1,a_2,\ldots, \ b_1,b_2,\ldots[/math]

[math]a_{i+1}=\frac{a_i+b_i}{2}[/math]
[math]b_{i+1}=\sqrt{a_ib_i}[/math]

により定義する。

このとき、

[math]\lim_{i\to\infty}a_i=\lim_{i\to\infty}b_i[/math]

[math]a_0\,[/math][math]b_0\,[/math]算術幾何平均という。

移動平均

注釈

  1. 最小二乗法において、加重和の最小化と加重平均の最小化は同じことである。

出典

  1. JIS Z 8101-1 : 1999, 2.13 平均.
  2. 西岡, 刈込平均 p.7.
  3. 西岡, p.5.
  4. 伏見, 第II章 確率論 10節 偶然量、平均値 p.70.

参考文献

関連項目