7 母分散の推定(n-1で割る理由)

 母集団の情報を得るために,母集団から無作為標本をとるしか手が出せません。その時,標本から得た平均 ,分散 は,その情報は母集団分布の平均μ,分散 σ2 (母数と呼びます)を知る大きな手がかりとなります。

 しかし,この無作為標本をいくつかとるとき,その標本から得られる平均や分散が,真(母集団分布)の平均や分散と比較し,偏りをもって得られるようであるならば困ります。せっかく,何回も無作為抽出を行なっているにもかかわらず,真の平均や分散より偏って得られるのなら意味がありません。ここで,私たちは,偏っていない(不偏 unbiased) ということを

ヤシの実はヤシの木の周りにある



とします。これを満たす平均や分散を,不偏推定量(unbiased estimator)と呼びます。

 今,X1,X2, … ,X を平均 μ(<∞) と分散 σ2(<∞) をもつ分布から得られた標本とします。この時,

となりますので,X1 は μ の不偏推定量となります。また, としたとき,

となりますので, は μ の不偏推定量となります。

 さあ,次は,分散です。もう一度,確認しておきましょう。

 今,X1,X2, … ,X を平均 μ(<∞) と分散 σ2(<∞) をもつ分布から得られた標本とします。つまり,E[Xi]=μ,E[(Xi-μ)]=σ2 (i=1,2,…,n) とします。この時,標本から得られる母集団の分散を推定値を としたとき, が不偏推定量かどうか調べます。すなわち, の値を求めてみましょう。

となります。ここで,E[Xi2] および 2 を μ と σ を用いて表してみます。

したがって,上式は,

となります。したがって, は不偏推定量とは言えません。しかし,=(n-1)σ2 となりますから,そこで,新たに とおくと,E[s2]=σ2 となり,s2 は不偏推定量となります。



 とても,難しくなりました。百聞は一見に如かず,左のシミュレーションを見てください。1万個の有限母集団から,50個の成分を持つ標本を取り出す操作を,繰り返し行なったとき,どちらの分散の平均がが,母集団の分散に近いか比べてみてください。やはり,n-1 で割った方が,近くなるでしょう。

 これは,標本の分散を求めるとき,標本平均を用いています。したがって,標本数が n 個あるとき,平均が求まっているので,その平均値を求めると,Xn=n-(X1+X2+…Xn-1) で求めることができます。したがって,自由度は n ではなく,n-1 となっているからとして理解しても構いません。

 また,n が十分大きければ,E[]-σ2=-(1/n)σ2 となりますので,漸近的には不偏となります。