4 母比率の推定

ここで,今までの流れをもう一度まとめておきましょう。

  知りたい値

  分かっている値

         精  度

         信頼区間

母集団の平均 μ
(精度90%の時)

母集団の標準偏差 σ
標本の大きさ     n
標本平均       



母集団の平均 μ
(精度95%の時)



母集団の平均 μ
(精度99%の時)




下の画面のどこかをクリックしてから開始して下さい!



ここで, は,標本平均の値を表します。これは,標本平均を値にとる確率変数 は中心極限定理により正規分布 N(μ,) に従うということに基づいています。これをみますと,皮肉なことに,精度を上げようとしますと,それに従い信頼区間も大きくなっていくことが分かります。
 
 上の表の信頼区間を言葉で表しますと,



となります。ところが,この方法では,母標準偏差 σ が分かっているものとしましたが,実際の場合,分かっていないときがほとんどです。このような時,標本の大きさ n が大きければ(25以上),母標準偏差 σ を標本標準偏差 s で置き換えても大きな間違いが生じないことが知られています。これを大標本法と呼び,それに対し標本数が小さいとき(25未満)を小標本法と呼びます(詳しくは,§6の7 t分布を参照 ここをクリック)。したがって,

 母平均 μ に対する信頼度90%の信頼区間は 

 母平均 μ に対する信頼度95%の信頼区間は 

 母平均 μ に対する信頼度99%の信頼区間は 

となります。



 では,これらのことがらを利用して,今度は母集団の比率(母比率) p の推定を考えよう。

 母集団においてある性質をもてば 1,もたなければ 0 の値をとるような確率変数 X を考えると,母集団における確率分布は,右の表のようになります。


 したがって,その標本比率 と標準偏差 s は(平均と標準偏差の求め方は,§2 3 よく利用する平均 を参照 ここをクリック),

となります。これらを,上に示した3つの信頼度に対する信頼区間の式へ代入しますと,

 母比率 に対する信頼度90%の信頼区間は 

 母比率 に対する信頼度95%の信頼区間は 

 母比率 に対する信頼度99%の信頼区間は 

となります。これを用いて,小泉政権の支持率について考えることにしましょう。

例題1 2002年3月17日現在における小泉内閣支持率について,ニュースステーション(テレビ番組)の調べによると 1000 人を抽出し,支持する割合が 51.8% あった(無回答は,消極的支持しないとみなす)。全世帯における支持するという母比率 を,信頼度 95% で推定せよ。



[解答] 支持するとき 1,そうでないとき 0 の値をとる確率変数を X とする。すると,X の確率分布は右のようになる。したがって,

s2 は,p×q = 0.25 としても求めることができる。よって,信頼区間は,

より,0.4870.549 となる。

 上の例題において,区間の端点を与える 0.487 および 0.549 を信頼限界といいます。また,実際のニュースステーションのデータは回答率が 100% ではなく,無回答の中には支持者もいるかもしれませんが,それらはすべて不支持とみなしていますので,結果は小泉政権にとって厳しいものとなっています。しかし,懲りずに小泉政権支持率の推定を過去にさかのぼってグラフにしますと,次のようになります。

 やはり,今年2月の田中さんの事件の以降,小泉内閣に対する支持率に影響があったことは間違いないように思われます。現在,支持率は 50% 付近をうろうろとしており,国民はどのように受け留めればよいのか,固唾を飲んで見守っているように見えます。

 このように,推定は現実的なおもしろい問題に対しても適応することが可能です。次の章では,昨年度,イチロウの夢の打率 4 割は可能だったのか,阪神タイガースの優勝はいつに無くなっていたのかについて考えてみましょう。