5.チェビシェフの不等式
今までの項目の中で,大切なキーワードをまとめますと,面積,分布,平均,分散(標準偏差)となります。
ここで,一体,それらの間にどのような関係があるか見てみましょう。
前章で述べましたように,分散(標準偏差)は各データが,平均からどれだけ離れているか,誤差の基準を与えるものだということを述べました。分布と面積の関係が必要です。
|
|
,標準偏差を σ とします。グラフで見ますと,右のようになります。
であることは,基礎編で学習しました。他,どのようなことが挙げられるでしょう。実は,
|
確率変数 X の平均 E[X]=μ,分散 V[X]=σ2 が共に有限ならば任意の k (>0) に対して, ![]() |
が成り立ちます。これは,どのような分布(離散でも連続)でも成立するところが特徴です。
証明する前に,意味を考えてみましょう。P(|Xーμ|≧kσ) とは,X の値が平均 μ との隔たりが,標準偏差 σ の k 倍以上になる確率,すなわち,上の図において水色のところの面積は,1/k2 以下になるということを意味します。ここで,離散的な分布について証明しておきますが,連続的な分布でも同様に証明することができます。
[証明]

|
|

となります。左辺は 1 なので,

となりますので,整理しますと,
となります。この式は,たとえば,平均より標準偏差の2倍以内に入る確率は,1-(1/2)2=0.75 となることを意味します。特に,ε=kσ と置きますと,

となります。
このように,分散は一つの目安となります。次に,先に出てきました正規分布について説明を行ない,その後,このチェビシェフの不等式に基づいた,大数の法則を紹介することにします。