5 二項分布とポアソン分布


 長い間,よく付き合っていただいています。ゴールは,もう少しです。

 二項分布に関して,残された課題がもう一つあります。二項分布を正規分布で近似するとき,一般の教科書には十分大きいとありますが,グラフを見れば,試行回数がそんなに十分大きくなくても,ほんの 10 回程度でも,対象とする確率が 0.5 に近ければ近似がよいことが分かりました。では,対象とする確率が 0.5 に近くない場合どうすればよいか,この場合が残されています。

 そこで,登場するのが

を度数関数(確率関数)に持つポアソン分布なのです。

 右のグラフが,二項分布とポアソン分布です。与えられた確率が,小さければ試行回数 n が余り大きくなくても十分近似できることが分かります。証明はここを見てください。それを,数学的に記述しますと,


となります。これを理解するため,次の例題で考えてみましょう。

例題1 10 個の製品の中に 2% の不良品が入っている。10 人のうち不良品が一つも入っていない確率はほぼいくらか。
[解答] 不良品の数を値にとる変数を x とすると,

となります。このとき,0.02 は十分小さい。したがって,ポアソン分布で近似すると,λ=10×0.02=0.2 なので,

となります。このあと,ポアソン分布表がありますから,k=0,λ=0.2 として求めますと,p(x=0)=0.81873 となります。実際,もともとの式を計算しますと,p(x=0)=0.9810 =0.81707 となりますから,結構よい近似となっていることが分かります。

 超幾何分布と二項分布の関係において,

が成り立ちます(詳しくはここをクリック)。これは,実際の計算においてとても有効なものとなります。と言いますのも,全体の個数が多い場合,超幾何分布を二項分布で近似できるということは,非復元抽出(超幾何分布)を復元抽出(二項分布)で考えても構わないといえます。したがって製品の個数が多い場合,復元,非復元を意識しなくても構わないということになります。

練習問題1 5000 個の製品からなる仕切りの中に 3% の不良品が入っている。この仕切りから 10 個の製品を取り出すとき,高々 2 個の不良品が含まれている確率はほぼいくらか。




 このように,二項分布はあるときは正規分布で,またあるときはポアッソン分布で近似されます。その使い分けは,与えられた確率の大きさに依存することが分かります。