1 辛いラーメン屋さんは?
最近,「激辛ラーメン」というように,辛いラーメンを売り物にしているラーメン屋さんがあります。
ここに,左のように3件のラーメン屋さんがあって,その辛さを調べるとその下の表のような結果を得ました。上のスケールは,辛さの段階を示し,10を最も辛く,1はあまり辛いと感じないとします。
一体,あなたはこのデータから,どのラーメン屋さんが辛いラーメン屋さんと判断するでしょうか? 各店で一番辛いラーメンを基準にする,一番辛くないラーメンを基準にする,平均を基準にする。いろいろな考え方があります。
|
最小値
|
最大値
|
平 均
|
|
A 店
|
4
|
10★
|
7
|
|
B 店
|
7★
|
9
|
8★
|
|
C 店
|
2
|
6
|
4
|
この表より,一番辛いラーメンがあるのはA店,しかし,平均的に辛いといえる店はB店であることが分かります。また,A店のラーメンの辛さは幅広く,B店のラーメンは,辛さの幅は狭いことが分かります。このように,判断する数値の特徴により,判断基準が異なってきます。
統計においても,これとよく似たことを行います。それぞれのグループの特徴を,代表的な数値で表そうとします(グループを一つの特徴ある数値で表現しようとします)。統計では,その数値を 代表値 と言います。それは,
平均値(average),中央値(median),最頻値(mode),最大値(maximum),最小値(minimum)
から成り立ちます。これらの言葉の説明を,具体的な例を用いて,説明していきましょう。
最初に,下のソフトの利用方法を説明します。そして,いろいろと試してみて下さい。
このデータは,中間考査の得点を利用しました。
下段のグラフの横軸は得点を表し,縦軸は人数を表しています。
上段の右の表は,100点を10点ごとに区切った区間(階級)と,各階級に入る資料の人数(度数)の関係を表しています。階級の中央の値を階級値と呼びます。この関係を表した表を,度数分布表と呼びます。この度数の中で,最大である階級の階級値を最頻値(モード)と呼び,この表の右端の列に表示されます。
上段の中央のグラフは,度数分布表を柱状のグラフに表したものです。それを,度数分布またはヒストグラムと呼びます。
上段の左端の表は,上から順に平均,中央値(メディアン),最大値,最小値,そして,総人数を表しています。平均の詳しい説明は次の章で行うとして,ここでは,和をとって全体数で割ることを意味します。中央値とは,資料を大きさの順に並べたとき,その中央の順位にくる値を意味します。ただし,総度数が偶数のときは,中央に2つの値が並ぶから,その平均を中央値とします。例えば,
のようなとき,中央値は300となります。資料が度数分布表で表されているときは,中央の順位となる階級の階級値が中央値の近似値となります。最大値とは最高得点,最小値とは最小得点を表します。
では,一度,下段のグラフにおいて,それぞれの得点を変化させてみることにしましょう。点線に沿って,マウスをドラッグすると,入力数を変化させることができます。
その時の平均値,中央値,最頻値の位置の動きを見て下さい。それらは,バラバラに変化することが分かります。そこで,例を出しましょう。
就職活動で,ある企業を訪問したA君。その企業の平均給料額が49万円であることを知り,その企業に入社しました。ところが,実際給料をもらってみますと,9万円だったので抗議を社長にしました。「平均給料額は,49万円で高額であるはずです。」すると,社長は次のように説明したそうです。「右の図を見て下さい。確かに,平均給料額は49万円です。」と。先の例では,定期考査の分布でしたが,今回ある企業の給料分布で,横軸の単位を万円としてみて下さい。
この企業では,会長をはじめ理事者がとてつもなく多い給料で,他の社員の給料は少額となっていたのです。この誤りは,平均を代表値として用いたのが原因であるといえるでしょう。このような場合の代表値は,最頻値かまたは中央値を用いるべきです。
一般に,靴や洋服などのサイズ別の売れ行きの度数分布のような場合は最頻値(モード)を,給料や年収などのような場合は中央値(メディアン)を用います。
次の章では,平均について考えてみましょう。平均と言っても,いろいろな平均があります。そのことについて,紹介します。