9 相関係数の求め方の流れ

 さて,結構ややこしい議論となってきましたが,今まで行なった流れをここでまとめてみることにしましょう.

 そこで,最初の例題にもどって考えることにしましょう.

問題1 3点 A(2,2), B(4,5), C(8,6) がある.このとき,3点の y 座標と,ある直線の y 座標との差の自乗の和が最小となるような直線の方程式を求めよ.

 これを回帰分析の問題に変形すると,以下のような問題となります.

問題1 ある実験を3回行なったところ,右のような観測値を得た.このことから,回帰直線を求めよ.

 下のアプレットを用いて,順に解いていくことにします.

 Step.1 観測値数を入力します.

 上の場合,3回なので,観測値を 3 と入力し,エンターキーを押します.

 Step.2 次に,目的変数と説明変数を,順に入力します.

 2,2,4,5,8,6 を順に入力し,そのたびにエンターキーを入力してください.

 Step.3 回帰直線の係数と相関係数が計算されます.

 すると,この場合,a0 = 1.5, a1 = 0.61 より回帰直線 y = 1.5 + 0.61x と,相関係数 R = 0.891 が得られます.この場合,「強い相関がある」といえます.

 もうひとつ,練習問題で,上のアプレットを用いて相関係数を求めてみましょう.

練習問題1 下記の表において,2004年と2005年の打率および打点の変化と年棒のアップ額の相関係数を求めよ.

名前 2004年 2005年 打率変化 打点変化 年棒アップ額
打率 打点 打率 打点
金本 0.317 113 0.327 125 0.01 12 3000
今岡 0.306 83 0.279 147 -0.027 64 8000
赤星 0.300 30 0.316 38 0.016 8 5000

[解答] 上のアプレットにおいて,観測値数を3として考えます.また,打率や打点の変化と年棒の変化の相関をみるため,

打率の変化と打点の変化

を先に計算しておくこととします.それが,左の表です.

(1) 打率の変化と年棒アップ額の相関

 上のアプレットにおいて,観測値数を 3 ,説明変数として「打率変化」,目的変数として「年棒アップ額」とします.その結果,

を得ます.したがって,この相関係数は 0.859 となります.

(2) 打点の変化と年棒アップ額の相関

 上のアプレットにおいて,観測値数を 3 ,説明変数として「打点変化」,目的変数として「年棒アップ額」とします.その結果,

を得ます.したがって,この相関係数は 0.89 となります.

 説明のため,観測値を 3 つとしたので,厳密なことは言えません.しかし,(1)と(2)より,いずれとも「強い相関がある」と言えますが,相関係数を比較すると,阪神首脳陣は打率を上げることより,打点をあげることの方が,年棒アップに若干多く影響を与えていると言えます.すなわち,チャンスに強い人材に多くの額を与えようと言うことなのでしょう.(ただし,チャンスはピッチャーを除き平等に与えられていると仮定したときですが・・・.)