相関係数
※このページは,統計検定3級程度(高卒レベル)の教材です
1. 用語と記号
著書,著者によって,記号が微妙に違うが,このページでは次の約束による. 〇1 大文字のSを「積の和」または「2乗和」に使う
【例】
〇2 小文字のsを「Sをnで割った平均」に使う・・・共変動(偏差積和) ・・・変動(偏差平方和)
【例】
・・・共分散 ・・・分散 |
〇3 ギリシャ文字のσを「平均のルート」に使う
【例】
なお,元のデータ に対して,次の変形・処理を行う.・・・標準偏差 ※なお,書物によっては,推測統計の公式として,標準偏差や分散の分母をn−1とする公式(不偏偏差,不偏分散)を扱うが,この教材では記述統計の公式として,標準偏差や分散の分母がnになっている方を使う. 偏差
各変数から平均値を引いた値
標準化(基準化,規格化)
各々の変数から平均値を引いて,標準偏差で割った値に直すこと.これにより,標準化された変数の平均値は0,標準偏差は1になる.
|
2. n個の2次元の点と見たときの相関係数の意味 2.1 共変動(偏差積和) 身長と体重のような2つの変数について,一方が増えると他方も増える傾向があるとき,これらの変数は正の相関関係があるという.逆に,一方が増えると他方が減る傾向があるとき,負の相関関係があるという. -図1- 右図1の場合,散布図で見ると「正の相関関係がある」ということを,数値として表す方法を考えてみると, は(正の数)×(正の数),(負の数)×(負の数)になり,右図1の水色の長方形の面積はいずれも正の値になる. |
-図2- このようにして, という形で定義される式(これを共変動という)を作ると,その符号の正負が正の相関関係,負の相関関係を表すようになる. -図3-
上記のように,2つの偏差の積和を計算したものは,共変動と呼ばれるが,1つの変数の偏差の2乗の和を計算したものは変動(偏差平方和)と呼ばれる
|
2.2 共分散 共変動をnで割った平均を共分散という すなわち ・・・共分散
上記のように,2変数の積和の平均は,共分散と呼ばれるが,1つの変数の偏差の平方和の平均は分散と呼ばれる
すなわち すなわち |
2.3 相関係数(ピアソンの積率相関係数) 共分散は2つの変数の測定単位によって影響を受ける.(例えば,長さの単位をメートルからセンチメートルに変えると,各変数は100倍になり,共分散は10000倍の値になる).このような測定単位による影響を受けないものとして,共分散を2つの標準偏差で割ったものを考え,相関係数と呼ぶ.これは,元のデータ , を,標準化(基準化,規格化)してから共分散を求めたものになっている. ・・・相関係数 |
【問題2.1】
解答を見る
@ 共変動
なお,小数になるときは,小数第3位を四捨五入して小数第2位まで求めてください.
A 共分散 B 相関係数
(解答)
を使って,次の表2を埋める
A共分散 B相関係数 次の表3を埋めて,標準偏差を求める
相関係数は |
【問題2.2】
解答を見る相関係数と共分散の符号はつねに一致するかどうか,根拠も示して答えてください.
【問題2.3】
解答を見る共分散が大きくなると,相関係数も大きくなるといえるかどうか,根拠も示して答えてください.
(解答)
共分散は次の式で定義される 相関係数は次の式で定義される 共分散を標準偏差 で割ったものが相関係数だから,共分散が大きくなるときに標準偏差も大きくなれば,相関係数が大きくなるとは言えない |
3. 線形変換による影響
xk'=axk+b
yk'=cyk+dという線形変換を行ったとき
[平均]
・・・@・・・A
(解説)
のとき (例) のとき [yについても同様に示される]
[変動]・・・B
・・・C
(解説)
のとき (例) のとき [yについても同様に示される] |
[分散]
・・・D・・・E
(解説)
のとき (例) のとき [yについても同様に示される]
[標準偏差]・・・F
・・・G
(解説)
分散の解説より だから (例) のとき [yについても同様に示される] |
[共変動]・・・H
(解説)
のとき (例) のとき
[共分散]・・・I
(解説)
のとき (例) のとき |
[相関係数]・・・J
(解説)
のとき (例) のとき
【問題3.1】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してx, yのすべての値に1を加えた場合,相関係数はどう変わりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない |
【問題3.2】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してxのすべての値を2倍し,yの値をそのまま使用した場合,x, yの相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない |
【問題3.3】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,変数x, yを基準化してx’, y’に変えた場合,相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
@0.4よりも小さくなる A0.4で変化しない
B0.4よりも大きくなる C上記の条件だけでは決まらない
(解答)
・・・(1) 相関係数はそれ自体が基準化の計算なので,変数を基準化してから,相関係数を求めても変化しない. すなわち ・・・(2) とおくと,新しい変数 の平均値は0,標準偏差は1になるから,相関係数は これは(1)(2)により に等しい. したがって「変化しない」・・・Aが答 |
4. 散布図と相関係数のイメージ
図がたくさん登場しますが,これらを覚えるのではなく「勘を養う」という雰囲気で見てください.ここで養われた勘をもとにして,後で問題を出しますが,それらの問題は,文字や公式で説明するよりは「図を想像すれば解ける」ものが多い. r=1.0の場合の散布図[例] r=0.6の場合の散布図[例] r=0.3の場合の散布図[例] |
r=0.0の場合の散布図[例] r=−0.3の場合の散布図[例] r=−0.6の場合の散布図[例] r=−1.0の場合の散布図[例] |
【問題4.1】
解答を見るほとんど相関関係が見られない(r≒0)1つの集団を2つに分けたとき,それぞれの集団で相関関係が認められることがあるかどうか,根拠も示して答えてください.
(解答)
全体としては,ほとんど相関関係が見られない分布を,右図のように2つの集団に分けると,集団A,集団Bとも強い負の相関が見られる. また,右図のように2つの集団に分けると,集団A,集団Bとも強い正の相関が見られる. このように,分け方次第で分けられた集団に相関が生じることがある.
【問題4.2】
解答を見る正の相関がある1つの集団を2つに分けたとき,2つの集団とも負の相関が見られることがあるかどうか,根拠も示して答えてください. |
【問題4.3】
解答を見る高校3年生の1学級40人の身長と体重の相関について,男女別に相関係数を求める方が,学級全体で相関係数を求めるよりも,つねに相関が強くなるという考えについて,正しいかどうか根拠も示して答えてください.
【問題4.4】
解答を見るある学級40人の1学期中間試験国語の得点について,男子20人の得点の標準偏差が15.0,女子20人の得点の標準偏差も15.0であるとき,この学級全体の得点の標準偏差も15.0に等しいかどうか,根拠も示して答えてください. |
5. 2つのn次元ベクトルと見たときの相関係数の意味 ・・・共変動 共変動は,「偏差を成分とするベクトル」の「内積」に対応する. すなわち とするとき だから,
ベクトルの大きさで割る
・・・相関係数相関係数は,「ベクトルのなす角」(の余弦)に対応する. すなわち |
【問題5.1】 (★むずかしい)
解答を見るある学級の生徒40人について,1学期中間試験の国語,数学,英語の得点の相関係数を調べた. 国語と数学の得点の相関係数が ,数学と英語の得点の相関係数が のとき,英語と国語の得点の相関係数のとり得る値の範囲を調べてください.
(解説)
国語の得点を として,その平均を で表し, とおく. 同様にして,数学,英語を各々 , とおく. 相関係数は偏差ベクトルのなす角(の余弦)であるから とおくと, に対して と が反対側にある場合(図の )に と のなす角が最大に(=相関係数が最小に)なり, と が同じ側にある場合(図の )に と のなす角が最小に(=相関係数が最大に)なる. ア) の場合
三角関数の加法定理により
イ) の場合
ア)の場合と同様にして
したがって,・・・(答) (参考) この問題ではα=30°,β=45°になっており,α+β=75°となる場合に相関係数が最小になり,β−α=15°となる場合に相関係数が最大になります. |