現在地と前後の項目

確率変数と確率分布(1)/確率変数,確率分布(2)/期待値/分散,標準偏差/期待値,分散,標準偏差/代表値(平均値,中央値,最頻値)/度数分布表→平均値,分散,標準偏差/度数分布表をExcelで/度数分布表,相対度数分布表/分割表(クロス集計表),散布図の作成/散布図とクロス集計/確率変数の変換(1)/確率変数の変換(2)/同時確率分布,周辺分布/資料の散布度/共分散,相関係数/チェビシェフの不等式/ベクトルの内積と相関係数/二項分布/連続型確率分布/正規分布(1)/正規分布(2)/二項分布の正規近似/母平均,母比率の推定/同[練習問題]/母平均,母比率の検定(大標本)/母集団,標本/総和記号Σ(シグマ)に慣れよう(1)/総和記号Σ(シグマ)に慣れよう(2)/センター試験.確率分布 統計(2013年~)/
相関係数

※このページは,統計検定3級程度(高卒レベル)の教材です
1. 用語と記号

 著書,著者によって,記号が微妙に違うが,このページでは次の約束による.
〇1 大文字のSを「積の和」または「2乗和」に使う
【例】
Sxy=k=1n(xkx¯)(yky¯)・・・共変動(偏差積和)
Sx=k=1n(xkx¯)2・・・変動(偏差平方和)
〇2 小文字のsを「Snで割った平均」に使う
【例】
sxy=1nk=1n(xkx¯)(yky¯)・・・共分散
sx=1nk=1n(xkx¯)2・・・分散
〇3 ギリシャ文字のσを「平均のルート」に使う
【例】
σxy=1nk=1n(xkx¯)(yky¯)
σx=1nk=1n(xkx¯)2・・・標準偏差
σxy2=sxy,σx2=sx
※なお,書物によっては,推測統計の公式として,標準偏差や分散の分母をn−1とする公式(不偏偏差,不偏分散)を扱うが,この教材では記述統計の公式として,標準偏差や分散の分母がnになっている方を使う.
なお,元のデータx1,x2,,xn,y1,y2,,ynに対して,次の変形・処理を行う.
偏差
各変数から平均値を引いた値
Δxk=xkx¯
Δyk=yky¯
標準化(基準化,規格化)
各々の変数から平均値を引いて,標準偏差で割った値に直すこと.これにより,標準化された変数の平均値は0,標準偏差は1になる.
xk=xkx¯σx

2. n個の2次元の点と見たときの相関係数の意味

2.1 共変動(偏差積和)
 身長と体重のような2つの変数について,一方が増えると他方も増える傾向があるとき,これらの変数は正の相関関係があるという.逆に,一方が増えると他方が減る傾向があるとき,負の相関関係があるという.

-図1-
 例えば,点(x1, y1), (x2, y2)が右図1のように並んでいるとする.ただし,x¯およびy¯は,それぞれx, yの平均値である.
 右図1の場合,散布図で見ると「正の相関関係がある」ということを,数値として表す方法を考えてみると,
(x1x¯)(y1y¯),(x2x¯)(y2y¯)は(正の数)×(正の数),(負の数)×(負の数)になり,右図1の水色の長方形の面積はいずれも正の値になる.

-図2-
 右図2の場合,(x3x¯)(y3y¯)(x4x¯)(y4y¯)は(負の数)×(正の数),(正の数)×(負の数)になり,右図2の桃色の長方形の面積はいずれも負の値になる.
 このようにして,
Sxy=k=1n(xkx¯)(yky¯)
という形で定義される式(これを共変動という)を作ると,その符号の正負が正の相関関係,負の相関関係を表すようになる.

-図3-
 右図3のように,4個の点が並んでいるとき,水色で示される長方形2個の面積は大きく(正の値が大きい),桃色で示される長方形の面積は小さいから(負の値が小さい),全体では共変動の値は正になり,正の相関関係があるという事実と一致する.
上記のように,2つの偏差の積和を計算したものは,共変動と呼ばれるが,1つの変数の偏差の2乗の和を計算したものは変動(偏差平方和)と呼ばれる
Sx=k=1n(xkx¯)2
Sy=k=1n(yky¯)2

2.2 共分散
 共変動をnで割った平均を共分散という
sxy=1nSxy
すなわち
σxy2=sxy=1nk=1n(xkx¯)(yky¯)・・・共分散
上記のように,2変数の積和の平均は,共分散と呼ばれるが,1つの変数の偏差の平方和の平均は分散と呼ばれる
sx=1nSxすなわちsx=1nk=1n(xkx¯)2
sy=1nSyすなわちsy=1nk=1n(yky¯)2
2.3 相関係数(ピアソンの積率相関係数)
 共分散は2つの変数の測定単位によって影響を受ける.(例えば,長さの単位をメートルからセンチメートルに変えると,各変数は100倍になり,共分散は10000倍の値になる).このような測定単位による影響を受けないものとして,共分散を2つの標準偏差で割ったものを考え,相関係数と呼ぶ.これは,元のデータx1,x2,,xny1,y2,,ynを,標準化(基準化,規格化)してから共分散を求めたものになっている.
rxy=sxyσxσy
rxy=1nk=1nxkx¯σxyky¯σy・・・相関係数

【問題2.1】
-表1-
xkyk
10
21
32
42
50
 右の表1に示された2つの変数x, yについて,次の値を求めてください.
① 共変動
② 共分散
③ 相関係数
 なお,小数になるときは,小数第3位を四捨五入して小数第2位まで求めてください.
解答を見る
【問題2.2】
 相関係数と共分散の符号はつねに一致するかどうか,根拠も示して答えてください.
解答を見る
【問題2.3】
 共分散が大きくなると,相関係数も大きくなるといえるかどうか,根拠も示して答えてください.
解答を見る

3. 線形変換による影響

xk'=axk+b
yk'=cyk+dという線形変換を行ったとき
[平均]x¯x¯=ax¯+b・・・①
y¯y¯=cy¯+d・・・②
(解説)
x¯=1nk=1nxk,xk=axk+bのとき
x¯=1nk=1nxk=1nk=1n(axk+b)
=a1nk=1nxk+1nnb=ax¯+b
(例)
x¯=2,xk=3xk+4のときx¯=3×2+4=10

yについても同様に示される]
[変動]SxSx=a2Sx・・・③
SySy=c2Sy・・・④
(解説)
Sx=k=1n(xkx¯)2,xk=axk+bのとき
Sx=k=1n(xkx¯)2=k=1n{axk+b(ax¯+b)}2
=k=1n(axkax¯)2=a2k=1n(xkx¯)2
(例)
Sx=10,xk=2xk+3のときSx=22×10=40

yについても同様に示される]
[分散]sxsx=a2sx・・・⑤
sysy=c2sy・・・⑥
(解説)
sx=1nk=1n(xkx¯)2,xk=axk+bのとき
sx=1nk=1n(xkx¯)2=1nk=1n{axk+b(ax¯+b)}2
=1nk=1n(axkax¯)2=a21nk=1n(xkx¯)2
(例)
sx=30,xk=2xk+3のときsx=22×30=120

yについても同様に示される]
[標準偏差]σxσx=aσx・・・⑦
σyσy=cσy・・・⑧
(解説)
分散の解説より
sx=a2sx
だから
σx2=a2σx2
σx=|a|σx(σx,σx0)
(例)
σx=5,xk=2xk+3のとき
σx=2×5=10

yについても同様に示される]

[共変動]SxySxy=acSxy・・・⑨
(解説)
Sxy=k=1n(xkx¯)(yky¯)
xk=axk+b,yk=cyk+d のとき
Sxy=k=1n(xkx¯)(yky¯)
=k=1n{axk+b(ax¯+b)}{cyk+d(cy¯+d)}
=k=1n{a(xkx¯)}{c(yky¯)}
=ack=1n(xkx¯)(yky¯)
(例)
Sxy=100,xk=2xk+3,yk=4yk+5のとき
Sxy=2×4×100=800
[共分散]sxysxy=acsxy・・・⑩
(解説)
sxy=1nk=1n(xkx¯)(yky¯) xk=axk+b,yk=cyk+d のとき
sxy=1nk=1n(xkx¯)(yky¯)
=1nk=1n{axk+b(ax¯+b)}{cyk+d(cy¯+d)}
=1nk=1n{a(xkx¯)}{c(yky¯)}
=ac1nk=1n(xkx¯)(yky¯)
(例)
sxy=10,xk=2xk+3,yk=4yk+5のとき
sxy=2×4×10=80
[相関係数]rxyrxy=rxy・・・⑪
(解説)
rxy=1nk=1n(xkx¯)σx(yky¯)σy
xk=axk+b,yk=cyk+d のとき
rxy=1nk=1n(xkx¯)σx(yky¯)σy
=1nk=1n{axk+b(ax¯+b)}aσx{cyk+d(cy¯+d)}cσy
=1nk=1na(xkx¯)aσxc(yky¯)cσy
=1nk=1nxkx¯σxyky¯σy
(例)
rxy=0.6,xk=2xk+3,yk=4yk+5のとき
rxy=0.6
【問題3.1】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してx, yのすべての値に1を加えた場合,相関係数はどう変わりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない
解答を見る

【問題3.2】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してxのすべての値を2倍し,yの値をそのまま使用した場合,x, yの相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない
解答を見る
【問題3.3】
 各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,変数x, yを基準化してx’, y’に変えた場合,相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない
解答を見る

4. 散布図と相関係数のイメージ

 図がたくさん登場しますが,これらを覚えるのではなく「勘を養う」という雰囲気で見てください.ここで養われた勘をもとにして,後で問題を出しますが,それらの問題は,文字や公式で説明するよりは「図を想像すれば解ける」ものが多い.

r=1.0の場合の散布図[例]

r=0.6の場合の散布図[例]

r=0.3の場合の散布図[例]

r=0.0の場合の散布図[例]

r=−0.3の場合の散布図[例]

r=−0.6の場合の散布図[例]

r=−1.0の場合の散布図[例]

【問題4.1】
 ほとんど相関関係が見られない(r≒0)1つの集団を2つに分けたとき,それぞれの集団で相関関係が認められることがあるかどうか,根拠も示して答えてください.
解答を見る
【問題4.2】
 正の相関がある1つの集団を2つに分けたとき,2つの集団とも負の相関が見られることがあるかどうか,根拠も示して答えてください.
解答を見る
【問題4.3】
 高校3年生の1学級40人の身長と体重の相関について,男女別に相関係数を求める方が,学級全体で相関係数を求めるよりも,つねに相関が強くなるという考えについて,正しいかどうか根拠も示して答えてください.
解答を見る
【問題4.4】
 ある学級40人の1学期中間試験国語の得点について,男子20人の得点の標準偏差が15.0,女子20人の得点の標準偏差も15.0であるとき,この学級全体の得点の標準偏差も15.0に等しいかどうか,根拠も示して答えてください.
解答を見る

5. 2つのn次元ベクトルと見たときの相関係数の意味

Sxy=k=1n(xkx¯)(yky¯)・・・共変動

 共変動は,「偏差を成分とするベクトル」の「内積」に対応する.
 すなわち
a=(x1x¯,x2x¯,,xnx¯)
b=(y1y¯,y2y¯,,yny¯)
とするとき
ab=(x1x¯)(y1y¯)+(x2x¯)(y2y¯)+
+(xnx¯)(yny¯)
だから,Sxy=ab
ベクトルの大きさで割る
rxy=k=1n(xkx¯)(yky¯)k=1n(xkx¯)2k=1n(yky¯)2・・・相関係数

 相関係数は,「ベクトルのなす角」(の余弦)に対応する.
 すなわち
rxy=ab|a||b|
 このようにして,相関係数が+1に近ければ2つのベクトルは同じ方向を向いており,−1に近ければ2つのベクトルは逆方向を向いていることになる.0に近ければ,2つのベクトルは無関係な方向を向いていることになる.

【問題5.1】 (★むずかしい)
 ある学級の生徒40人について,1学期中間試験の国語,数学,英語の得点の相関係数を調べた.
 国語と数学の得点の相関係数が32,数学と英語の得点の相関係数が22 のとき,英語と国語の得点の相関係数のとり得る値の範囲を調べてください.
解答を見る
確率統計のメニューに戻る 高校数学のメニューに戻る
■このサイト内のGoogle検索■

△このページの先頭に戻る△
【 アンケート送信 】
… このアンケートは教材改善の参考にさせていただきます

この頁について,良い所,悪い所,間違いの指摘,その他の感想があれば送信してください.
○文章の形をしている感想は全部読ませてもらっています.
○感想の内で,どの問題がどうであったかを正確な文章で伝えていただいた改善要望に対しては,可能な限り対応するようにしています.(※なお,攻撃的な文章になっている場合は,それを公開すると筆者だけでなく読者も読むことになりますので,採用しません.)


質問に対する回答の中学版はこの頁,高校版はこの頁にあります