現在地と前後の項目 確率変数と確率分布(1)/確率変数,確率分布(2)/期待値/分散,標準偏差/期待値,分散,標準偏差/代表値(平均値,中央値,最頻値)/度数分布表→平均値,分散,標準偏差/度数分布表をExcelで/度数分布表,相対度数分布表/分割表(クロス集計表),散布図の作成/散布図とクロス集計/確率変数の変換(1)/確率変数の変換(2)/同時確率分布,周辺分布/資料の散布度/共分散,相関係数/チェビシェフの不等式/ベクトルの内積と相関係数/二項分布/連続型確率分布/正規分布(1)/正規分布(2)/二項分布の正規近似/母平均,母比率の推定/同[練習問題]/母平均,母比率の検定(大標本)/母集団,標本/総和記号Σ(シグマ)に慣れよう(1)/総和記号Σ(シグマ)に慣れよう(2)/センター試験.確率分布 統計(2013年~)/ 相関係数
※このページは,統計検定3級程度(高卒レベル)の教材です
1. 用語と記号
著書,著者によって,記号が微妙に違うが,このページでは次の約束による. 〇1 大文字のSを「積の和」または「2乗和」に使う
【例】
〇2 小文字のsを「Sをnで割った平均」に使う
【例】
|
〇3 ギリシャ文字のσを「平均のルート」に使う
【例】
なお,元のデータ※なお,書物によっては,推測統計の公式として,標準偏差や分散の分母をn−1とする公式(不偏偏差,不偏分散)を扱うが,この教材では記述統計の公式として,標準偏差や分散の分母がnになっている方を使う. 偏差
各変数から平均値を引いた値
標準化(基準化,規格化)
各々の変数から平均値を引いて,標準偏差で割った値に直すこと.これにより,標準化された変数の平均値は0,標準偏差は1になる.
|
2. n個の2次元の点と見たときの相関係数の意味 2.1 共変動(偏差積和) 身長と体重のような2つの変数について,一方が増えると他方も増える傾向があるとき,これらの変数は正の相関関係があるという.逆に,一方が増えると他方が減る傾向があるとき,負の相関関係があるという. ![]() ![]() ![]() -図1- 右図1の場合,散布図で見ると「正の相関関係がある」ということを,数値として表す方法を考えてみると, |
![]() -図2- このようにして, という形で定義される式(これを共変動という)を作ると,その符号の正負が正の相関関係,負の相関関係を表すようになる. ![]() -図3-
上記のように,2つの偏差の積和を計算したものは,共変動と呼ばれるが,1つの変数の偏差の2乗の和を計算したものは変動(偏差平方和)と呼ばれる
|
2.2 共分散 共変動をnで割った平均を共分散という すなわち
上記のように,2変数の積和の平均は,共分散と呼ばれるが,1つの変数の偏差の平方和の平均は分散と呼ばれる
|
2.3 相関係数(ピアソンの積率相関係数) 共分散は2つの変数の測定単位によって影響を受ける.(例えば,長さの単位をメートルからセンチメートルに変えると,各変数は100倍になり,共分散は10000倍の値になる).このような測定単位による影響を受けないものとして,共分散を2つの標準偏差で割ったものを考え,相関係数と呼ぶ.これは,元のデータ |
【問題2.1】
解答を見る
① 共変動
なお,小数になるときは,小数第3位を四捨五入して小数第2位まで求めてください.
② 共分散 ③ 相関係数
(解答)
②共分散 ③相関係数 次の表3を埋めて,標準偏差を求める
相関係数は |
【問題2.2】
解答を見る相関係数と共分散の符号はつねに一致するかどうか,根拠も示して答えてください.
【問題2.3】
解答を見る共分散が大きくなると,相関係数も大きくなるといえるかどうか,根拠も示して答えてください.
(解答)
共分散は次の式で定義される 相関係数は次の式で定義される 共分散を標準偏差 |
3. 線形変換による影響
xk'=axk+b
yk'=cyk+dという線形変換を行ったとき
[平均]
(解説)
(例) [yについても同様に示される]
[変動]
(解説)
(例) [yについても同様に示される] |
[分散]
(解説)
(例) [yについても同様に示される]
[標準偏差]
(解説)
分散の解説より だから (例) [yについても同様に示される] |
[共変動]
(解説)
(例)
[共分散]
(解説)
(例) |
[相関係数]
(解説)
(例)
【問題3.1】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してx, yのすべての値に1を加えた場合,相関係数はどう変わりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない |
【問題3.2】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,測定値を訂正してxのすべての値を2倍し,yの値をそのまま使用した場合,x, yの相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない |
【問題3.3】
解答を見る各々10件の測定値からなる2つの変数x, yの相関係数が0.4であったとき,変数x, yを基準化してx’, y’に変えた場合,相関係数はどのような値になりますか.正しいものを次の選択肢から選んでください.
①0.4よりも小さくなる ②0.4で変化しない
③0.4よりも大きくなる ④上記の条件だけでは決まらない
(解答)
相関係数はそれ自体が基準化の計算なので,変数を基準化してから,相関係数を求めても変化しない. すなわち とおくと,新しい変数 これは(1)(2)により したがって「変化しない」・・・②が答 |
4. 散布図と相関係数のイメージ
図がたくさん登場しますが,これらを覚えるのではなく「勘を養う」という雰囲気で見てください.ここで養われた勘をもとにして,後で問題を出しますが,それらの問題は,文字や公式で説明するよりは「図を想像すれば解ける」ものが多い. ![]() ![]() r=1.0の場合の散布図[例] ![]() ![]() r=0.6の場合の散布図[例] ![]() ![]() r=0.3の場合の散布図[例] |
![]() ![]() r=0.0の場合の散布図[例] ![]() ![]() r=−0.3の場合の散布図[例] ![]() ![]() r=−0.6の場合の散布図[例] ![]() ![]() r=−1.0の場合の散布図[例] |
【問題4.1】
解答を見るほとんど相関関係が見られない(r≒0)1つの集団を2つに分けたとき,それぞれの集団で相関関係が認められることがあるかどうか,根拠も示して答えてください. ![]() 全体としては,ほとんど相関関係が見られない分布を,右図のように2つの集団に分けると,集団A,集団Bとも強い負の相関が見られる. ![]() また,右図のように2つの集団に分けると,集団A,集団Bとも強い正の相関が見られる. このように,分け方次第で分けられた集団に相関が生じることがある.
【問題4.2】
解答を見る正の相関がある1つの集団を2つに分けたとき,2つの集団とも負の相関が見られることがあるかどうか,根拠も示して答えてください. |
【問題4.3】
解答を見る高校3年生の1学級40人の身長と体重の相関について,男女別に相関係数を求める方が,学級全体で相関係数を求めるよりも,つねに相関が強くなるという考えについて,正しいかどうか根拠も示して答えてください.
【問題4.4】
解答を見るある学級40人の1学期中間試験国語の得点について,男子20人の得点の標準偏差が15.0,女子20人の得点の標準偏差も15.0であるとき,この学級全体の得点の標準偏差も15.0に等しいかどうか,根拠も示して答えてください. |
5. 2つのn次元ベクトルと見たときの相関係数の意味 ![]() 共変動は,「偏差を成分とするベクトル」の「内積」に対応する. すなわち とするとき だから, ![]() ![]() 相関係数は,「ベクトルのなす角」(の余弦)に対応する. すなわち ![]() ![]() |
【問題5.1】 (★むずかしい)
解答を見るある学級の生徒40人について,1学期中間試験の国語,数学,英語の得点の相関係数を調べた. 国語と数学の得点の相関係数が
(解説)
国語の得点を 同様にして,数学,英語を各々 ![]() 相関係数は偏差ベクトルのなす角(の余弦)であるから とおくと, ア)
三角関数の加法定理により
イ)
ア)の場合と同様にして
したがって,(参考) この問題ではα=30°,β=45°になっており,α+β=75°となる場合に相関係数が最小になり,β−α=15°となる場合に相関係数が最大になります. |
■このサイト内のGoogle検索■ |