PC用は別頁
窶サ鬮俶�。謨ー蟄ヲB縺ョ縲檎「コ邇��蟶�€阪↓縺、縺�※�後%縺ョ繧オ繧、繝医↓縺ッ谺。縺ョ謨呎攝縺後≠繧翫∪縺呻シ�
縺薙�鬆√∈Google繧ШAHOO ! 縺ェ縺ゥ縺ョ讀懃エ「縺九i逶エ謗・譚・縺ヲ縺励∪縺」縺溘�縺ァ縲悟燕謠舌→縺ェ縺」縺ヲ縺�k蜀�ョケ縺悟�縺九i縺ェ縺�€阪→縺�≧蝣エ蜷医d縲後%縺ョ鬆√�蛻�°縺」縺溘′繧ゅ▲縺ィ蠢懃畑蝠城。後r隕九◆縺�€阪→縺�≧蝣エ蜷医��御サ悶�鬆√r隕九※縺上□縺輔>��縲€ 縺檎樟蝨ィ蝨ー縺ァ縺呻シ�
竊�遒コ邇�、画焚縺ィ縺ッ
竊�遒コ邇�、画焚縺ィ遒コ邇��蟶�
竊�譛溷セ�€、
竊�蛻�淵繝サ讓呎コ門¥蟾ョ-迴セ蝨ィ蝨ー
竊�蠎ヲ謨ー蛻�ク��蟷ウ蝮�,蛻�淵,讓呎コ門¥蟾ョ
竊�遒コ邇�、画焚縺ョ螟画鋤
竊�蜷梧凾遒コ邇��蟶�→蜻ィ霎コ蛻�ク�
竊�莠碁���蟶�
竊�騾」邯壼梛遒コ邇��蟶�
竊�豁」隕丞�蟶�
繧サ繝ウ繧ソ繝シ隧ヲ鬨�.謨ー2�・B邨ア險�(2013蟷エ��)

■分散,標準偏差
【分散】
 期待値(平均値)をmとするとき,データの散らばり具合を表す値:分散Vは,次の式で定義されます.
V=.(x1−m)2+(x2−m)2+(x3−m)2+…+(xN−m)2Nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn…(1)

表1(度数分布表)
変数X x1 x2 x3 xn
度数F f1 f2 f3 fn N

表2(確率分布表)
確率変数X x1 x2 x3 xn
確率P .f1Nn .f2Nn .f3Nn .fnNn 1

.fkNnn=pkとおく
表3(確率分布表)
確率変数X x1 x2 x3 xn
確率P p1 p2 p3 pn 1

 表1のような度数分布表で表される場合は,xkfkずつあるから,各々の変数を取る確率.fkNnnで表せば
V=(x1−m)2.f1Nnn+(x2−m)2.f2Nnn+…+(xn−m)2.fnNnn
 表3のように確率分布表になっている場合には
V=(x1−m)2p1+(x2−m)2p2+…+(xn−m)2pn…(2)
【標準偏差】
 標準偏差は分散の正の平方根(ルート)で定義されます.
σ=.V√nni…(3)
【分散と2乗平均の関係】
 分散は,元の変数の(2乗の平均)-(平均の2乗)に等しくなります.
V=E(X 2)−E(X)2…(4)
(※現在では,コンピュータを利用することが多いので,分散の計算は元の定義式(1)のままで行うことができます.筆算で行う場合や様々な関係式を証明するためには,(3)も必要になります.)
(解説)
○ 平均値E(X)という1種類の代表値だけでは,元のデータの散らばり具合が表せません.
 次の図1の上の図と下の図とでは,平均値が同じですが,上の図ではデータが平均値付近に集まっているのに対して,下の図ではデータは散らばっており,これら2つのデータは異なる傾向を持っています.
図1
 平均値と散らばりの2つの量を使うと,次の図2のA,B,C,Dをすべて区別することができます.
図2
 図2においては,AとCは平均値が等しくて,散らばりはCの方が大きくなっています.
 また,AとBとでは,散らばりが等しく,平均値はBの方が大きくなっています.
 AとD,BとCでは平均値も散らばりも異なっています.

○ データの散らばり具合を表す数字が分散V(X)(または標準偏差σ(X))です.
 散らばり具合を数値で表すために,それぞれの値xkが平均値mからどれだけ離れているか:偏差xk−mの平均を取ることが考えられますが,(*A)に示すように偏差を単純に平均すると0になっていしまい,散らばり具合を区別することはできません.
▼(*A) 単純に平均値との差を取ったもの:xk−mを平均しても,正負で打ち消し合って消えてしまうので使えない.
[例] 次の例では,平均値はm=0となっている.

.(−3)+(−2)+(−1)+1+2+33nnnnnnnnnnnnnnnnnnnnn=0
このように平均値との差xk−mの平均を調べても,0になってしまって,役に立たない.

 次に,負となる偏差の符号を変えて,偏差の絶対値|xk−m|の平均を取ったものを使うと,散らばり具合を表すことができますが(平均偏差),(*B)に示すように変形が煩わしく,扱いにくい式になるため,実際にはあまり使われません.
▼(*B) 平均値との差の絶対値 |xk−m|の平均(平均偏差)は,散らばりを表現する目的には最適に見えるが,変形しにくく,扱いにくいのが最大の難点
|x+a|+|x+b|(|x+a|+|x+b|)2
のような式は簡単には変形できない.

平均偏差.|−3|+|−2|+|−1|+|1|+|2|+|3|3nnnnnnnnnnnnnnnnnnnnnnnはめったに使われない.

 散らばり具合を表すことができて,実際の計算も行いやすいものとして,偏差の2乗(xk−m)2の平均で定義される分散というものが使われます.
◎(*C) 平均値との差の2乗(xk−m)2の平均:分散V(X)と呼ばれるものを使う.
上の例では
(分散)=.(−3)2+(−2)2+(−1)2+12+22+323nnnnnnnnnnnnnnnnnnnnnnnn
元の数が負の数であっても,正の数であっても,2乗するとすべて正の数に変わる所がミソ.さらに「変形が簡単」にできる長所がある.

(注) 分散は元の変数の2乗を使っているので,元の変数が cm のとき,分散の単位は cm2 となり,単位は合わない.
 分散V(X)は非常によく使われるが,元のスケールに揃えて見るときには,分散の正の平方根(ルート)をとった標準偏差σ(X)が用いられる.
 期待値(平均値)をmとするとき,分散Vは,次の式で定義されます.
V=.(x1−m)2+(x2−m)2+(x3−m)2+…+(xN−m)2Nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn
xk≧mの場合でも,xk<mの場合でも,いずれも2乗すると0以上となって,xkが平均値mからの離れるほど分子の各項は大きくなります.)
 表1のように度数分布表で示され,同じ値が各々f1個,f2個,...全部でN個ある場合,分散は

V=.(x1−m)2f1+(x2−m)2f2+...+(xn−m)2fnNnnnnnnnnnnnnnnnnnnnnnnnnnnnn
=(x1−m)2.f1Nnn+(x2−m)2.f2Nnn+...+(xn−m)2.fnNnn
 表3のように
.fkNnn=pk (k=1,2,3,...,n)とおくと,
分散は
V=(x1−m)2p1+(x2−m)2p2+...+(xn−m)2pn
○ 分散は偏差を2乗しているので,元の変数xkと単位がそろっていません.元の変数xkと同じ単位の数字として,分散の正の平方根(ルート)で定義される標準偏差が使われます.
σ=.V√nni
(4)の証明
 分散を計算するためには,先に平均値を求めておきます.
m=.x1+x2+…+xNNnnnnnnnnnnn
 次に,この平均値を使って,分散を計算します.
V=.(x1−m)2+(x2−m)2+(x3−m)2+…+(xN−m)2Nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnnn…(1)
(1)式の分母を変形すると
(x1−m)2+(x2−m)2+(x3−m)2+…+(xN−m)2
=(x12+x22+…+xN2)−2m(x1+x2+…+xN)+Nm2
したがって分散は
V=.x12+x22+…+xN2Nnnnnnnnnnnnn−2m.x1+x2+…+xNNnnnnnnnnnnn+m2
=.x12+x22+…+xN2Nnnnnnnnnnnnn−2m2+m2
=.x12+x22+…+xN2Nnnnnnnnnnnnn−m2
=.x12+x22+…+xN2Nnnnnnnnnnnnn−( .x1+x2+…+xNNnnnnnnnnnnn)2
ここで,xk2の平均:.x12+x22+…+xN2NnnnnnnnnnnnnE(X 2)で,
xkの平均:.x1+x2+…+xNNnnnnnnnnnnnE(X)で表すと
V=E(X 2)−E(X)2
※度数分布表や確率分布表で示される場合にも,この関係は成り立ちます.

【例1】
 1個のさいころを投げるとき,出る目の分散と標準偏差を求めてください.
分散を求めるためには,先に期待値を計算しておかなければなりません.
(解答)
 確率分布表は次のようになる.
X 1 2 3 4 5 6
P .16n .16n .16n .16n .16n .16n 1
 期待値は
m=(1+2+3+4+5+6).16n=.72n
 分散は
V={ (1−.72n)2+(2−.72n)2+(3−.72n)2+...+(6−.72n)2 }.16n
={ (.52n)2+(.32n)2+(.12n)2+...+(.52n)2 }.16n
={ .25+9+1+1+9+254nnnnnnnnnnnnnnn }.16n
= .3512nn
 標準偏差は
σ=..3512nn√nni=..35√nni2.3√ninnn=..105√nnni6nnnn
(参考)
散らばりを表す標準偏差σの値は,平均値mから一番遠い値までの距離ではなく,(多くの場合に)m±σの範囲に変数の約70%(詳しくいえば68.5%)程度が入るような値になっています.
⇒ σまで取れば,7割程度が含まれる.
 コンピュータを使わずに分散を計算するときは,V=E(X 2)−E(X)2の公式を使う方が簡単になります.
 そのためには,まず次の表を作ってE(X 2)を求めます.
X 2 1 4 9 16 25 36
P .16n .16n .16n .16n .16n .16n 1
E(X 2)=(1+4+9+16+25+36).16n=.916nn
したがって
V=E(X 2)−E(X)2=.916nn−(.72n)2=.916nn.494nn=.3512nn
【例2】
 5枚の硬貨を同時に投げるとき,表が出る枚数の分散と標準偏差を求めてください.
分散を求めるためには,先に期待値を計算しておかなければなりません.
(解答)
 5枚の硬貨を投げて,表がr枚出る確率は,
5Cr(.12n)r(.12n)5−r=.5!r!(5−r)!nnnnnnn(.12n)5だから
 確率分布表は次のようになる.
X 0 1 2 3 4 5
P .132nn .532nn .1032nn .1032nn .532nn .132nn 1
 期待値は
E(X)=0×.132nn+1×.532nn+2×.1032nn+3×.1032nn+4×.532nn+5×.132nn=.52n
 分散は
V=(0−.52n)2.132nn+(1−.52n)2.532nn+...+(5−.52n)2.132nn
=.254nn.132nn+.94n.532nn+...+.254nn.132nn=.160128nnn=.54n
 標準偏差は
σ=.V√nni=..5√ni2nn
 V=E(X 2)−E(X)2の公式を使う場合は
 まず次の表を作ってE(X 2)を求めます.
X 2 0 1 4 9 16 25
P .132nn .532nn .1032nn .1032nn .532nn .132nn 1
E(X 2)=.5+40+90+80+2532nnnnnnnnnnnnnn=.24032nnn=.152nn
したがって
V=E(X 2)−E(X)2=.152nn−(.52n)2=.152nn.254nn=.54n

 正しい番号を選択してください.
【問題1】
 袋の中に赤玉4個,白玉1個が入っている.同時に3個取り出すとき,その中に含まれる赤玉の個数の分散を求めてください.



1.625nn 2..6√ni5nn 3.125nn 46



【問題2】
 トランプのハートのカードが3枚,スペードのカードが4枚,合計7枚ある.裏返してよく切ってから,1枚ずつ2回抜き取るとき,ハートのカードが出る回数の標準偏差を求めてください.ただし,抜き取ったカードは元に戻さないものとします.


1.2.5√ni7nnn 2.67n 3.87n 4.2049nn



【問題3】
 4枚の10円硬貨を同時に投げるとき,表が出る枚数の分散を求めてください.

1.34n 21 3.74n 42




【問題4】
 2個のさいころを投げて,出た目の差(出た目の大きい方から小さい方を引くものとし,出た目が等しいときは差は0とする)の分散に最も近い値は次のどれになるか.

11.1 22.1 33.1 44.1



【問題5】
 次の確率分布に従う確率変数Xの分散を求めてください.
X 0 1 2 3
P 0.1 0.4 0.4 0.1 1


10.35 20.45 30.55 40.65



【問題6】
 2枚の10円硬貨を同時に投げて,
(表が出た枚数)-(裏が出た枚数)
を得点とするとき,得点の標準偏差を求めてください.

11 2.2√ni 3.3√ni 42 5.5√ni




(携帯版)統計メニューに戻る

...メニューに戻る


■[個別の頁からの質問に対する回答][分散,標準偏差について/16.11.14]
初めてメールさせて頂きます。 詳細にご説明頂いております、本統計学の頁には大変お世話になっております。有難うございます。 一つ質問があります。分散を求める場合には偏差平方和を自由度で除すと思っていましたが、本ページの最初の部分に記載されている分散ではNで除されています。これは確率変数を扱っているからでしょうか。ご回答頂ければ幸甚に存じます。
=>[作者]:連絡ありがとう.その頁は高校生向けの教材なので,推測統計には触れていません.
 すなわち,その頁で述べている

は,与えられたN個の標本の分散です…(1)
これに対して,あなたが言っておられるのは

で,与えられたN個の標本から推測される母集団の分散です.…(2)
 今日ではコンピュータを使って何万個のデータでも簡単に処理できるので,全数検査も可能です.全数検査では分散は(1)式になります.[記述統計]
これに対して,与えられたN個のデータが巨大な母集団から抽出された標本であるときに,元の母集団の分散は(2)式になります.[推測統計]
 これらの違いや相互関係についてはこの頁に書いています.
 なお,Excelでは(1)に対応する標本分散は VARP() で求めることができ,(2)に対応する母集団分散は VAR() で求めることができます.
[追伸]
おはようございます。昨日(11/14)、分散の分母がNか(N-1)かにつきましてご質問させて頂いた者です。早々のご対応有難うございました。記述統計と推測統計の違いであった点、よく理解出来ました。ご丁寧な回答有難うございます。今後共よろしくご指導下さい。

笆ウ縺薙�繝壹�繧ク縺ョ蜈磯�ュ縺ォ謌サ繧銀無
縲� 繧「繝ウ繧ア繝シ繝磯€∽ソ。 縲�
… 縺薙�繧「繝ウ繧ア繝シ繝医�謨呎攝謾ケ蝟��蜿り€�↓縺輔○縺ヲ縺�◆縺�縺阪∪縺�

笆�縺薙�鬆√↓縺、縺�※�瑚憶縺�園�梧が縺�園�碁俣驕輔>縺ョ謖�遭�後◎縺ョ莉悶�諢滓Φ縺後≠繧後�騾∽ソ。縺励※縺上□縺輔>��
笳区枚遶�縺ョ蠖「繧偵@縺ヲ縺�k諢滓Φ縺ッ蜈ィ驛ィ隱ュ縺セ縺帙※繧ゅi縺」縺ヲ縺�∪縺呻シ�
笳区─諠ウ縺ョ蜀�〒�後←縺ョ蝠城。後′縺ゥ縺�〒縺ゅ▲縺溘°繧呈ュ」遒コ縺ェ譁�ォ�縺ァ莨昴∴縺ヲ縺�◆縺�縺�◆謾ケ蝟�ヲ∵悍縺ォ蟇セ縺励※縺ッ�悟庄閭ス縺ェ髯舌j蟇セ蠢懊☆繧九h縺�↓縺励※縺�∪縺呻シ趣シ遺€サ縺ェ縺奇シ梧判謦�噪縺ェ譁�ォ�縺ォ縺ェ縺」縺ヲ縺�k蝣エ蜷医��後◎繧後r蜈ャ髢九☆繧九→遲�€�□縺代〒縺ェ縺剰ェュ閠�b隱ュ繧€縺薙→縺ォ縺ェ繧翫∪縺吶�縺ァ�梧治逕ィ縺励∪縺帙s�趣シ�


雉ェ蝠上↓蟇セ縺吶k蝗樒ュ斐�荳ュ蟄ヲ迚医�縺薙�鬆��碁ォ俶�。迚医�縺薙�鬆�縺ォ縺ゅj縺セ縺�