現在地と前後の項目

確率変数と確率分布(1)/確率変数,確率分布(2)/期待値/分散,標準偏差/期待値,分散,標準偏差/代表値(平均値,中央値,最頻値)/度数分布表→平均値,分散,標準偏差/度数分布表をExcelで/度数分布表,相対度数分布表/分割表(クロス集計表),散布図の作成/散布図とクロス集計/確率変数の変換(1)/確率変数の変換(2)/同時確率分布,周辺分布/資料の散布度/共分散,相関係数/チェビシェフの不等式/ベクトルの内積と相関係数/二項分布/連続型確率分布/正規分布(1)/正規分布(2)/二項分布の正規近似/母平均,母比率の推定/同[練習問題]/母平均,母比率の検定(大標本)/母集団,標本/総和記号Σ(シグマ)に慣れよう(1)/総和記号Σ(シグマ)に慣れよう(2)/センター試験.確率分布 統計(2013年~)/
==チェビシェフの不等式==
 次の式(1)のような代数不等式も,「チェビシェフの(和の)不等式」と呼ばれるが,このページで扱うチェビシェフの不等式は,確率・統計に関するもので,互いに全く別の物です.
   a<b, x<y ⇒ (a+b)(x+y)≦2(ax+by)・・・(1)
【チェビシェフの不等式】
 平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|≦kを満たす確率をP(|X−m|≦k)で表すと
kは,σよりも大きい定数(整数に限定されない)
P(Xm∣≦k)>1σ2k2・・・(1)
|X−m|>kを満たす確率をP(|X−m|>k)で表すと
P(Xm∣>k)σ2k2・・・(2)
あるいは,変数Xの値が|X−m|≦kσを満たす確率をP(|X−m|≦kσ)で表すと
kは,1よりも大きい定数(整数に限定されない)
P(Xm∣≦kσ)>11k2・・・(1’)
|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと
P(Xm∣>kσ)1k2・・・(2’)
(解説)
 起こり得るすべての場合の確率が1だから,「平均値mまでの距離がk以下」の確率が(1)式になることと,残りの「平均値mまでの距離がkよりも大きい」確率が(2)式になることとは,どちらか一方を示せば他方も成り立つ.
 また,「平均値mまでの距離がk以下」とするよりも「平均値mまでの距離が標準偏差σk倍以下」という形で目盛りを考える方法もある.そこで(1)(2)でk=k’σを代入すると(1’)(2’)になり,これらを示してもよい.
 以下では,(2’)を証明する.

 なお,チェビシェフの不等式は,離散分布でも,連続分布でも成り立つので,各々について証明してみる.
【チェビシェフの不等式】- - - ■離散分布の場合■
 平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと
P(Xm∣>kσ)1k2・・・(2’)
(証明)
 全部でn個ある確率変数X={x1,x2,,xn}
を並べ替えても,平均値m,標準偏差σに影響しないので,小さいものから順に並べかえた結果をx1,x2,,xnとする.
 n−t個が|xi−m|≦kσで,t個が|xi−m|>kσであるとき
 標準偏差(分散)の計算において,小さい方のn−t個の(xi−m)2を0に書き換え,大きい方のt個の(xi−m)2(kσ)2に書き換えると,和は小さく(≦)なるから
|- - 初めのn−t個 - -|| - - - 後のt個 - - - |
σ2=(x1m)2++(xim)2+(xi+1m)2++(xnm)2n
|- n−t個 -||- - t個 - -|
0++0+k2σ2++k2σ2n
=0+k2σ2×tn
いま,確率P(|X−m|>kσ)は,tnに等しいから
σ2P×k2σ2
P1k2・・・(証明終わり)
 チェビシェフの不等式は,どのような確率分布に対しても成り立つが,その代わりに証明の途中経過を見れば分かるように,大変「大雑把な比較」になっており,例えば正規分布や二項分布のように具体的な分布が仮定できる場合には,チェビシェフの不等式よりももっと精度のよい不等式が示せる.

【チェビシェフの不等式】- - - ■連続分布の場合■
 平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと
P(Xm∣>kσ)1k2・・・(2’)
(証明)
 連続分布の場合,確率の総和は次の式で与えられる.
f(x)dx=1
 平均値は,次の式で与えられる.
m=xf(x)dx
 また,標準偏差は
σ2=(xm)2f(x)dx
標準偏差の計算を(1) |X−m|≦kσの区間と(2) |X−m|>kσの区間に分けて求め,(1)では(xm)2を0に書き換え,(2)では(xm)2k2σ2に書き換えると,被積分関数は小さく(≦)なる.
σ2=|xm|kσ(xm)2f(x)dx+|xm|>kσ(xm)2f(x)dx
|xm|kσ0dx+|xm|>kσk2σ2f(x)dx
=0+k2σ2|xm|>kσf(x)dx
 いま,(2) |X−m|>kσの区間にある確率をP(|X−m|>kσ)=Pで表すと
|xm|>kσf(x)dx=P
であるから
σ2k2σ2P
P1k2・・・(証明終わり)

※教科書,参考書によっては,「k>0の任意の定数k」に対して成立すると書かれている.
 実際,上に書いたように,k>0の任意の定数kに対して成立することが証明される,0<k≦1の場合に成立するのは当然のことで,実際にはk>1(整数に限らない)に対してのみ意味がある.
 例えば,(1’)でk=1のとき
P(Xm∣≦1×σ)>1112=0・・・(1’)
となるが,確率が正の値をとるのは当然のことです.
 また,
P(Xm∣>1×σ)112=1・・・(2’)
となるが,確率が1以下の値をとるのは当然のことです.
 k≒0(>0)たとえば,k=0.1のとき
P(Xm∣≦0.1×σ)>110.12=99・・・(1’)
となるが,確率が負の数よりも大きくなるのは当然のことです.
 また,
P(Xm∣>0.1×σ)10.12=100・・・(2’)
となるが,確率が100以下の値をとるのは当然のことです.

【例題1】
 確率変数がX={1,2,3,4,5}となる離散分布では,平均値はm=3,標準偏差はσ≒1.41になります.
 この離散分布について,k=2のとき,チェビシェフの不等式
P(Xm∣>2σ)14=0.25=25%
が成り立つことを確かめてください.
(解説)
 kは1よりも大きな正の数であれば,整数でなくても使えます.
Xm∣>2σ
すなわち
xi<m2σまたはm+2σ<xi
xi<32.82または3+2.82<xi
となるxiは1つもない(0個)から
P(Xm∣>2σ)=014=0.25=25%
は成り立つ.
 どんな確率分布に対しても,平均から標準偏差の2倍以上離れる確率(両脇の合計)は,25%以下と言えます.
P(Xm∣>2σ)14=25%
 しかし,具体的に確率分布が分かるときには,その確率分布に応じた,もっと正確な確率が求められます.(この問題では0%)
【例題2】
 平均値m,標準偏差σの正規分布(連続分布)
f(x)=12πσe(xm)22σ2
において,P(mXm+kσ)となる確率は,数学の教科書や参考書に付録している正規分布表に示されています.
(1) k=2のとき,P(mXm+2σ)=0.4772
(2) k=3のとき,P(mXm+3σ)=0.4987
 (1)(2)についてチェビシェフの不等式が成り立つことを確かめてください.
(解説)
(1)
正規分布は左右対称で,
P(mXm+2σ)=0.4772
だから
P(m2σXm+2σ)=0.4772×2=0.9544
P(Xm∣≦2σ)=0.9544
P(Xm∣>2σ)=10.9544=0.045614
だから成り立つ
(2)
P(mXm+3σ)=0.4987
だから
P(m3σXm+3σ)=0.4987×2=0.9974
P(Xm∣≦3σ)=0.9974
P(Xm∣>3σ)=10.9974=0.002619
だから成り立つ
 どんな分布であるか分からないときでも成り立つチェビシェフの不等式は,正規分布ということが分かっているときのP(Xm∣>kσ)となる正確な値よりも大雑把なものです.

【例題3】
 平均値m=50,標準偏差σ=10の確率分布があるとき,
(1) P(X<30またはX>70)となる確率を求めてください.
(2) P(35≦X≦65)となる確率を求めてください.
(解説)
 どんな確率分布であるか分からないときでも,平均値と標準偏差が与えられているときは,チェビシェフの不等式が利用できます.
(1)
P(Xm∣>2σ)14
   25%以下・・・(答)
(2)
P(Xm∣≦1.5σ)>111.52=0.555...
   55.6%よりも大・・・(答)
【例題4】
 平均値m=5,標準偏差σ=2の確率分布があるとき,
(1) P(X<3またはX>7)となる確率を求めてください.
(2) P(2≦X≦8)となる確率を求めてください.
(解説)
(1)
|3m|,|7m|=2=2σ
P(Xm∣>2σ)1(2)2=12
   50%以下・・・(答)
(2)
|2m|,|8m|=3=32σ
P(Xm∣≦3)>1σ232=79=0.777...
   77.8%よりも大・・・(答)

【例題5】
 一様分布f(x)={1(0x1)0(x<0,1<x)
について,確率P(Xm∣>1.5σ)
 (ⅰ) チェビシェフの不等式で評価する場合
 (ⅱ) 直接計算した場合
どうなりますか.
(解説)
m=xf(x)dx
=0x×0dx+01x×1dx+1x×0dx
=01xdx=[x22]01=12
σ2=(xm)2f(x)dx
=0(xm)2×0dx+01(xm)2×1dx+1(xm)2×0dx
=01(x12)2dx=[13(x12)3]01=112
σ=123
(ⅰ) チェビシェフの不等式で求めた場合
P(Xm∣>1.5σ)11.52=49=0.444..
(ⅱ) 直接計算した場合
P(Xm∣>1.5σ)=0m1.5σ1dx+m+1.5σ11dx
=[x]0m1.5σ+[x]m1.5σ1
=m1.5σ+{1(m+1.5σ)}
=13σ=1323=132
=232=0.1339..
(ⅱ) の結果は(ⅰ) の結果の範囲内にあって,より正確なものとなっている.

【例題6】
 山形の分布f(x)={x+1(1x<0)1x(0x<1)0(x<1,1x)
について,P(X∣>12)となる確率は,どうなりますか.
 (ⅰ) チェビシェフの不等式で評価する場合
 (ⅱ) 直接計算する場合
(解説)
チェビシェフの不等式を利用するためには,平均値と標準偏差が必要です.
m=xf(x)dx
=1x×0dx+10x×(x+1)dx
+01x×(1x)dx+1x×0dx
=10(x2+x)dx+01(xx2)dx
=[x33+x22]10+[x22x33]01=0
σ2=(xm)2f(x)dx
=1x2×0dx+10x2×(x+1)dx
+01x2×(1x)dx+1x2×0dx
=10(x3+x2)dx+01(x2x3)dx
=[x44+x33]10+[x33x44]01=16
σ=16
(ⅰ)チェビシェフの不等式で求める場合
σ=16=0.408...<0.5=kに注意
P(Xm∣>k)σ2k2・・・(2)
により
P(X∣>12)16(12)2=23
 (ⅱ) 直接計算する場合
右図,桃色の部分の面積を求めると,14

【例題7】
 連続分布f(x)={34(1x2)(1x1)0(x<1,1<x)
について,P(X∣>34)となる確率は,どうなりますか.
 (ⅰ) チェビシェフの不等式で評価する場合
 (ⅱ) 直接計算する場合
(解説)
m=xf(x)dx
=1x×0dx+11x×34(1x2)dx+1x×0dx
=11(xx3)dx=[x22x44]11=0
σ2=(xm)2f(x)dx
=0+11x2×34(1x2)dx+0
=3411(x2x4)dx=34[x33x55]11=15
σ=15
(ⅰ) チェビシェフの不等式で評価する場合
σ=15=0.447...<0.75=34=kに注意
P(Xm∣>k)σ2k2・・・(2)
により
P(X∣>34)15(34)2=1645
(ⅱ) 直接計算する場合
桃色の部分の面積を求めると,
2×34341(1x2)dx=32[xx33]341=11128

【例題8】
 さいころをn回投げるとき,1の目が出る回数Xは二項分布に従い
P(X=r)=nCr(16)r(56)nr
となります.このとき,平均値は
m=n6
標準偏差は
σ=5n6
になります.
 さいころを6回投げて,1の目が3回以上出る確率は,どうなりますか.
 (ⅰ) チェビシェフの不等式で評価する場合
 (ⅱ) 直接計算する場合(筆算では無理.コンピュータを使う)
(解説)
n=6のとき
m=1
σ=56
(ⅰ) チェビシェフの不等式で評価する場合
P(Xm∣>k)σ2k2・・・(2)
により
P(X1∣≧2)<5622=524
(ⅱ) 直接計算する場合
6C3(16)3(56)3+6C4(16)4(56)2+6C5(16)5(56)+(16)6
=0.0623...
意味から考えて,X=−1, −2, ...の場合はない.

【例題9】
 400人の受験者に対して,満点を100点とする数学の試験を行ったところ,平均値は45点で標準偏差は20点であった.
(1) この試験で,5点以上85点以下となる人数を,次の2つの場合について予想してください.
 ⅰ) チェビシェフの不等式で評価する場合
 ⅱ) 得点の分布が正規分布になると考えてよい場合
(2) この試験で,15点以上75点以下となる人数を,上と同様にⅰ) ⅱ) の場合について予想してください.

 なお,次の正規分布表を利用してよい.
u0.00.51.01.52.02.53.0
P(u)0.00000.19150.34130.43320.47720.49380.4987

(解説)
(1)
ⅰ) チェビシェフの不等式で評価する場合
m=45, σ=20に対して
5=m−2σ, 85=m+2σだから
P(Xm∣≦2σ)>1122=34
400×34=300
300人以上・・・(答)
ⅱ) 正規分布になると考えてよい場合
正規分布表でP(2)=0.4772だから
P(Xm∣≦2σ)=0.4772×2=0.9544
400×0.9544=381.76
382人・・・(答)
(2)
ⅰ) チェビシェフの不等式で評価する場合
m=45, σ=20に対して
15=m−1.5σ, 75=m+1.5σだから
P(Xm∣≦1.5σ)>111.52=0.5556
400×0.5556=222.24
222人以上・・・(答)
ⅱ) 正規分布になると考えてよい場合
正規分布表でP(1.5)=0.4332だから
P(Xm∣≦1.5σ)=0.4332×2=0.8664
400×0.8664=346.56
347人・・・(答)
確率統計のメニューに戻る 高校数学のメニューに戻る
■このサイト内のGoogle検索■

△このページの先頭に戻る△
【 アンケート送信 】
… このアンケートは教材改善の参考にさせていただきます

この頁について,良い所,悪い所,間違いの指摘,その他の感想があれば送信してください.
○文章の形をしている感想は全部読ませてもらっています.
○感想の内で,どの問題がどうであったかを正確な文章で伝えていただいた改善要望に対しては,可能な限り対応するようにしています.(※なお,攻撃的な文章になっている場合は,それを公開すると筆者だけでなく読者も読むことになりますので,採用しません.)


質問に対する回答の中学版はこの頁,高校版はこの頁にあります