次の式(1)のような代数不等式も,「チェビシェフの(和の)不等式」と呼ばれるが,このページで扱うチェビシェフの不等式は,確率・統計に関するもので,互いに全く別の物です.
a<b, x<y ⇒ (a+b)(x+y)≦2(ax+by)・・・(1)
【チェビシェフの不等式】
平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|≦kを満たす確率をP(|X−m|≦k)で表すと
※kは,σよりも大きい定数(整数に限定されない)
・・・(1)|X−m|>kを満たす確率をP(|X−m|>k)で表すと ・・・(2) あるいは,変数Xの値が|X−m|≦kσを満たす確率をP(|X−m|≦kσ)で表すと
※kは,1よりも大きい定数(整数に限定されない)
・・・(1’)|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと ・・・(2’) |
(解説) 起こり得るすべての場合の確率が1だから,「平均値mまでの距離がk以下」の確率が(1)式になることと,残りの「平均値mまでの距離がkよりも大きい」確率が(2)式になることとは,どちらか一方を示せば他方も成り立つ. また,「平均値mまでの距離がk以下」とするよりも「平均値mまでの距離が標準偏差σのk倍以下」という形で目盛りを考える方法もある.そこで(1)(2)でk=k’σを代入すると(1’)(2’)になり,これらを示してもよい. 以下では,(2’)を証明する. |
なお,チェビシェフの不等式は,離散分布でも,連続分布でも成り立つので,各々について証明してみる.
【チェビシェフの不等式】- - - ■離散分布の場合■
(証明)平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと ・・・(2’) 全部でn個ある確率変数 を並べ替えても,平均値m,標準偏差σに影響しないので,小さいものから順に並べかえた結果を とする. n−t個が|xi−m|≦kσで,t個が|xi−m|>kσであるとき |
標準偏差(分散)の計算において,小さい方のn−t個の(xi−m)2を0に書き換え,大きい方のt個の(xi−m)2を(kσ)2に書き換えると,和は小さく(≦)なるから |- - 初めのn−t個 - -|| - - - 後のt個 - - - | |- n−t個 -||- - t個 - -| いま,確率P(|X−m|>kσ)は, に等しいから ・・・(証明終わり)
チェビシェフの不等式は,どのような確率分布に対しても成り立つが,その代わりに証明の途中経過を見れば分かるように,大変「大雑把な比較」になっており,例えば正規分布や二項分布のように具体的な分布が仮定できる場合には,チェビシェフの不等式よりももっと精度のよい不等式が示せる.
|
【チェビシェフの不等式】- - - ■連続分布の場合■
(証明)平均値m,標準偏差σの確率分布について,変数Xの値が|X−m|>kσを満たす確率をP(|X−m|>kσ)で表すと ・・・(2’) 連続分布の場合,確率の総和は次の式で与えられる. 平均値は,次の式で与えられる. また,標準偏差は |
標準偏差の計算を(1) |X−m|≦kσの区間と(2) |X−m|>kσの区間に分けて求め,(1)では を0に書き換え,(2)では を に書き換えると,被積分関数は小さく(≦)なる. いま,(2) |X−m|>kσの区間にある確率をP(|X−m|>kσ)=Pで表すと であるから ・・・(証明終わり) |
※教科書,参考書によっては,「k>0の任意の定数k」に対して成立すると書かれている.
例えば,(1’)でk=1のとき実際,上に書いたように,k>0の任意の定数kに対して成立することが証明される,0<k≦1の場合に成立するのは当然のことで,実際にはk>1(整数に限らない)に対してのみ意味がある. ・・・(1’) となるが,確率が正の値をとるのは当然のことです. |
また, ・・・(2’) となるが,確率が1以下の値をとるのは当然のことです. k≒0(>0)たとえば,k=0.1のとき ・・・(1’) となるが,確率が負の数よりも大きくなるのは当然のことです. また, ・・・(2’) となるが,確率が100以下の値をとるのは当然のことです. |
【例題1】
(解説)確率変数が となる離散分布では,平均値は ,標準偏差は≒1.41になります. この離散分布について,k=2のとき,チェビシェフの不等式 が成り立つことを確かめてください.
kは1よりも大きな正の数であれば,整数でなくても使えます.
すなわち または または となる は1つもない(0個)から =0 は成り立つ.
どんな確率分布に対しても,平均から標準偏差の2倍以上離れる確率(両脇の合計)は,25%以下と言えます.
しかし,具体的に確率分布が分かるときには,その確率分布に応じた,もっと正確な確率が求められます.(この問題では0%) |
【例題2】
(解説)平均値 ,標準偏差 の正規分布(連続分布) において, となる確率は,数学の教科書や参考書に付録している正規分布表に示されています. (2) k=3のとき, (1)(2)についてチェビシェフの不等式が成り立つことを確かめてください. (1) 正規分布は左右対称で, だから だから成り立つ (2) だから だから成り立つ
どんな分布であるか分からないときでも成り立つチェビシェフの不等式は,正規分布ということが分かっているときの
となる正確な値よりも大雑把なものです. |
【例題3】
(解説)平均値m=50,標準偏差σ=10の確率分布があるとき, (1) P(X<30またはX>70)となる確率を求めてください. (2) P(35≦X≦65)となる確率を求めてください.
どんな確率分布であるか分からないときでも,平均値と標準偏差が与えられているときは,チェビシェフの不等式が利用できます.
(1)25%以下・・・(答) (2) 55.6%よりも大・・・(答) |
【例題4】
(解説)平均値m=5,標準偏差 の確率分布があるとき, (1) P(X<3またはX>7)となる確率を求めてください. (2) P(2≦X≦8)となる確率を求めてください. (1) 50%以下・・・(答) (2) 77.8%よりも大・・・(答) |
【例題5】
(解説)一様分布 について,確率 を (@) チェビシェフの不等式で評価する場合 (A) 直接計算した場合 どうなりますか. |
(@) チェビシェフの不等式で求めた場合 (A) 直接計算した場合 (A) の結果は(@) の結果の範囲内にあって,より正確なものとなっている. |
【例題6】
(解説)山形の分布 について, となる確率は,どうなりますか. (@) チェビシェフの不等式で評価する場合 (A) 直接計算する場合
チェビシェフの不等式を利用するためには,平均値と標準偏差が必要です.
|
(@)チェビシェフの不等式で求める場合 により (A) 直接計算する場合 右図,桃色の部分の面積を求めると, |
【例題7】
(解説)連続分布 について, となる確率は,どうなりますか. (@) チェビシェフの不等式で評価する場合 (A) 直接計算する場合 |
(@) チェビシェフの不等式で評価する場合 により (A) 直接計算する場合 桃色の部分の面積を求めると, |
【例題8】
さいころをn回投げるとき,1の目が出る回数Xは二項分布に従い となります.このとき,平均値は 標準偏差は になります. さいころを6回投げて,1の目が3回以上出る確率は,どうなりますか. (@) チェビシェフの不等式で評価する場合 (A) 直接計算する場合(筆算では無理.コンピュータを使う) |
(解説) n=6のとき (@) チェビシェフの不等式で評価する場合 ・・・(2) により (A) 直接計算する場合
意味から考えて,X=−1, −2, ...の場合はない.
|
【例題9】
400人の受験者に対して,満点を100点とする数学の試験を行ったところ,平均値は45点で標準偏差は20点であった. (1) この試験で,5点以上85点以下となる人数を,次の2つの場合について予想してください. @) チェビシェフの不等式で評価する場合 A) 得点の分布が正規分布になると考えてよい場合 (2) この試験で,15点以上75点以下となる人数を,上と同様に@) A) の場合について予想してください. なお,次の正規分布表を利用してよい.
|
(解説) (1) @) チェビシェフの不等式で評価する場合
m=45, σ=20に対して
A) 正規分布になると考えてよい場合5=m−2σ, 85=m+2σだから 300人以上・・・(答)
正規分布表でP(2)=0.4772だから
(2)約382人・・・(答) @) チェビシェフの不等式で評価する場合
m=45, σ=20に対して
A) 正規分布になると考えてよい場合15=m−1.5σ, 75=m+1.5σだから 222人以上・・・(答)
正規分布表でP(1.5)=0.4332だから
約347人・・・(答) |