■二項分布 【要約】 確率変数 X が二項分布 B(n, p) に従うとき,q = 1 - p とすると
期待値は E(X) = np ・・・(1)
分散は V(X) = npq ・・・(2) 標準偏差は σ(X) = ・・・(3) |
例1 1枚の硬貨を10回投げるとき,表の出る回数の期待値と標準偏差を求めよ. (答案)
E(X) = 10× = 5
σ(X) = = 例2 さいころを360回投げたとき,1の目の出る回数の期待値と分散を求めよ。 (答案)
E(X) = 360× = 60
V(X) = 360×× = 50 |
||||||||
【要約】・・・二項分布の正規分布による近似 nが十分大きいとき,二項分布 B(n, p) は,正規分布 N(np, npq) で近似できる. ・・・(4) (※np > 5 かつ nq > 5 を満たせば「十分大きい」とみなしてよいとされている(*1).実際上,二項分布として直接計算するのが大変な大きなnについては,正規分布と見なして求めるとよい.) |
例3 1枚の硬貨を400回投げるとき,表が230回以上出る確率を求めよ.なお,次の正規分布表を利用してよい.
m = 400× = 200
P(X≧ 230) = P(X≧ m + 3σ)を正規分布で近似すると,0.5-0.4987=0.0013V(X) = = 100,σ(X) = 10 |
■まったくの初心者向け■ 【 二項分布の簡単な例 】 1個のさいころを1回投げて1の目が出る確率は, このとき,さいころを5回投げたとき1の目が2回出る確率は
10 ()2()3
一般に,さいころを5回投げたとき1の目がk回出る確率は
5Ck()k()5-k
そこで,「さいころを5回投げたとき1の目が出る回数 X を確率変数とするとき, X の確率分布」は次のようになる. X の期待値は, 分散は,E(X2) - E(X)2 |
5回の内1が2回出るのは,
(1)(1)(1以外)(1以外)(1以外) → ()2()3
(1)(1以外)(1)(1以外)(1以外) → ()2()3 (1)(1以外)(1以外)(1)(1以外) → ()2()3 (1)(1以外)(1以外)(1以外)(1) → ()2()3 ・・・ (1以外)(1以外)(1以外)(1)(1) → ()2()3 のいずれでもよい.5回の内1の目が出る番号を2つ選ぶ方法は 5C2 = = 10 通りあるから, 結局, さいころを5回投げたとき1の目が2回出る確率は
10 ()2()3 |
||||||||||||||||
上の例から分かるように,1回の試行で事象Aの起こる確率がpのとき,この試行をn回行って事象Aがk回起こる確率は, q = 1 - p として
【二項分布とは】 1回の試行で事象Aの起こる確率がp のとき,この試行を n 回行ったときに事象Aが起こる回数をXとおくとき,Xは確率変数となり, となる.このような確率分布を二項分布といい, B(n, p) で表わす. |
※ 二項分布は次のような確率分布となる.
※ 二項分布の記号B(n, p) は,「1回の試行でその事象が起こる確率がp である試行を n 回繰り返したときの二項分布 (Binomial distribution) 」と言葉で書くことを記号で書いたものと考えればよく,この記号に関数としての値を考えることはない. 同様に,正規分布の記号N(m, σ2) は,「期待値が m,分散がσ2の 正規分布 (normal distribution)」と言葉で書くことを記号で書いたものと考えればよく,この記号に関数としての値を考えることはない. → 二項分布の記号 B(試行回数,1回当りの成功確率) → 正規分布の記号 N(期待値,分散) |
||||||||||||||||
【なぜ二項というか?】 この確率分布関数 nCk pkqn-k が二項の和のn乗 (p + q)n の展開式となっているからである. |
【公式の解説】 (1)← 1回の試行で事象Aが起こる確率がpとなる試行をn回繰り返すとき, 第k回で事象Aが起これば1,起こらなければ0となる確率変数Xkを用いると (*「確率変数の変換」参照) E(Xk) = 0・q + 1・ p = p ( k = 1,2,…,n ) V(Xk) = E(Xk2) - E(Xk)2= 02・ q + 12・ p - p2 = p - p2 =p(1 - p) = pq ( k = 1,2,…,n ) E(X) =E(X1)+E(X2)+ … +E(Xn) = np (2)← 各回の試行は独立である(お互いに影響されない)から, V(X) =V(X1)+V(X2)+ … +V(Xn) = npq (3)← 標準偏差は分散の正の平方根だから明らか. (4)← ここでは,数学的な解説は省略するが,まず次の例から,nが大きくなると「左右対称になる」「なめらかな富士山型に近づく」ことを視覚的につかむことが大切. |
[参考] 高校の今の教育課程で,二項係数(nCk)の和の性質を教えることはめったにない・・・「組合せ」(数学A)を済ませてかつ時間に余裕がある受験系,数学Cを選択しかつその学校が確率分布を扱いかつ時間に余裕がある場合など f(x) = (x + 1)n とおくと f(x) = nC0 + nC1x +nC2x2 + ・・・+nCnxn だから f(1)=nC0 + nC1 +nC2 + ・・・+nCn=2n・・・(1) 次に,各々のnCkに異なる数kを掛けるには,微分するとちょうどkが掛けられることを利用して f’(x)=n(x+1)n-1= nC1 +2nC2x + ・・・+nnCnxn-1 だから xf’(x)=nx(x+1)n-1= nC1 x+2nC2x2 + ・・・+nnCnxn ・・・(2) x=1を代入すると nC1 +2nC2 + ・・・+nnCn =n2n-1 さらに(2)を微分して両辺にxを掛けるなどの変形により 二項係数(nCk)の和の性質を用いて,E(X) ,V(X)を求めることができるが,計算量はかなり多くなる. |
【Excelで二項分布を求めるには?】 → 二項分布とは上の水色で示したような表(各々の確率変数 X の値に対する確率の対応表)なので,Excelでは各々の X の値に対して nCk pkqn-k を計算すればよい. この目的のためには,関数 BINOMDIST(成功数,試行回数,成功率,関数形式) が使える. 例えば,1つの値 10C4 0.340.76 を計算するには,その値を書き込みたいセルに直接 = BINOMDIST(4,10,0.3,0)と書き込むか,または,メニューから「挿入」→「関数」→「統計」→BINOMDIST として
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
B(5, 0.3) の例 この表を作成するには,B3において=BINOMDIST(B2,$B$1,$D$1,0) を1つ作成し,C3〜G3へコピー・貼り付けすればよい.
|
さいころを投げる場合のように,p が分数の場合 (Excel上では四捨五入した小数として表示するものとして) B(3, 1/6) の例 この表を作成するには,D1に =1/6と記入する他は左の例と同様
|
(3) 硬貨を400枚投げたとき,表の出る枚数が180枚以上220枚以下となる確率を求めよ.なお,次の正規分布表を利用してよい.
確率: (※小数第4位まで求めよ) |
◇参考◇
左の問題(最大確率の問題)は,筆算でも解くことができる.
p=1/6 として 50Ck+1pk+1(1-p)50-k-1 > 50Ckpk(1-p)50-k となるkの範囲を求めると, これより,・・・<5<6<7<8>9>10>・・・が分かる. →閉じる← |
|
(*1)引用 |