■検定 ・・・ 標本が大きく (概ねn が30以上)正規分布が使える場合 ○ 要点 一方の集団の母平均の信頼区間に,他方の集団の母平均がなければ,これら2つの母平均は等しくないと考えてよい. ・・・ 例えば,一方の母平均の推定において,95%の信頼区間よりも外に他方の母平均があれば,検定においては,5%の有意差があると考えるとよい. |
◇簡単な例でイメージ作り(1)◇ 例1 あるスポーツでは先攻後攻をコインのトスで決めている.このコインが正しく作られているか否かをテストするために,50回投げたところ,表が35回出た. このコインは正しいと言えるか?(考え方) コインのトスの結果は偶然に支配されるので,テストしたときに表がちょうど半分出るとは限らない. コインの表が出る回数は二項分布 B(n, p) をなし,試行回数が多いときは正規分布 N(np, np(1-p) )と見なしてよい.→ このコインは正しく作られていない. |
正規分布表で下図のように真ん中部分が95%になるのは(右が47.5%になるのは) p(u) = 0.475
となる u の値から,u = 1.96 |
◇少しだけ理屈を ! (1)◇偶然に支配される世界を扱っているので,100%確実とは言えないが,コインが正しく作られていると見なす範囲をかなり広くとって確率95%で採択しているのに,その範囲に入らない. |
※ 正しいものを間違っていると判断する誤りを第1種の過誤という.左の説明は,第1種の過誤を犯す危険率αを5%ないし1%にとることを表わしている. 常識的に考えれば,危険率は小さい方が望ましいが第1種の過誤を小さくとり過ぎると,帰無仮説の採択域が大きくなり「間違っているものも正しものに入れてしまう過誤」:第2種の過誤を犯す確率(β)が大きくなる.βは標本の大きさ n を大きくとることにより低く押さえることができる. (標本数を大きくすると分布が分かれる) |
◇簡単な例でイメージ作り(2)◇ 例2 あるサイコロが正しく作られているかどうか調べるために600回投げてテストしてみたところ,1の目が90回出た.有意水準5%として,このサイコロが正しく作られているかどうか判断せよ.(考え方) 1の目が出る回数は二項分布 B(n, p) に従い,試行回数が多いときは正規分布 N(np, np(1-p))と見なしてよい. μ-1.96σ=82.1,μ+1.96σ=117.9 このような場合,仮説 p = 1/6 は棄却できないが,正しいとも言い切れない. |
左の解説ではサイコロが正しいときの確率分布の95%内に標本の測定値が入るかどうかで考えたが,標本分布の95%内に母平均が入るかどうかで考える解説書もある.
すなわち,左の解説は μ-1.96σ<m<μ+1.96σ・・・(1) を元に考えているが 母比率の推定: μ=100, n =600, m=90, R=n/m, p = μ/n とすると(2)は m-1.96<μ<m+1.96 nが十分大きいときR ≒ p だから,これは μ-1.96<m<μ+1.96 |
◇少しだけ理屈を ! (2)◇元の仮説を「帰無仮説」といいH0で表わす. |
元の仮説の採択される範囲が95%,棄却される範囲が5%という基準は,元の仮説に対して非常にゆるく,対立仮説に対して厳しいものとなっている. このため,元の仮説が採択されても p =1/6 であると主張するための積極的な根拠とはならない. 実際,n = 90回は,p = 1/7, p = 1/8の場合でも95%の範囲に入る. ※ 帰無仮説が採択されたら,検定は無に帰してしまう.帰無仮説が棄却されて対立仮説が採択されるときのみ検定として積極的な判断ができる. ⇒ 言いたくない方を帰無仮説に,言いたい方を対立仮説に選ぶことが重要. |
◇簡単な例でイメージ作り(3)◇ 例3 ある規格の鶏卵は重さの平均61(g),標準偏差1(g)の条件を満たすものと定められている.ある日,出荷予定の鶏卵100個を抽出検査した結果,平均が59.0(g)であったとき,この日出荷予定の鶏卵は規格の範囲内にあるといえるか.有意水準5%で検定せよ.(考え方) 帰無仮説H0:出荷予定の鶏卵の重さμ=61 |
※ m - 1.96 ≦μ≦ m + 1.96
の範囲に入るかどうか調べる.※ 母標準偏差σが分かっているときは,これを使う. この式は, -1.96≦≦1.96 左の問題では,z = (59-61)/0.1=-20 < -1.96となって帰無仮説は棄却される. 他の解説書やソフトの利用も考えると,z値に慣れる方が分かりやすい. |
◇簡単な例でイメージ作り(4)◇ 例4 春に1群の稚魚であった養殖魚を2つの池に分けて飼育し,秋に100尾ずつ標本を抽出して体重を測定したところ,A池の養殖魚は平均体重20(g),標準偏差3(g),B池の養殖魚は平均体重21(g),標準偏差4(g)であった.B池の養殖魚が良く育っていると言えるか.α=0.05で検定せよ.(考え方) 帰無仮説H0:平均体重 μ1 = μ2 |
確率変数の変換に関する性質から,2つの確率変数X, Y について期待値は E(aX + bY) = aE(X) + bE(Y) 2つの変数X, Yが独立ならば,分散は V(aX + bY) = a2V(X) + b2V(Y) が成り立つ. したがって,2つの独立な確率変数については E(X - Y) = E(X) - E(Y) V(X - Y) = V(X) +V(Y) が成り立つ. そこで, 平均の差を検定するときは z = を有意水準と比較する. |
標本の大きさ n が概ね30以上のときは,標本平均は正規分布をなすと見なしてよい. (1) 母数(母集団が満たす値・・・母平均,母比率など)に関する帰無仮説H0を決める. 例 母平均μ = 10 帰無仮説は,母数がある値に等しいという形で決める.(不等号で表わされるような帰無仮説ではそれに基づく計算が複雑すぎて検定できない.) (言いたくない方を帰無仮説に選ぶ) (2) 帰無仮説が棄却されたときに採択される対立仮説H1を定める.(調べたい事柄に応じて両側検定,片側検定を選ぶ.) 例 母平均μ≠10 (μ>10,μ<10) (言いたい方が対立仮説になるようにする) (3) 有意水準(危険率)を5%ないし1%に設定する. (4) 標本について求めた量が帰無仮説の棄却域に入れば,帰無仮説を棄却して対立仮説を採択する.帰無仮説の採択域に入れば,帰無仮説は棄却はされないが,積極的な判断はできない. (計算結果がp値 [有意確率・・・帰無仮説を前提としたときに,その値よりも外側に来る確率] で表示される場合には, p値<有意水準 のとき帰無仮説を棄却する.) |
(i) 両側検定 ア) 有意水準5%(α=0.05)のとき が±1.96の外にあれば棄却 イ) 有意水準1%(α=0.01)のとき が±2.58の外にあれば棄却 (ii) 片側検定 ア) 有意水準5%(α=0.05)のとき 右側:>1.65のとき棄却 左側:<-1.65のとき棄却 イ) 有意水準1%(α=0.01)のとき 右側:>2.33のとき棄却 左側:<-2.33のとき棄却 ※ 比率を調べるときは ※ 平均の差を検定するときは z = を有意水準と比較する. |
(1) 1枚の硬貨を200回投げたとき表が85回出た.この硬貨の表裏は等しい確率で出ると言えるか.有意水準5%で検定せよ.
|
(1) H0:表の出る確率は p = 0.5 H1:表の出る確率は p ≠ 0.5
μ= 100,σ= = 7.07,m = 85
z = (85-100)/7.071 =-2.12<-1.96帰無仮説は棄却される.表裏は等しい確率では出ない. (別解) H0:表の出る確率は p = 0.5 H1:表の出る確率は p ≠ 0.5 R = 85/200=0.425 z = (R - p)/ = -2.12<-1.96により棄却 表裏は等しい確率では出ない. |
(2) ある製品の出荷基準として平均重量55(g),標準偏差1(g)以下と定められているとき,母集団から400個を抽出して検査したところ,平均重量が54.8(g)であったとき,この母集団は出荷基準を満たしていると考えてよいか.有意水準5%で検定せよ. | (2) H0:母平均 μ = 55 H1:母平均 μ ≠ 55 m = 54.8,σ= 1 (母標準偏差が与えられているときはこれを使う) z = (m-μ)/ = -4.0<-1.96 帰無仮説は棄却される. 出荷基準を満たしていない. |
(3) ある議員が現在審議中の条例改正案について有権者の支持状況を無作為聞き取り調査で実施したところ,40人中24人が賛成と回答した.この条例改正案は有権者の過半数の支持を得ていると考えてよいか.有意水準5%で検定せよ. また,400人中の240人が賛成の場合はどうか. |
(3) H0:p = 0.5 H1:p > 0.5(片側検定とする) n = 40,R = 24/40 = 0.6 (母比率が与えられていないので R で代用) z = (R - p)/ =(0.6-0.5)/0.0775 = 1.29<1.65 帰無仮説は棄却できない.(半数またはそれ以下の可能性がある.) n = 400, R = 240/400 = 0.6 のときは z = (R - p)/ =(0.6-0.5)/ 0.0245 = 4.08>1.65 帰無仮説は棄却される.過半数の支持を得ている. |
■[個別の頁からの質問に対する回答][検定について/17.8.15]
こんにちは。例と答え⑴でz = (85-100)/7.071 =-2.12<-1.96となっていますが、この7.071で割るところに疑問があります。どうして他の問題ではσ/√nで割っているのに、今回はσで割っているのでしょうか? 拙い質問ですがお答えいただけると幸いです。宜しくお願い致します。
■[個別の頁からの質問に対する回答][検定について/17.2.5]
=>[作者]:連絡ありがとう. 1階の試行で事象Aの起こる確率がpのとき,この独立な試行をn回繰り返すときにできる確率分布は二項分布と呼ばれで表されます.二項分布はnが十分大きな値であるとき,期待値,標準偏差の正規分布とみなすことができます.したがって,二項分布については …(A) が標準正規分布になると考えます. これとは別の話として,母平均m,母標準偏差σが既知である母集団から大きさnの標本を抽出したときの標本平均は …(B) の標準正規分布をなします. (1)の問題は(A)で解きます.もっと気の利いた説明ができるとよいのですが,確かにそのページの解説は分かりにくいので,機会があれば直さないといけないようです. 大変わかりやすく、助かりました。
■[個別の頁からの質問に対する回答][検定について/17.1.24]
=>[作者]:連絡ありがとう. 例3の右側の解説についてです。
「左の問題では,z = (59-61)/0.1=-2.0 < -1.96となって帰無仮説は棄却される」となっていますが、(59-61)/0.1=-20となるように思われます。
■[個別の頁からの質問に対する回答][検定について/17.1.24]
=>[作者]:連絡ありがとう.訂正しましたが−20<−1.96は成り立ちます.(もっと微妙な問題にしないと離れすぎだろ!と突っ込みどころ満載になってしまった) 例題(2)は出荷基準がある値以下であるのに、どうして片側検定でないのでしょうか?
=>[作者]:連絡ありがとう.まず両側検定にするか片側検定にするかはデータから自動的に決まるのではなく,分析者が何に関心があるかによって決まるということを押さえておきましょう.ある値から離れていたら困る場合は両側検定に,ある値よりも小さければ困るが大きいのは構わないという場合は片側検定と考えましょう. さて,標準偏差1(g)以下と,言葉としては「以下」と言っていますが の「範囲内にある」というのが帰無仮説なので,その両側に外れたら棄却域になります.だから両側検定で調べようと考えたわけです. |