=== 読者が配色を変更したい場合 ===
◎外側の色を変えるには,次の色をクリック
《体験・入門レベル》
== フィッシャーの正確確率検定 == R version 4.0.3, 4.0.4Patched ----- 最終更新年月日:2021.4.27
この教材は,体験・入門のレベルで,30分から1時間ほどで「そこそこ分かる」ことを目指す.
フィッシャーの正確確率検定
1. 2×2クロス集計表の有意差検定
ただし,この表の場合のように観測度数の小さいセルが含まれる場合は,「カイ2乗検定」を適用することはできず,フィッシャーの正確確率検定(直接確率計算)によって判断することになる. フィッシャーの正確確率検定は,理屈上は観測度数が大きな値のセルばかりの場合にも適用できるが,非常に大きな数の掛け算・割り算になり,実際に使えるかどうかはそのコンピュータ(ソフト)の性能次第になる. |
2. フィッシャーの正確確率の考え方
2.1 片側検定
2×2クロス集計表では,与えられた周辺和(表1では,10, 12, 22, 9, 13)を満たすセルの値は,自由度1で決まる.例えば,表1において「男子・美術」を1名とすると,男子の計が10になるためには,「男子・音楽」は9名に決まる.また,美術の計を9名とするためには,「女子・美術」は8名に決まる.最後に,「女子・音楽」は4名になる.このように,1つのセルの値を決めると,他のセルの値は自動的に決まる・・・このことを自由度1という. 赤で示したセルは両方とも減るか増えるかの運命を共にする.また,青で示したセルも運命を共にする. カイ2乗検定の場合でも,フィッシャーの正確確率検定の場合でも,「ちょうど」このような2×2クロス集計表になる確率を求める訳ではない.この表で言えば,赤色のセルの値が「これ以上少ないことは起こり得るか」,青のセルの値が「これ以上多くなることは起こり得るか」と考える. つまり,次のような確率を求めて「めったに起こらないp<.05」かどうかを判断する.
美術選択者を軸に,このような場合の数を計算すると, ア)男子10名の内2名が美術を選択する場合の数は10C2, 女子12名の内7名が美術を選択する場合の数は12C7, このような選択の仕方は10C2×12C7=75×792=35,640通り イ)男子10名の内1名が美術を選択する場合の数は10C1, 女子12名の内8名が美術を選択する場合の数は12C8, このような選択の仕方は10C1×12C8=10×495=4,950通り ウ)男子10名の内0名が美術を選択する場合の数は10C0, 女子12名の内9名が美術を選択する場合の数は12C9, このような選択の仕方は10C0×12C9=1×220=220通り 合計40,810通り 他方,合計22名の内10名が美術を選択する場合の数は22C10=497,420通り 結局,「これ以上ひどくなる確率」は 40,810÷497,420=0.08204(>.05)となり有意差は見られない.すなわち,性別による芸術選択の違いには有意差はなかった. 以上は,片側検定の場合(すなわち,「男子の美術選択者がこんなに少ないこと」「女子の美術選択者がこんなに多い多いこと」は起こり得るかという問いに対する答)となっている. 一般に,差異があるという場合に,逆方向の差異の確率も求めて「両側検定」とする場合もある. |
2.2 両側検定
男女の芸術選択に差異があるかどうかという場合には,前述の2.1の片側確率だけでなく,逆向きにズレている場合も含めて考えることがある.
両側検定にするためには,「片側確率を単純に2倍にしても一致するとは限らない」「片側で求めたセルの数値をひっくり返せばよい訳ではない」ことに注意する.
D=ad−bc が,大きいかどうかで判断する. 比較したい初めの表では,D=8×7−2×5=46であるから,逆向きの場合も含めて |D|=|ad−bc|≧46 の場合を「ズレている」と見なすことにする.
そこで,両側検定の場合は,上記のエオカの確率を加える. エ) 10C7×12C2=120×66=7,920通り オ) 10C8×12C1=45×12=540通り カ) 10C9×12C0=10×1=10通り 合計8,470通り.確率は 8,470÷497,420=0.01703 両側合計は,0.09907(>.05)となって,両側検定でも有意差なしとなる. |
2.3 補足説明(連関係数)
a+b=r1, c+d=r2, a+c=c1, b+d=c2 a+b+c+d=nとする. 周辺和が一定のとき,クラメールの連関係数は,行列式によって決まる.
例えば,右の表2.3.2のように,周辺和に比例して決まるセルの値が実際の観測値と一致している場合には,男女の別と芸術選択は独立になり,この場合D=30−30=0となる.
例えば,右の表2.3.3のように,男子が音楽に,女子が美術に偏っている場合は,男女別と芸術選択は独立ではなく,強い連関がある.この場合D=72−6=66となる.
逆に,右の表2.3.4のように,男子が美術に,女子が音楽に偏っている場合は,男女別と芸術選択は独立ではなく,強い連関がある.この場合D=6−72=−66となる. 以上のように,2つの質的変数(男女別と芸術選択)が独立に近いほどDは0に近くなり,一方に偏っていれば|D|が大きくなる.
• 両側検定において,逆向きの偏りが同じ程度であるかどうかの目安に|D|を使うことができる.
• Rの片側検定において,alternative="g"(大きい方)とするか="l"(小さい方)とするかは,Dの大きい方を数えるか,小さい方を数えるかに対応する. |
2.4 男子を軸に計算した場合
前述の2.1,2.2では美術選択者を軸に確率を計算したが,男子(もしくは女子)を軸に計算することもできる.・・・どちらかを決めれば他方は決まる.
男子を軸に,このような場合の数を計算すると, ア)音楽選択者13名のうち男子が8名である場合の数は13C8, 美術選択者9名のうち男子が2名である場合の数は9C2, このような選択の仕方は13C8×9C2=1,287×36=46,332通り イ)音楽選択者13名のうち男子が9名である場合の数は13C9, 美術選択者9名のうち男子が1名である場合の数は9C1, このような選択の仕方は13C9×9C1=715×9=6,435通り ウ)音楽選択者13名のうち男子が10名である場合の数は13C10, 美術選択者9名のうち男子が0名である場合の数は9C0, このような選択の仕方は13C10×9C0=286×1=286通り 合計53,053通り 他方,合計22名の内10名が男子である場合の数は22C10=646,646通り 結局,「男子が音楽ばかりになる確率」は 53,053÷646,646=0.08204(>.05)となり有意差は見られない. 上記のエオカの場合から,逆向きの極端な場合も求めると,同様にして,両側確率が0.09907となる. |
2.5 統計用フリーソフトRで計算する場合
• Rのコンソール画面で,次のように入力して行列を作る
mx<-matrix(c(8,2,5,7),2,2,byrow=T)• 次にフィッシャー検定の関数にその行列を渡す. fisher.test(mx)⇒ 既定値で両側検定の結果が得られる. p-value = 0.09907(>.05)だから有意差なし • 片側検定を行うには,alternative="greater"(または="g")により連関係数の大きい方(Dの大きい方),alternative="less"(または= fisher.test(mx,alternative="g")⇒ p-value = 0.08204(>.05)だから有意差なし なお,alternative="two.sided"もしくは省略で両側検定, |
3. 演習問題
ア) 新しい教え方A方式は,従来のB方式と比べて分かり易いと言えるか.片側検定で判断してください. イ) これら2つの方式は,分かり易さに差異があると言えるか.両側検定で判断してください. 5よりも小さい値のセルがあるので,カイ2乗検定に依らずに,フィッシャーの正確確率検定で判断する. 統計用フリーソフトRを用いる場合
以上のように,元の行列に対して連関係数(または行列式)が大きい方に向かって集計するから,alternative="g"とする. > mx<-matrix(c(9,3,7,8),2,2,byrow=T) > fisher.test(mx,alternative="g")⇒ p-value = 0.1368となって,片側検定で有意差は認められない.・・・ア) 次に,両側検定を行う. fisher.test(mx)⇒ p-value = 0.2388となって,両側検定も有意差は認められない.・・・イ) |
Excelで行う場合(フィッシャー検定の関数がないので,次のように計算式で埋めて行く)
=SUM(B5:E5)→1,783,431 総数=COMBIN(27,11)→13,037,895 片側確率:1,783,431/13,037,895=0.136,788,262となって,片側検定で有意差は認められない.・・・ア) 両側確率を求めるにあたって,逆向きの組合せの範囲は
=SUM(B5:F5)→1,330,407 総数=COMBIN(27,11)→13,037,895 片側確率:1,330,407/13,037,895=0.102,041,549 両側確率:0.238,829,811となって,両側検定でも有意差は認められない.・・・イ) |
ア) 数学が嫌いな生徒は英語が好きであると言えるか.片側検定で判断してください. イ) 数学と英語の好き嫌いは独立であると言えるか.両側検定で判断してください. 5よりも小さい値のセルがあるので,カイ2乗検定に依らずに,フィッシャーの正確確率検定で判断する. 統計用フリーソフトRを用いる場合
以上のように,元の行列に対して連関係数(または行列式D)が小さい方に向かって集計するから,alternative= > mx<-matrix(c(7,10,9,3),2,2,byrow=T) > fisher.test(mx,alternative="l")⇒ p-value = 0.07621となって,片側検定で有意差は認められない.・・・ア) 次に,両側検定を行う. fisher.test(mx)⇒ p-value = 0.1297となって,両側検定でも有意差は認められない.・・・イ) |
Excelで行う場合(フィッシャーの正確確率検定の関数がないので,次のように計算式で埋めて行く) @:16C9×13C3=11,440×286=3,271,840 A:16C10×13C2=8,008×78=624,624 B:16C11×13C1=4,368×13=56,784 C:16C12×13C0=1,820×1=1,820 片側小計3,955,068 総計:29C12=51,895,935 片側確率:3,955,068÷51,895,935=0.076211518(>.05)となって,片側検定で有意差は認められない.・・・ア) 両側確率を求めるにあたって,逆向きの組合せの範囲は
同様にして,D〜Hまでを加えると,2,778,321 片側確率:2,778,321/51,895,935=0.053,536,39 両側確率:0.129,747,908となって,両側検定でも有意差は認められない.・・・イ) |