≪Excelを使った対応のない場合のt検定≫…例題・問題 ■対応のない場合のt検定 2群の母集団平均を比較したいときに,第1群のデータと第2群のデータが「同一被験者に対する2つの条件での観測結果」「各組が兄弟の身長データ」「各組が数学の得点の等しい生徒の英語の得点」などのように,単にデータ件数が同数であるだけでなく第1群のデータと第2群のデータの間に対応がある場合は,「対応のある場合のt検定」を用いることができる. これに対して,2群のデータ相互の間には個別の対応がない場合は「対応のない場合のt検定」を用いる.
図1
対応のない場合のt検定は,2群の標本数が等しい場合にも等しくない場合にも使えるが,2群の分散が等しいと見なせる場合と等しいとは見なせない場合とでは適用する公式が異なるので,対応のない場合のt検定を行うためには,初めに分散が等しいと見なせるかどうかの検定(F検定)を行う.
例1
右図2は20匹の鶏のうち半数の10匹に飼料1を,残りの10匹に飼料2をそれぞれ1か月間与えたときの体重増加(g)を表しているものとする. これら2種類の飼料による体重の増加には有意差があるかどうか検定してください.
読者がデータを転記するときも,図2のデータを画面上でドラッグ→反転表示→右クリック→コピー→Excelのワークシート左上端に貼り付けるものとする.(以下の問題についても同様) (*) 飼料1のデータと飼料2のデータはたまたま同数になっているが,これは以下の検定の進め方に関係ない.それぞれの横の並びのデータには何も対応がないということが重要.(20匹の鶏のうち半数を飼料1に残り半数を飼料2に割り当てただけだから.) (1) F検定を行う
「対応のない場合のt検定」を行うためには,あらかじめこれら2群のデータの分散が等しいと見なせるかどうか調べなければならない.
※Excelの「分析ツール」を利用するためには
Excel2010, Excel2007のときExcel2010の場合
ファイル→オプション→アドイン→(下端の管理欄がExcelアドインとなっているときにその右の[設定]をクリック)→分析ツールにチェックを付ける→OK
Excel2007の場合
メニューのうち[ホーム]の左にある丸いOfficeボタンをクリック→下端にあるExcelのオプション→アドイン→(下端の管理欄がExcelアドインとなっているときにその右の[設定]をクリック)→分析ツールにチェックを付ける→OK
Excel2002の場合
ツール→アドイン→分析ツールにチェックを付ける→OK
データ→データ分析 Excel2002のとき ツール→分析ツール →F検定:2標本を使った分散の検定→
・変数1の入力範囲(1)として B1:B11と書きこむ
(または入力欄の右にあるをクリックし,B1からB11までドラッグする.)
・変数2の入力範囲(2)として C1:C11と書きこむ
(または入力欄の右にあるをクリックし,C1からC11までドラッグする.)
・上記のように変数1,2の入力範囲が飼料1,飼料2というラベルを含んでいる場合は,ここで[ラベル]にチェックを付ける.
(入力範囲をB2:B11およびC2:C11としたときはこの[ラベル]にはチェックを付けない.その場合は,左にある欄が分析ルールの出力結果において「変数1」として,右にある欄が「変数2」として表示されるが,分析ツールを利用するときはラベルを含めるようにする方が見やすく分かりやすい.ただし,ラベル自体を数値の1とか2とかにすると,データ範囲と混同した時にエラーが検出されないので,ラベルには必ず文字列を使用するようにする.)
・α欄は有意水準で,デフォルトで0.05が書きこまれている(有意水準5%で検定することを表している.有意水準1%の検定を行う場合はこの数字を0.01にする.)
・何度も検定を行うときに,出力オプションを新規ワークシートや新規ブックにしているとワークシートやExcelファイルがどんどん増えてややこしくなるので,データの右側などの見やすい範囲に出力するようにするためには,「出力オプション」で「出力先」を選ぶと右の空欄が書き込めるようになるので,そこに出力したい範囲の左上端のセル番地を書きこむ.この場合,すでにあるデータが上書きされるおそれがあるときは警告が出る.
→OK次の表のような出力結果が得られる.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
【出力結果の読み方】
⇒ 観測された分散比が1.69でF境界値片側が3.18であるから,F値が境界値よりも小さく分散には有意差が認められず,等分散とみなせる. (または,P片側が0.22で5%(0.05)よりも大きいから,分散には有意差が認められず,等分散とみなせる.) 図4 図3の例では26.681/15.75122222=1.693900297が5%境界値よりも小さいので有意差がないと判断する.この分散比は左欄に置いたデータの分散を右欄に置いたデータの分散で割ったものとなっているので,教科書通りにF検定を行うためには,分散の大きい方のデータを左欄に置かなければならない. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
しかし,どちらの分散が大きいかはやってみないと分からないので,あらかじめ分散を計算することなくF検定を行ったとき,左欄の分散が右欄の分散よりも小さくなってしまった場合には,次の図のように分散比が0に近いほど(小さいほど)分散に有意差があることになる.(分散比が1に近ければ2つの分散は等しいと見なせるが,分子が小さくなるほど分散比は0に近づく.)
図5
|
(2) t検定を行う
上記の例では等分散となったので,「分差が等しい場合のt検定」を行う.Excel2010, Excel2007のとき データ→データ分析 Excel2002のとき ツール→分析ツール
→t
検定:等分散を仮定した2標本による検定→
・変数1の入力範囲(1)として B1:B11と書きこむ
(または入力欄の右にあるをクリックし,B1からB11までドラッグする.)
・変数2の入力範囲(2)として C1:C11と書きこむ
(または入力欄の右にあるをクリックし,C1からC11までドラッグする.)
・上記のように変数1,2の入力範囲が飼料1,飼料2というラベルを含んでいる場合は,ここで[ラベル]にチェックを付ける.
(入力範囲をB2:B11およびC2:C11としたときはこの[ラベル]にはチェックを付けない.
・「母集団平均が等しい」という帰無仮説に対応するためには,仮説平均との差異の欄を0にする.(平均の差が0という仮説を検定する)
(この欄は空欄のままでもデフォルトで0が入る)
・α欄は有意水準で,デフォルトで0.05が書きこまれている(有意水準5%で検定することを表している.有意水準1%の検定を行う場合はこの数字を0.01にする.)
・何度も検定を行うときに,出力オプションを新規ワークシートや新規ブックにしているとワークシートやExcelファイルがどんどん増えてややこしくなるので,データの右側などの見やすい範囲に出力するようにするためには,「出力オプション」で「出力先」を選ぶと右の空欄が書き込めるようになるので,そこに出力したい範囲の左上端のセル番地を書きこむ.この場合,すでにあるデータが上書きされるおそれがあるときは警告が出る.
→OK次の表のような出力結果が得られる.
【出力結果の読み方】
⇒ t値が-3.4で両側検定の境界値が2.1であるから,|t|>2.1となって平均に有意差がある. この分析ツールでは左欄(飼料1)の平均が右欄(飼料2)の平均よりも小さいときにt値が負(逆ならば正)で表示され,[t境界値両側]よりも絶対値が大きければ外側に来る. (または,P両側が0.003で5%(0.05)よりも小さいから有意差がある.) ※ |t| の値は外側に行くほど大きくなる. 図7 (ア) |t値|>t境界値 両側 (イ) p値<0.05 のいずれかで有意差があると判断できる. 図8
帰無仮説 H0:μ1=μ2
対立仮説 H1:μ1<μ2 この場合は,出力結果のうち片側の方を見ることになる.片側検定の境界値は両側検定のときよりも内側に来るので有意差は認められやすくなる.(上記の出力結果のうち,t 境界値 片側 1.734063592,t 境界値 両側 2.100922037 を見ると片側の方が小さい.) |
右の表はある学級の生徒25人(男子15人,女子10人)の数学の得点であるとする.男子と女子とで平均値に有意差があるかどうか検定してください. 空欄を埋めてください.なお,小数は第3位を四捨五入して小数第2位まで求めてください.
F検定については分析ツールを用いると次のように出力されるので,1.83, 3.03, 0.18 の順に答える.(p値の順序に注意)
t検定については分析ツールを用いると次のように出力されるので,2.33, 2.07, 0.03 の順に答える.(p値の順序に注意)
|
右の表は2つのクラスA,Bの生徒についてある値を測定した結果だとします.これら2つのクラスの平均に有意差があるかどうか検定してください. 空欄を埋めてください.なお,小数は第3位を四捨五入して小数第2位まで求めてください.
F検定については分析ツールを用いると次のように出力されるので,3.16, 3.02, 0.04 の順に答える.(p値の順序に注意)
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
t検定については分析ツールを用いると次のように出力されるので,2.64, 2.14, 0.02 の順に答える.(p値の順序に注意)
|
右の表はある教科を旧方式で指導した学級と新方式で指導した学級のテスト結果だとします.新方式の指導方法には効果があると言えるかどうか検定してください. 空欄を埋めてください.なお,小数は第3位を四捨五入して小数第2位まで求めてください.
与えられた表のままExcelの分析ツールによるF検定を行うと,新方式(右の欄)の分散の方が大きいため,次のように分散比,F境界値が1よりも小さな値で表示される.このまま判断するときは観測された分散比0.79がF境界値片側よりも大きいから分散には有意差がないと判断する.(P値は埋められるがF値は各々の逆数で答えることになる:F値は1/0.79=1.27,F片側境界値は1/0.4026=2.48,p値はそのまま0.33でよい.)
)
題意にそって分散比が1よりも大きくなるようにとるには,左欄と右欄を入れ替えてF検定を行い,下の表をもとに判断すればよい.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
F検定により等分散と見なせるから,等分散の場合のt検定を行う.その際,左欄に旧方式の得点を置くときは左欄の平均が低いのでt値が負の値になるがその絶対値とt境界値とを比較する.
|
@Excel2007〜2010, web上にあるフリーのExcel onlineで行う場合
Aフリーの統計ソフトRで行う場合
右図2は20匹の鶏のうち半数の10匹に飼料1を,残りの10匹に飼料2をそれぞれ1か月間与えたときの体重増加(g)を表しているものとする. これら2種類の飼料による体重の増加には有意差があるかどうか検定してください.
F検定→T検定の2段階で行う場合
@Excelの分析ツールを使う場合データ→データ分析→F検定 ⇒次のように出力される F-検定: 2 標本を使った分散の検定 飼料1 飼料2 平均 85.71 92.73 分散 26.681 15.751.. 観測数 10 10 自由度 9 9 観測された分散比 1.693.. P(F<=f) 片側 0.222.. F 境界値 片側 3.178.. データ→データ分析→t-検定: 等分散を仮定した2標本による検定 ⇒次のように出力される t-検定: 等分散を仮定した2標本による検定 飼料1 飼料2 平均 85.71 92.73 分散 26.681 15.7512.. 観測数 10 10 プールされた分散 21.216.. 仮説平均との差異 0 自由度 18 t -3.407.. P(T<=t) 片側 0.001.. t 境界値 片側 1.734.. P(T<=t) 両側 0.003.. t 境界値 両側 2.100.. もしくは,|t|値=3.407>2.100だから有意差が認められる
【結果のまとめ方】
表1は20匹の鶏のうち半数の10匹に飼料1を,残りの10匹に飼料2をそれぞれ1か月間与えたときの体重増加(g)を表している.
*p<.05, **p<.01
|
@Excelのワークシート関数で行う場合 関数FTEST(A群, B群)は,A群とB群の分散の差異が認められない「両側確率」を返す. F検定を両側検定で行うと,分散に差異がある場合だけでなく,一致し過ぎる「≒0」場合も検出する. しかし,ほとんどのF検定で,分散に有意差があると見なすときは,一致する場合は含めないので,F検定は片側検定で行う. 右図のように,片側確率が5%以下であるかどうかを検定するには FTEST(A群, B群)/2
とするとよい.結果⇒0.222.. p値>0.05だから等分散という仮定は棄却されない.
=TTEST(A群, B群, 2, 2)
• 第3引数は,片側検定のとき1,両側検定のとき2・・・この問題では,「2」の両側検定を指定
結果⇒0.0031..• 第4引数は,t検定の種類を指定する.この問題のような「等分散が仮定できるt検定」の場合は「2」 ※なお,前,後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される. p値だけで判断するときは,ここまででよいが,一般的な報告書のようにt値も付けるには
=TINV(上記のp値, 自由度)
とする.=TINV(0.0031,18)結果⇒3.408.. 結果をまとめるには,この他に各群の平均と不偏分散[標本の個数N−1で割る方]が必要であるから,=AVERAGE( ), =VAR( )で求めておく.
【結果のまとめ方】
ARによる場合前述と同様 F検定を行う Rのvar.test( )関数は,第3引数以下を略すると両側検定になるが,F検定を通常の意味に使うには,第1引数に示される群を分子としたときの片側検定にすべきだから,名前タグalternative="greater"を指定して,前の群が大きくなる片側検定とする. > food1<-c(84.8,89.3,89,89.4,77.4,90.3,89.9,84.5,86.4,76.1) > food2<-c(99.6,91.3,92.5,87.7,91.2,99.4,91.1,88.8,91.8,93.9) > var.test(food1,food2,alternative="greater") F test to compare two variances data: food1 and food2 F = 1.6939, num df = 9, denom df = 9, p-value = 0.2222 alternative hypothesis: true ratio of variances 等分散を仮定した2標本によるt検定を行う > t.test(food1,food2,var.equal=TRUE) Two Sample t-test data: food1 and food2 t = -3.4079, df = 18, p-value = 0.003136 alternative hypothesis: true difference in means もしくは,95%信頼区間に「0」が含まれないから,差が0に等しいと言えない. なお,t値も使って結果を出すには,関数qt(確率, 自由度)を使う.この問題のように,両側検定でt境界線を求めるには,確率として0.025を使う. qt(0.025, 18)
⇒−2.10⇒|t|値=3.40>2.10だから有意差が認められる.
【結果のまとめ方】
前述と同様 |
Welch検定で行う場合
@Excelの分析ツールを使う場合データ→データ分析→t-検定: 不等分散を仮定した2標本による検定 ⇒次のように出力される t-検定: 分散が等しくないと仮定した2標本による検定 飼料1 飼料2 平均 85.71 92.73 分散 26.681 15.751.. 観測数 10 10 仮説平均との差異 0 自由度 17 t -3.407.. P(T<=t) 片側 0.001.. t 境界値 片側 1.739.. P(T<=t) 両側 0.003.. t 境界値 両側 2.109.. もしくは,|t|値=3.407>2.100だから有意差が認められる
【結果のまとめ方】
@Excelワークシート関数で行う場合
表1は20匹の鶏のうち半数の10匹に飼料1を,残りの10匹に飼料2をそれぞれ1か月間与えたときの体重増加(g)を表している.
*p<.05, **p<.01
※Welch検定を用いたことは,自由度が18よりも小さいことで分かる.
=TTEST(A群, B群, 2, 2)
• 第3引数は,片側検定のとき1,両側検定のとき2・・・この問題では,「2」の両側検定を指定
結果⇒0.0033..• 第4引数は,t検定の種類を指定する.この問題のような「不等分散のt検定」の場合は「3」 ※なお,前,後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される. p値だけで判断するときは,ここまででよいが,一般的な報告書のようにt値も付けるには
=TINV(上記のp値, 自由度)
とする.=TINV(0.0031,17)結果⇒3.4040..
【問題点あり】
また,両側検定t値の境界値は=TINV(0.05,17)⇒2.10..による
結果をまとめるには,この他に各群の平均と不偏分散[標本の個数N−1で割る方]が必要であるから,=AVERAGE( ), =VAR( )で求めておく.
このようにワークシート関数で計算するには「自由度」を使わなければならないが,Welch検定の自由度は,分析ツールの場合とは異なり,自動では計算されないので,次の公式に代入して自分で計算するしかない. この問題では,16.88≒17
【結果のまとめ方】
前述と同様 |
ARによる場合> food1<-c(84.8,89.3,89,89.4,77.4,90.3,89.9,84.5,86.4,76.1) > food2<-c(99.6,91.3,92.5,87.7,91.2,99.4,91.1,88.8,91.8,93.9) > t.test(food1,food2,var.equal=FALSE) Welch Two Sample t-test data: food1 and food2 t = -3.4079, df = 16.88, p-value = 0.003378 alternative hypothesis: true difference もしくは,95%信頼区間に「0」が含まれないから,差が0に等しいと言えない. なお,t値も使って結果を出すには,関数qt(確率, 自由度)を使う.この問題のように,両側検定でt境界線を求めるには,確率として0.025を使う. qt(0.025, 17)
⇒−2.10..⇒|t|値=3.41>2.10だから有意差が認められる.
【結果のまとめ方】
(気になること)前述と同様 ここまでやってくると,どの方法でやっても,そこそこ一致するように見えるが,小数第4位5位あたりで「微妙に合わない」
|
右の表2は2つのクラスA,Bの生徒についてある値を測定した結果だとします.これら2つのクラスの平均に有意差があるかどうか検定してください.
F検定→T検定の2段階で行う場合
@Excelの分析ツールを使う場合データ→データ分析→F検定 ⇒次のように出力される F-検定: 2 標本を使った分散の検定 Aクラス Bクラス 平均 14.57 14.1 分散 0.246.. 0.078 観測数 10 11 自由度 9 10 観測された分散比 3.163.. P(F<=f) 片側 0.043564.. F 境界値 片側 3.020382.. もしくは,観測された分散比=3.163>F境界値片側=3.02038だから不等分散と見なせる. データ→データ分析→t-検定: 分散が等しくないと仮定した2標本による検定 ⇒次のように出力される t-検定: 分散が等しくないと仮定した2標本による検定 Aクラス Bクラス 平均 14.57 14.1 分散 0.246.. 0.078 観測数 10 11 仮説平均との差異 0 自由度 14 t 2.636927722 P(T<=t) 片側 0.009760438 t 境界値 片側 1.761310115 P(T<=t) 両側 0.019520876 t 境界値 両側 2.144786681 もしくは,t値=2.6369>t境界値両側=2.1447だから有意差が認められる.
【結果のまとめ方】 表2は2つのクラスの平均値と分散である.
*p<.05, **p<.01
@Excelワークシート関数で行う場合関数FTEST(A, B)は,AとBの分散の差異が認められない「両側確率」を返す. F検定を両側検定で行うと,分散に差異がある場合だけでなく,一致し過ぎる「≒0」場合も検出する. しかし,ほとんどのF検定で,分散に有意差があると見なすときは,一致する場合は含めないので,F検定は片側検定で行う. 右図のように,片側確率が5%以下であるかどうかを検定するには FTEST(A, B)/2
とするとよい.結果⇒0.043564.. p値<0.05だから等分散という仮定は棄却される.
=TTEST(A, B, 2, 3)
• 第3引数は,片側検定のとき1,両側検定のとき2・・・この問題では,「2」の両側検定を指定
結果⇒0.0196285..• 第4引数は,t検定の種類を指定する.この問題のような「等分散が仮定できないt検定」の場合は「3」 ※なお,前,後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される. |
p値だけで判断するときは,ここまででよいが,一般的な報告書のようにt値も付けるには
=TINV(上記のp値, 自由度)
とする.=TINV(0.0196285,14)結果⇒2.634108.. 両側検定のt 境界値も付けるには=TINV(0.05,14)⇒2.144786681
【問題点あり】
結果をまとめるには,この他に各群の平均と不偏分散[標本の個数N−1で割る方]が必要であるから,=AVERAGE( ), =VAR( )で求めておく.
このようにワークシート関数で計算するには「自由度」を使わなければならないが,Welch検定の自由度は,分析ツールの場合とは異なり,自動では計算されないので,次の公式に代入して自分で計算するしかない. この問題では,13.88≒14
【結果のまとめ方】
ARによる場合前述と同様 F検定を行う Rのvar.test( )関数は,第3引数以下を略すると両側検定になるが,F検定を通常の意味に使うには,第1引数に示される群を分子としたときの片側検定にすべきだから,名前タグalternative="greater"を指定して,前の群が大きくなる片側検定とする. > a<-c(15.3,14.9,14.5,14.4,14,13.9,14.1,14.7,15.3,14.6) > b<-c(13.9,14.2,14.1,14.3,14.1,13.7,14.7,13.9,14.1,13.8,14.3) > var.test(a,b,alternative="greater") F test to compare two variances data: a and b F = 3.1638, num df = 9, denom df = 10, もしくは,比の95%信頼区間に「1」が含まれないから,比が1に等しいと言えない. 等分散を仮定した2標本によるt検定を行う.関数t.test( )において第3引数以下を省略すれば,Welch検定になる. > t.test(a,b) Welch Two Sample t-test data: a and b t = 2.6369, df = 13.884, p-value = 0.01963 alternative hypothesis: true difference in means もしくは,95%信頼区間に「0」が含まれないから,差が0に等しいと言えない. なお,t値も使って結果を出すには,関数qt(確率, 自由度)を使う.この問題のように,両側検定でt境界線を求めるには,確率として0.025を使う. qt(0.025, 13.884)
⇒−2.146469⇒|t|値=2.6369>2.146469だから有意差が認められる.
【結果のまとめ方】
前述と同様
Welch検定で行う場合
この問題では,、第1段階のF検定を行わずに,不等分散の場合のT検定を行うと,@Excelツール,@Excel関数,ARを使う場合のいずれの場合も,上記の結果と同じになる.
(気になること)ここまでやってくると,どの方法でやっても,そこそこ一致するように見えるが,小数第4位5位あたりで「微妙に合わない」 原因の1つとして,Rでは小数のままで自由度を扱うが,Excelでは四捨五入して整数にするということがあるかもしれん.⇒p値,t値,t境界線に影響
|
【例3】
この問題では,F検定で等分散の仮定が棄却されないので,従来方式でF検定→T検定と進める場合と,初めからWelch検定で行う場合に用いるT検定の種類が異なる.しかし,実際に行ってみると結果はほとんど変わらない.
Welch検定で行う場合
ARで行う場合> t.test(b,g) Welch Two Sample t-test data: b and g t = 2.4819, df = 22.669, p-value = 0.02093 alternative hypothesis: true difference in means もしくは,95%信頼区間に「0」が含まれないから,差が0に等しいと言えない. なお,t値も使って結果を出すには,関数qt(確率, 自由度)を使う.この問題のように,両側検定でt境界線を求めるには,確率として0.025を使う. qt(0.025, 22.669)
⇒−2.07033⇒|t|値=2.4819>2.07033だから有意差が認められる. また,報告書に分散も付けるには,関数var(変数)が使える. var(b)⇒59.49524, var(g)⇒32.48889 |
【結果のまとめ方】
表3はある学級の生徒25人(男子15人,女子10人)の数学の得点の平均と分散である.
*p<.05, **p<.01
※この問題では,等分散を仮定したt検定でもWelch検定でも,自由度≒23でほとんど差がない.
|
@Excel分析ツールで行う場合 データ→データ分析→t-検定: 分散が等しくないと仮定した2標本による検定 ⇒次のように出力される t-検定: 分散が等しくないと仮定した2標本による検定 男子 女子 平均 64.06666667 57.4 分散 59.4952381 32.48888889 観測数 15 10 仮説平均との差異 0 自由度 23 t 2.481895019 P(T<=t) 片側 0.010403777 t 境界値 片側 1.713871517 P(T<=t) 両側 0.020807553 t 境界値 両側 2.068657599 もしくは,t値=2.4818>t境界値両側=2.06865だから有意差が認められる.
【結果のまとめ方】
※Rの数字とExcel分析ツールの数字は,小数第2位,第3位あたりから微妙に食い違う.この原因として,Rは自由度として小数値を用いているのに対して,Excelは四捨五入した整数値を用いていることが考えられる.
@Excelのワークシート関数で行う場合前述と同様 TTEST(男子範囲,女子範囲,2,3)⇒確率:p値
第3引数は,片側検定の場合は1,両側検定の場合は2.この問題では2
なお,t検定の報告書によく示されるようにt値やt境界値も計算するには,関数TINV( )を利用する.第4引数は,不等分散の場合は3 ⇒ p値=0.020929361が返される. ⇒ p値<0.05だから平均値に有意差が認められる. TINV(確率,自由度)⇒t値
第1引数に,上記で求めたp値を使えば,t値が返される
TINV(0.020929361,22.669)⇒2.487519727第1引数に,0.05を代入すれば,t境界値が返される ※ただし,自由度は の公式を使って,自分で計算しなければならない.意外な弱点でもあるが,これを使えばExcelで小数の自由度が処理できる長所もある. TINV(0.05,22.669)⇒2.073873058 平均や分散は各々aVERAGE(), VAR()で求めておく.
【結果のまとめ方】
(参考)3種類の検定の比較前述と同様
|
(気楽な雑談.茶飲み話)・・・よい子の皆さんは眉に唾を付けてください
ν=(m−1)+(n−1) とする. • これに対して,Welch検定の自由度は とされているが,この式がなかなか煩雑で覚えにくい.そこで,正確ではなくても,だいたいの見当の付け方を庶民感覚で考えてみた. バス代のように大人料金と小人料金で全然違う金額を集めるときは,大人の人数を数えて,子人はまとめて大人の何人分になるかと換算してから足せばよいと考える. もっと卑近な例では,町内に大豪邸数軒とボロアパート多数があるとき,町内の宅地面積を数えるには,大豪邸の軒数を数えたらよい. |
|||||||||||||||||||||||||||
• 等分散を仮定した場合のt検定における自由度は,大人も小人も平等に「頭数」を数えていることになる.[平等主義]
• Welch検定の自由度は,大人の人数に換算するとだいたいの数字が出る.[金額重視] |
F検定→T検定の2段階で行う場合
この問題について,F検定によって等分散の仮定は棄却されない.そこで,等分散を仮定したt検定を行うと,p値=0.02866で有意差が認められる.Welch検定の場合と比較して,p値は少し大きくなるが「平均値の有意差が認められる」という結論は同じになる. 「Welch検定だけで行う」「F検定→T検定の2段階で行う」の2つの立場があるが,理論的なことは別として,これら2つの方式で結論が逆になるのはどの様な場合かを数値実験で調べて見た. (十分な調査をやったわけではないので,結果は鵜呑みにできないという前提で)
• F検定で等分散の仮定が棄却されず,t検定で2つに分かれて,かつ結果が食い違う具体例を幾つか作る.
• 実際には,どちらの方式でやっても(p値の微妙な差はあるが)5%有意差の有無について同じ結果になるのがほとんどで,逆に食い違う例を作るのは,それなりに根気のいる作業になる.筆者は半日を費やした. • Welch検定のp値と等分散のt検定のp値の大小は,どちらの場合もあるから,どちらの方式で有意差が出やすいと,一律には言えない. • 標本数が概ね25〜30以上になると(大標本になると),z検定となって,差は出にくいから,標本数が20以下の場合を調べる. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
分散(標準偏差)の大きい側を太字で示す.
不等分散のpが0.05以下か否かは,分散の大きい側だけで判断して,平均±1.96σの範囲内に相手方の平均があるかどうか見た場合とほぼ一致する. 等分散のpは標準偏差を按分したもので同様に平均±1.96σの範囲内に相手方の平均があるかどうか見た場合とほぼ一致する. 表の赤字は有意差あり,下線は有意差なし. |
(携帯版)統計メニューに戻る ...メニューに戻る ...t検定(解説) ...演習問題1(対応のあるt検定) |