t検定

== t検定 ==

【要約】
　２群の平均に有意差があるかどうかを調べる検定は，伝統的には，次の３つに分けて行う

(1) データに対応があるとき ⇒ 対応のあるt検定
(2) データに対応がなく，2群間に等分散性が仮定できるとき ⇒ スチューデントのt検定
(3) データに対応がなく，2群間に等分散性が仮定できないとき ⇒ ウェルチのt検定

　なお，最近では「データに対応のない場合には，等分散を仮定できるか否かに関わらずウェルチのt検定で行う」という立場も有力です．
すなわち，

(1) 対応のあるｔ検定
(3) ウェルチのt検定

の２つに分ける

この教材では，対応がないときのｔ検定について，上記の学説の優劣を判断していません．読者に判断してもらうための材料を提供しているレベルですのでよろしく．（２群の要素数が僅差であるような場合を除けば，多くの場合にWelch検定の方が自由度がかなり小さくなるので，レポートを見れば，どちらのｔ検定を用いたのかは分かると言われています．）

【平均の差の検定：要約】
◎　前提：以下において母集団は正規分布に従うとする．

　幾つかのグループの「平均の差」が偶然的な誤差の範囲にあるものかどうかを判断したいとき，データの個数が少ないときは偶然的な誤差の範囲も大きくなるが，データの個数が多くなると平均の差が大きな値となることはめったにない．
　同一の母集団からの標本と見なしたときに２つのグループの平均の差が両側5%の確率の範囲に入るようなことはめったになく，このような場合は平均に有意差があるとして異なる母集団から取り出された標本であったと見なせる．

　ｔ検定
　ｔ検定は２つのグループの平均の差が偶然誤差の範囲内にあるかどうかを調べるものである．

データの個数と偶然の範囲

　(1)　データに対応があるときのｔ検定
　「それぞれの被験者が２つのテストＡ，Ｂを受けたときの平均点の比較」のようにグル-プＡのデータとグループＢのデータに同一被験者のデータという対応があるとき，これら２つのテストの平均点の差に有意差があるかどうかは「対応があるときのｔ検定」を用いる．
　データに対応があるときは，単にデータの個数が等しいだけでなく，対応するデータ間の差を求めることができるので，それらの差の平均と分散から有意差を判断できる．

データに対応があるとき

　(2)　データに対応がないときのｔ検定
A)　従来から行われてきた方法は，次のように２つのグループの分散が等しいか否かによって，ｔ検定の種類を分けて行う．

分散がほぼ等しいと見なせる場合と分散が等しいとは見なせない場合に応じて，各々「分散が等しいときのｔ検定」「分散が等しくないときのｔ検定」を適用する．
分散が等しいかどうかの判断はF検定によって行う．

データに対応がないとき

対応があるとき	（等分散であるか否かを調べる必要はない）対応がある場合のｔ検定
対応がないとき	F検定を行う	分散が等しい（と見なせる）とき	分散が等しいときのｔ検定を行う（さらにデータの個数が異なるときは数学公式としては別の公式となるがExcel上では意識する必要なし）
		分散が等しくない（と見なせる）とき	分散が異なるときのｔ検定を行う（ウェルチ検定）

B)　最近有力となっている方法は，分散が等しいか否かに関わらずウェルチの検定で行うものです．

従来から行われてきた方法については，次のような問題点を指摘されることがあります．
ⅰ) ２つのグループの分散が「等しい場合」「等しいかどうか疑わしい場合」「等しくない場合」があるときに，従来の考え方でF検定によって「等しくない」とされるのは，等しいという帰無仮説が棄却される場合に限られるが，実際には，「ほとんどの場合は疑わしい」のに「等しいと見なせる場合の公式を当てはめる」ことになっていて，つじつまが合わない．
ⅱ) F検定の上にｔ検定を重ねて用いると，誤差が膨らんでくる．
そこで，２つのグループの分散が等しいか否かに関わらずウェルチの検定を１回で行うものです．

対応があるとき	等分散であるか否かを調べる必要はない対応がある場合のｔ検定
対応がないとき	ウェルチ検定を行う

※ｔ分布において「外側5%の範囲にあれば同一母集団からの標本ではなく，有意差があると考える」．
95%信頼区間の外側に来る確率を p とするとき，

pの値	有意差についての用語
p>0.1	有意でない有意差はない
0.05<p<0.10	有意傾向である
p<0.05	←ほとんどの場合はこれでよい有意である有意差がある
p<0.01	ほとんどの場合有意水準5%で判断すればよい（特別な事情があるとき有意水準として［外側に来る確率］1%を用いることもある．この場合，有意水準1%で有意差があるとすればよい．）

※F分布において「確率が上側5%の範囲にあれば分散が等しくないと考える」．

※　与えられた自由度に対するｔ値が95%の信頼区間の外にある=外側の確率が5%以下　→　平均値に有意差がある．
（有意水準5%がよく使われる．）

※　分母分子の自由度に対応するＦ値が95%の信頼区間の外にある=外側の確率が5%以下　→　分散に有意差がある．
（有意水準5%がよく使われる．F分布表[5%点]は分母分子で決まる２つの自由度に対して上側確率が5%となるFの値を示している．）

※　F検定は両側確率で求める場合もある．両側5%のとき片側2.5%となる．

筆者が作動確認したのは，次の4種類です
①Excel2007　②Excel2010　
③Web上にあるフリーのExcel Online

④統計用フリーソフトR

例１　･･･対応がある場合の例

表１

	A	B	C
1	No	1回目	2回目
2	1	54.3	56.5
3	2	55.2	54.8
4	3	55.0	58.2
5	4	56.4	57.8
6	5	53.1	59.0
7	6	53.1	60.7
8	平均	54.51	57.83

　表１は1つの母集団から抽出された標本について垂直跳びのテスト(単位cm)を２回実施したデータで，2回目は筋力トレーニング実施後のテストとする（架空データ）．これら２回の平均値に有意差があるかどうか判断したいとき
(1)　（対応があるときは分散が等しいかどうかによって適用公式は変らないから，Ｆ検定は行わなくてもよい．）
(*)　対応がある場合のｔ検定を行う：

①Excel2007　②Excel2010　③Excel Online
①②③に共通の操作

ワークシート関数TTESTを用いる場合

=TTEST(B2:B7,C2:C7,2,1)
　･･･［第３引数は両側検定のとき2，片側検定のとき1］
　･･･［第4引数は対応のある場合1，等分散が仮定できるとき2，非等分散のとき3］
は0.04050となり，0.04...＜0.05だから，２回の平均値に有意差があると判断できる．

分析ツールを用いる場合

(1)　（Ｆ検定は行わなくてもよい．）
(2)　一対の標本による平均の検定を行う：
　データ→データ分析→
分析ツール→「ｔ検定 : 一対の標本による平均の検定ツール」→[ＯＫ]→
変数１の入力範囲：

　→　$B$2:$B$7
変数２の入力範囲：

　→　$C$2:$C$7
範囲にラベルを含めていなければ，「ラベル」にチェックをしない．
「仮説平均との差異」を空欄のままにするかまたは0を記入すれば帰無仮説として平均が等しいとした場合になる．
αは初期設定のままで0.05となる． ↓

次の出力が得られる
t-検定 : 一対の標本による平均の検定ツール

	変数 1	変数 2
平均	54.508	57.833
分散	1.690	4.139
観測数	6	6
ピアソン相関	-0.563
仮説平均との差異	0
自由度	5
t	-2.745
P(T<=t) 片側	0.020
t 境界値片側	2.015
P(T<=t) 両側	0.04..
t 境界値両側	2.571

※ |ｔ| の値は外側に行くほど大きくなる．

　このとき，両側確率5%となる境界値を与えるｔの値が「ｔ境界値両側」と表示されている値なので
（ア）　|ｔ値|>ｔ境界値両側
（イ）　p値<0.05
のいずれかで有意差があると判断できる

P(T<=t) 両側　0.04..＜0.05だから，２つの母集合の平均値に有意差があると判断できる．
または，2.571＜| -2.745|だから，２つの母集合の平均値に有意差があると判断できる．

④Rにおける操作

> first<-c(54.3,55.2,55,56.4,53.1,53.1)
> second<-c(56.5,54.8,58.2,57.8,59,60.7)
> t.test(first,second,paired=TRUE)

        Paired t-test

data:  first and second
t = -2.7459, df = 5, p-value = 0.04051
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -6.4215895 -0.2117438
sample estimates:
mean of the differences 
              -3.316667

　以上の出力から，p値=0.04051<0.05だから有意差があると判断できる
　または，95%信頼区間−6.4215895～−0.2117438の中に「0」が入ってないから，平均値の差は「0」でないと言ってもよい．

例２　･･･対応がなく等分散の場合の例

表２

	A	B	C
1	No	Aグループ	Bグループ
2	1	31	29
3	2	29	31
4	3	30	32
5	4	32	30
6	5	28
7	6	29
8	平均	29.83	30.50

○　表２のように２つの異なるグループから抽出された標本のデータ（長さ，重さ，得点など）があるとき，これら２つの母集団の平均に有意差があるかどうか判断したいとき

①Excel2007　②Excel2010　③Excel Online
①②③に共通の操作

ワークシート関数 FTEST, TTESTを用いる場合

(1)　まずＦ検定を行い，分散に有意差があるかどうか調べる

=FTEST(B2:B7,C2:C5)　は0.88となり，両側確率で0.88だから片側確率は 0.44 となり，0.44＞0.05だから，２つの母集合の分散に（有意水準5%で）有意差はないと判断できる．

(2)　等分散のときのｔ検定を行う

=TTEST(B2:B7,C2:C5,2,2)
　･･･［2：両側検定，2：等分散］
は0.48となり，0.48＞0.05だから，２つの母集合の平均値に有意差はないと判断できる．（見かけの差は誤差の範囲である．）

分析ツールを用いる場合

(1)　まずＦ検定を行い分散に有意差があるかどうか調べる

　メニュー→ツール→分析ツール→「F-検定 : 2 標本を使った分散の検定」→[ＯＫ]→
変数１の入力範囲：

　→　$B$2:$B$7
変数２の入力範囲：

　→　$C$2:$C$5
範囲にラベルを含めていなければ，「ラベル」にチェックをしない．
αは初期設定で0.05となっている

F-検定 : 2 標本を使った分散の検定

	変数 1	変数 2
平均	29.83	30.50
分散	2.17	1.67
観測数	6	4
自由度	5	3
観測された分散比	1.30
P(F<=f) 片側	0.44
F 境界値片側	9.01

⇒ 0.44＞0.025だから，２つの母集合の分散に有意水準5%で有意差はないと判断できる．

(2)　等分散のときのｔ検定を行う：

t-検定 : 等分散を仮定した２標本による検定

	変数 1	変数 2
平均	29.83	30.50
分散	2.17	1.67
観測数	6	4
プールされた分散	1.98
仮説平均との差異	0
自由度	8
t	−0.73
P(T<=t) 片側	0.24
t 境界値片側	1.86
P(T<=t) 両側	0.48
t 境界値両側	2.31

P(T<=t) 両側　0.48..＞0.05だから，２つの母集合の平均値に有意差はないと考える．
または，|−0.73|＜2.31だから，２つの母集合の平均値に有意差はないと考える．

④Rにおける操作

> a_group<-c(31,29,30,32,28,29)
> b_group<-c(29,31,32,30)
> var.test(a_group,b_group)

        F test to compare two variances

data:  a_group and b_group
F = 1.3, num df = 5, denom df = 3, p-value = 0.8828
alternative hypothesis: true ratio of variances
 is not equal to 1
95 percent confidence interval:
  0.08733728 10.09266633
sample estimates:
ratio of variances 
               1.3

　p値=0.8828>0.05だから２つの母集団の分散に有意差はないと考える
　または，母分散の比の95%信頼区間が「1」を含むから，母分散の比は統計的に等しいと考えます

-----------------

> t.test(a_group,b_group,var.equal=TRUE)

        Two Sample t-test

data:  a_group and b_group
t = -0.73413, df = 8, p-value = 0.4838
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -2.760758  1.427425
sample estimates:
mean of x mean of y 
 29.83333  30.50000

　p値が0.4838>0.05だから２つの母集合の平均値に有意差はないと考える．
　または，95%信頼区間−2.760758～1.427425が「0」を含むから，平均値の差は「0」であると考えてもよい．

★分散が等しいか否かに関わらずウェルチの検定で行う場合

例２’　･･･対応がなく等分散の場合の例

表２［再掲］

	A	B	C
1	No	Aグループ	Bグループ
2	1	31	29
3	2	29	31
4	3	30	32
5	4	32	30
6	5	28
7	6	29
8	平均	29.83	30.50

①Excel2007　②Excel2010　③Excel Online
①②③に共通の操作

ワークシート関数TTEST()を用いる場合

不等分散のときのｔ検定を行う

=TTEST(B1:B7,C1:C5,2,3)
　･･･［2：両側検定，3：不等分散］
は0.4736...となり，0.4736...＞0.05だから，２つの母集合の平均値に有意差はないと判断できる．（見かけの差は誤差の範囲である．）

　ワークシート関数TTEST()を用いる場合は，この例のように列ラベル（Aグループ，Bグループ）を範囲に含めて指定しても，=TTEST(B2:B7,C2:C5,2,3)のように､列ラベルを範囲に含めずに指定しても，同じ結果が得られる．（文字列から成るラベルの有無は自動判別される）

分析ツールを用いる場合

不等分散のときのｔ検定を行う：

t-検定 : 分散が等しくないと仮定した２標本による検定

	変数 1	変数 2
平均	29.83	30.50
分散	2.17	1.67
観測数	6	4
仮説平均との差異	0
自由度	7
t	−0.75
P(T<=t) 片側	0.23
t 境界値片側	1.89
P(T<=t) 両側	0.47
t 境界値両側	2.36

P(T<=t) 両側　0.47..＞0.05だから，２つの母集合の平均値に有意差はないと考える．
または，|−0.75|＜2.36だから，２つの母集合の平均値に有意差はないと考える．

　分析ツールを利用する場合に，列ラベル（Aグループ，Bグループ）を範囲に含めて指定して「ラベル」にチェックを入れておけば，出力結果にラベルが反映される．
　列ラベルを範囲に含めずに指定して「ラベル」のチェックをはずしておけば，この例のように出力結果に「変数 1」「変数 2」というラベルが付けられる．

④Rにおける操作

> a_group<-c(31,29,30,32,28,29)
> b_group<-c(29,31,32,30)
> t.test(a_group,b_group)

        Welch Two Sample t-test

data:  a_group and b_group
t = -0.75593, df = 7.2059, p-value = 0.4737
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -2.740051  1.406718
sample estimates:
mean of x mean of y 
 29.83333  30.50000

　p値が0.4737>0.05だから２つの母集合の平均値に有意差はないと考える．
　または，95%信頼区間−2.74..～1.40..が「0」を含むから，平均値の差は「0」であると考えてもよい．

Rのt.test()関数では，
[1] 等分散を仮定しないということを，第３引数に var.equal=FALSEと書く

t.test(a_group,b_group,var.equal=FALSE)

[2] 第３引数を省略して，次の形に書いてもWelch検定になる

t.test(a_group,b_group)

[*] なお，等分散を仮定するとき：var.equal=T, TRUE, 1は可能ですが，小文字を含む書き方var.equal=t, True, trueなどは使えないようです．
　同様にして，不等分散を仮定するとき：var.equal=F, FALSE, 0は可能ですが，小文字を含む書き方var.equal=f, False, falseなどは使えないようです．

例３　･･･対応がなく不等分散の場合の例

表３

	A	B	C
1	No	甲	乙
2	1	0.987	1.037
3	2	1.723	3.125
4	3	3.1	1.88
5	4	2.143	3.805
6	5	1.212	1.108
7	6	1.483	3.985
8	7	2.31	3.71
9	8	1.45	1.323
10	9	2.077	1.03
11	10	1.155	3.93
12	11	1.467
13	12	1.34

○　表３のように２つの異なるグループから抽出された標本のデータ（長さ，重さ，得点など）があるとき，これら２つの母集団の平均には有意差があるかどうか判断したいとき

①Excel2007　②Excel2010　③Excel Online
①②③に共通の操作

ワークシート関数 FTEST, TTESTを用いる場合

(1)　まずＦ検定を行い，分散に有意差があるかどうか調べる

=FTEST(B2:B13,C2:C11)　は0.017となり，両側確率が0.017だから片側確率は 0.0085 となり，0.0085＜0.05だから，２つの母集合の分散に有意差があると判断できる．

(2)　不等分散のときのｔ検定を行う

=TTEST(B2:B13,C2:C11,2,3)　･･･［2：両側検定，3：不等分散］
は0.11となり，0.11＞0.05だから，２つの母集合の平均値に有意差はないと判断できる．

分析ツールを用いる場合）

(1)　まずＦ検定を行い分散に有意差があるかどうか調べる

メニュー→ツール→分析ツール→「F-検定 : 2 標本を使った分散の検定」→[ＯＫ]→
変数１の入力範囲：

　→　$B$2:$B$13
変数２の入力範囲：

　→　$C$2:$C$11
範囲にラベルを含めていなければ，「ラベル」にチェックをしない．
αは初期設定で0.05である

F-検定: 2 標本を使った分散の検定

	変数 1	変数 2
平均	1.704	2.493
分散	0.364	1.757
観測数	12	10
自由度	11	9
観測された分散比	0.207
P(F<=f) 片側	0.009
F 境界値片側	0.345

0.009＜0.025だから，２つの母集合の分散に有意差があると判断できる．
　分析ツール→F検定では，変数１の入力範囲に「分子側=不偏分散の大きい側」，変数２の入力範囲に「分母側=不偏分散の小さい側」を指定したときに，統計の教科書に書かれている通りのF≧1となる値が表示されるが，右の例の出力結果は，分母分子の順序を考えずに使用したため「観測された分散比=F値」が＜1となったものである．この逆数 1/0.207 が通常のF値=4.83となる．

(2)　不等分散のときのｔ検定を行う

メニュー→ツール→分析ツール→「ｔ検定 : 分散が等しくないと仮定した２標本による検定」→[ＯＫ]→
変数１の入力範囲：

　→　$B$2:$B$13
変数２の入力範囲：

　→　$C$2:$C$11
範囲にラベルを含めていなければ，「ラベル」にチェックをしない．
「仮説平均との差異」を空欄のままにするかまたは0を記入すれば帰無仮説として平均が等しいとした場合になる．
αは初期設定のままで0.05となる．

↓

t-検定: 分散が等しくないと仮定した２標本による検定

	変数 1	変数 2
平均	1.704	2.493
分散	0.364	1.757
観測数	12	10
仮説平均との差異	0
自由度	12
t	-1.739
P(T<=t) 片側	0.054
t 境界値片側	1.782
P(T<=t) 両側	0.108
t 境界値両側	2.179

P(T<=t) 両側　0.108＞0.05だから，２つの母集合の平均値に有意差はないと判断できる．
または，2.179＞| -1.739|だから，２つの母集合の平均値に有意差はないと判断できる．

④Rにおける操作

> kou<-c(0.987,1.723,3.1,2.143,1.212,1.483,2.31,1.45,2.077,1.155,1.467,1.34)
> otsu<-c(1.037,3.125,1.88,3.805,1.108,3.985,3.71,1.323,1.03,3.93)
> t.test(kou,otsu)

        Welch Two Sample t-test

data:  kou and otsu
t = -1.7388, df = 12.083, p-value = 0.1075
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -1.7777607  0.1989941
sample estimates:
mean of x mean of y 
 1.703917  2.493300

　p値が0.1075>0.05だから２つの母集合の平均値に有意差はないと考える．
　または，95%信頼区間−1.7..～0.19..が「0」を含むから，平均値の差は「0」であると考えてもよい．

Rのt.test()関数では，第３引数を省略すれば，Welch検定となる（var.equal=FALSE）

（以下の○１～○８は参考）
Ｆ分布表，F検定，ｔ検定とExcel関数，分析ツールの読み方

○１　Ｆ分布表

　　印刷物で示されるF分布表は，不偏分散の大きい方を分子として，「分子の自由度，分母の自由度，上側確率5%（または1%）を与えるF値」の組を次のように上欄，左欄，縦横交わるセルの数値で表にしたものなので，%の数だけ表が必要となるが，代表的な値だけ示される．次の例では，「分子の自由度3，分母の自由度4でF値が6.59のとき上側確率が5%になる」ことを表わしている．（「分子の自由度3，分母の自由度4のとき上側確率が5%になるのはF値が6.59のときである」ことを表わしている．）

F分布(5%点)	1	2	3	4	5	6	7	8	9	10	･･･
1	161	199	216	225	230	234	237	239	241	242	･･･
2	18.51	19.00	19.16	19.25	19.30	19.33	19.35	19.37	19.38	19.40	･･･
3	10.13	9.55	9.28	9.12	9.01	8.94	8.89	8.85	8.81	8.79	･･･
4	7.71	6.94	6.59	6.39	6.26	6.16	6.09	6.04	6.00	5.96	･･･
5	6.61	5.79	5.41	5.19	5.05	4.95	4.88	4.82	4.77	4.74	･･･
6	5.99	5.14	4.76	4.53	4.39	4.28	4.21	4.15	4.10	4.06	･･･
7	5.59	4.74	4.35	4.12	3.97	3.87	3.79	3.73	3.68	3.64	･･･
8	5.32	4.46	4.07	3.84	3.69	3.58	3.50	3.44	3.39	3.35	･･･
9	5.12	4.26	3.86	3.63	3.48	3.37	3.29	3.23	3.18	3.14	･･･
10	4.96	4.10	3.71	3.48	3.33	3.22	3.14	3.07	3.02	2.98	･･･
11	4.84	3.98	3.59	3.36	3.20	3.09	3.01	2.95	2.90	2.85	･･･
12	4.75	3.89	3.49	3.26	3.11	3.00	2.91	2.85	2.80	2.75	･･･
13	4.67	3.81	3.41	3.18	3.03	2.92	2.83	2.77	2.71	2.67	･･･
14	4.60	3.74	3.34	3.11	2.96	2.85	2.76	2.70	2.65	2.60	･･･
15	4.54	3.68	3.29	3.06	2.90	2.79	2.71	2.64	2.59	2.54	･･･
16	4.49	3.63	3.24	3.01	2.85	2.74	2.66	2.59	2.54	2.49	･･･
17	4.45	3.59	3.20	2.96	2.81	2.70	2.61	2.55	2.49	2.45	･･･
18	4.41	3.55	3.16	2.93	2.77	2.66	2.58	2.51	2.46	2.41	･･･
19	4.38	3.52	3.13	2.90	2.74	2.63	2.54	2.48	2.42	2.38	･･･
20	4.35	3.49	3.10	2.87	2.71	2.60	2.51	2.45	2.39	2.35	･･･
･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･

　次の例では，「分子の自由度3，分母の自由度4でF値が9.98のとき上側確率が2.5%になる」ことを表わしている．（「分子の自由度3，分母の自由度4のとき上側確率が2.5%になるのはF値が9.98のときである」ことを表わしている．）

F分布（2.5%点）	1	2	3	4	5	6	7	8	9	10	･･･
1	648	799	864	900	922	937	948	957	963	969	･･･
2	38.51	39.00	39.17	39.25	39.30	39.33	39.36	39.37	39.39	39.40	･･･
3	17.44	16.04	15.44	15.10	14.88	14.73	14.62	14.54	14.47	14.42	･･･
4	12.22	10.65	9.98	9.60	9.36	9.20	9.07	8.98	8.90	8.84	･･･
5	10.01	8.43	7.76	7.39	7.15	6.98	6.85	6.76	6.68	6.62	･･･
6	8.81	7.26	6.60	6.23	5.99	5.82	5.70	5.60	5.52	5.46	･･･
7	8.07	6.54	5.89	5.52	5.29	5.12	4.99	4.90	4.82	4.76	･･･
8	7.57	6.06	5.42	5.05	4.82	4.65	4.53	4.43	4.36	4.30	･･･
9	7.21	5.71	5.08	4.72	4.48	4.32	4.20	4.10	4.03	3.96	･･･
10	6.94	5.46	4.83	4.47	4.24	4.07	3.95	3.85	3.78	3.72	･･･
11	6.72	5.26	4.63	4.28	4.04	3.88	3.76	3.66	3.59	3.53	･･･
12	6.55	5.10	4.47	4.12	3.89	3.73	3.61	3.51	3.44	3.37	･･･
13	6.41	4.97	4.35	4.00	3.77	3.60	3.48	3.39	3.31	3.25	･･･
14	6.30	4.86	4.24	3.89	3.66	3.50	3.38	3.29	3.21	3.15	･･･
15	6.20	4.77	4.15	3.80	3.58	3.41	3.29	3.20	3.12	3.06	･･･
16	6.12	4.69	4.08	3.73	3.50	3.34	3.22	3.12	3.05	2.99	･･･
17	6.04	4.62	4.01	3.66	3.44	3.28	3.16	3.06	2.98	2.92	･･･
18	5.98	4.56	3.95	3.61	3.38	3.22	3.10	3.01	2.93	2.87	･･･
19	5.92	4.51	3.90	3.56	3.33	3.17	3.05	2.96	2.88	2.82	･･･
20	5.87	4.46	3.86	3.51	3.29	3.13	3.01	2.91	2.84	2.77	･･･
･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･	･･･

○２　Excel関数でF分布を表わすもの
　メニュー→挿入→関数→統計　で表示されるものの内で，

=FINV(上側確率, 分子自由度, 分母自由度)　により「上側確率，分子自由度，分母自由度」に対応するＦ値が返される．　例　=FINV(0.05,3,4)　は　6.59　となる．
=FDIST(Ｆ値, 分子自由度, 分母自由度)　により「F値，分子自由度，分母自由度」に対応する上側確率が返される．　例　=FDIST(6.59,3,4)　は　0.05となる．
- FINV(p , m , n)=F ⇔ FDIST(F , m , n)=p の関係が成り立つ．
=FTEST(配列1, 配列2)　により２種類の資料に対するＦ検定の結果（両側確率）が返される(これを２で割れば片側確率になる)．　例　次の表において，=FTEST(B2:B7, C2:C5)　とすれば0.883となり，分子自由度5，分母自由度3の資料のＦ値に対する両側確率が0.88，片側確率が0.44であることを表わす．この確率が0.05よりも大きければ有意差なしと考える．

	A	B	C
1	No	甲	乙
2	1	31	29
3	2	29	31
4	3	30	32
5	4	32	30
6	5	28
7	6	29

○３　F値と分散との関係
(1)　２つの母集団から抽出された標本の不偏分散（標本から推定される母集団の分散）をV₁≧V₂≧0とするとき F = V₁／V₂　で定義する．（大きい方を分子にするのは印刷物で表の枚数を減らすための伝統的な都合であって，理論上の問題ではない．）
　例　上の表では　 V₁ = VAR(B2:B7) = 2.17， V₂ = VAR(C2:C5) = 1.67，F = V₁／V₂ = 2.17/1.67 = 1.3
(2)　次に，「2.5%のＦ分布表で，上欄の自由度6-1=5，左欄の自由度4-1=3」の交わるところで読み取ると14..88となるから，上側確率2.5%（両側確率5%）はF=14.88のときに実現され，観測されたF値は1.3＜14.88だから分散には有意差なしとする．
　Excel上では =FDIST(Ｆ値,　分子自由度5,　分母自由度3) = 0.44で上側確率が0.025より大きいから分散には有意差なしとする．
　または，=FINV(0.025,分子自由度5,　分母自由度3) = 14.88＞1.3だから分散には有意差なしでもよい．

○４　分析ツール→F検定で出力される表

No	甲	乙
1	0.987	1.037
2	1.723	3.125
3	3.100	1.880
4	2.143	3.805
5	1.212	1.108
6	1.483	3.985
7	2.310	3.710
8	1.450	1.323
9	2.077	1.030
10	1.155	3.930
11	1.467
12	1.340

　右の表のようなデータについて分析ツールの「F検定：２標本を使った分散の検定」によって出力される表（下図）は次のように解される．

(1)　分析ツールのパラメータ指定に当たって，「変数1の入力範囲」としては不偏分散の大きい方（右図では乙）を指定し，「変数2の入力範囲」としては不偏分散の小さい方（右図では甲）を指定すると，通常用いられるF値が「観測された分散比」に表示される．（逆順の場合はその逆数となる．）
　出力される表は両側検定のものなので有意水準5%の検定のときはα=0.025とする．

F-検定: 2 標本を使った分散の検定
	甲	乙
平均	1.70..	2.49..
分散	0.36..	1.75..
観測数	12	10
自由度	11	9
観測された分散比	0.20..
P(F<=f) 片側	0.0085..
F 境界値片側	0.345..

(2)

観測数とは，標本数のこと．
自由度は，標本数-1
出力される表の下2行は，画面上の表示とは異なり「片側検定（上側確率）」に対応する値となっているので注意．･･･Excel2002よりも新しいバージョンでは訂正されているとのこと
観測された分散比が　F値 = 大きい方の不偏分散／小さい方の不偏分散　を表わす．右の例では 4.823 = 1.757/0.364
P(F<=f)両側　は　P(F<=f)片側　と読み替える．すなわち，0.0086は求めたF値の上側確率を表わす．
F 境界値両側　は　F境界値片側　と読み替える．すなわち上側確率が0.025となるFの値は3.5879

Excel関数との対応
FDIST(F値，乙側の自由度，甲側の自由度)=0.0086
FINV(0.025，乙側の自由度，甲側の自由度)=3.5879

FTESTは甲乙の順にかかわらず同じ値となりF検定の両側確率を表示する：
FTEST(甲の値の範囲，乙の値の範囲) = 0.017=0.0086×2

○５　ｔ検定に使うExcel関数
　=TTEST(配列１,　配列２,　尾部,　検定の種類)　により，ｔ値に対応する外側確率が返される．

　ここで
　尾部は，片側検定なら１，両側検定なら2とする．
　検定の種類は，対応がある場合は1，分散が等しい場合は2，分散が等しくない場合は3とする．
例　次の甲乙の資料の平均値に有意差があるかどうか検定するには，先にF検定を行ってFTEST(B2:B7, C2:C5)が0.88だから上側確率は0.44となり，分散が等しい（=有意差なし）と判断でき，
　　　=TTEST(B2:B7, C2:C5, 2, 2)　により　0.483＞0.05となるから有意差なし．

	A	B	C
1	No	甲	乙
2	1	31	29
3	2	29	31
4	3	30	32
5	4	32	30
6	5	28
7	6	29

○６　分析ツールの「t-検定 : 等分散を仮定した２標本による検定」出力結果
　等分散の場合のｔ値は次の公式で計算される：

　　
　上の表・・・次の出力結果では
（ただし，出力結果の「分散」は不偏分散，自由度1=6-1=5，自由度2=4-1=3）

= -0.73 となる

t-検定 : 等分散を仮定した２標本による検定

	変数 1	変数 2
平均	29.83	30.50
分散	2.17	1.67
観測数	6	4
プールされた分散	1.98
仮説平均との差異	0
自由度	8
t	-0.73
P(T<=t) 片側	0.24
t 境界値片側	1.86
P(T<=t) 両側	0.48
t 境界値両側	2.31

○７　分析ツールの「ｔ検定 : 分散が等しくないと仮定した２標本による検定」出力結果
　不等分散の場合のｔ値は次の公式で計算される：

　次の出力結果では

= -1.739となる

t-検定 : 分散が等しくないと仮定した２標本による検定

	変数 1	変数 2
平均	1.704	2.493
分散	0.364	1.757
観測数	12	10
仮説平均との差異	0
自由度	12
t	-1.739
P(T<=t) 片側	0.054
t 境界値片側	1.782
P(T<=t) 両側	0.108
t 境界値両側	2.179

○８　分析ツールの「ｔ検定 : 一対の標本による平均の検定ツール」出力結果
　対応がある場合のｔ値は次の公式で計算される：

　次の表と出力結果では

= -2.74 となる

No	1回目	2回目	差
1	54.3	56.5	-2.2
2	55.2	54.8	0.4
3	55.0	58.2	-3.2
4	56.4	57.8	-1.4
5	53.1	59.0	-5.9
6	53.1	60.7	-7.6
平均	54.51	57.83	-3.33
不偏分散	1.69	4.14	8.75

t-検定 : 一対の標本による平均の検定ツール

	変数 1	変数 2
平均	54.51	57.83
分散	1.69	4.14
観測数	6	6
ピアソン相関	-0.56
仮説平均との差異	0
自由度	5
t	-2.74
P(T<=t) 片側	0.02
t 境界値片側	2.02
P(T<=t) 両側	0.04
t 境界値両側	2.57

（参考）
(1) 確率変数の変換については，次の式が成り立つ．
• 期待値 $E(X)$ に関する性質
$E(X+ Y)=E(X)+ E(Y)$ ･･･①
$E(X-Y)=E(X)-E(Y)$ ･･･②
• 分散 $V(X)$ に関する性質
$X,\hspace{4}Y$ が独立であれば
$V(X+ Y)=V(X)+ V(Y)$ ･･･③
$V(X-Y)=V(X)+ V(Y)$ ･･･④
特に，④が成り立つことに注意

(2) 母集団が平均値μ，標準偏差σの正規分布に従うとき，n個の標本X1～Xnの平均値を $\bar{X}$ とすると
$t=\frac{\bar{X}-\mu}{\sqrt{\frac{u^2}{n}}}$
は，自由度n−1のt分布になる．

確率変数Xから引き出したm個の値X1～Xmと，確率変数Yから引き出したn個の値Y1～Ynがあるとする．それぞれの標本平均を $\bar{X},\hspace{3}\bar{Y}$ ,標本不偏分散を $u_X^2,\hspace{3}u_Y^2$ とする．
$u_X^2=\frac{(X_1-\bar{X})^2+ (X_2-\bar{X})^2+\cdots+ (X_m-\bar{X})^2}{m-1}$
$u_Y^2=\frac{(Y_1-\bar{Y})^2+ (Y_2-\bar{Y})^2+\cdots+ (Y_n-\bar{Y})^2}{n-1}$
このとき，変数X−Yは②④により
$t=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{u_x^2}{m}+\frac{u_Y^2}{n}}}$ ･･･⑤
は，t分布になる．･･･この式がウェルチ公式になる
　なお，ウェルチ公式における自由度は，整数値とは限らず，次のような小数値で近似されている．覚えるのは難しい．（この自由度は，ExcelやRを使えば，ソフトの側で計算してくれる）
$\nu=\frac{(\frac{u_X^2}{m}+\frac{u_Y^2}{n})^2}{\frac{(\frac{u_X^2}{m})^2}{m-1}+\frac{(\frac{u_Y^2}{n})^2}{n-1}}$

(3) 確率変数X, Yの「分散 $u^2$ が等しいと見なせる」場合
$t=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{u^2}{m}+\frac{u^2}{n}}}=\frac{\bar{X}-\bar{Y}}{\sqrt{u^2(\frac{1}{m}+\frac{1}{n}})}$
共通の分散 $u^2$ を，（標本のすべての変動）÷（自由度）で表すと
$\frac{\{(X_1-\bar{X})^2+ \cdots+ (X_m-\bar{X})^2\}+\{(Y_1-\bar{Y})^2+\cdots+ (Y_n-\bar{Y})^2\}}{(m-1)+(n-1)}$
$=\frac{(m-1)u_X^2+ (n-1)u_Y^2}{(m-1)+(n-1)}$
この式が「等分散を仮定できる場合」のプールされた分散，すなわち，２つの分散 $u_X^2,\hspace{4}u_Y^2$ を各々m−1個，n−1個集めて，合計(m−1)+(n−1)で平均して１つの分散と見なしたものとなっている．
$t=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{(m-1)u_X^2+ (n-1)u_Y^2}{(m-1)+(n-1)}(\frac{1}{m}+\frac{1}{n}})}$ ･･･⑥
･･･この式が等分散の場合のｔの式になる

(4) m=nのときは，⑤と⑥は同じ式になる．
$t=\frac{\bar{X}-\bar{Y}}{\sqrt{\frac{u_x^2 + u_Y^2}{n}}}$
(5) m, n>25とかm, n>30のような大標本の場合は，⑤⑥を標準正規分布と見なして，z検定にすればよい．（自由度は関係なくなる）

■■問題例■■
(1)「対応のあるｔ検定」,(A)「元の観測データ有り」,「両側検定」の場合

【例1A.1】
　７人の生徒に，２つの条件のもとで50m走を行ってもらい，その時間を測定したとき，次の表のようになった．これら２つの条件は50m走の時間に影響したと言えるか．

生徒番号	No.1	No.2	No.3	No.4	No.5	No.6	No.7
条件1	7.5	8.5	9.3	6.3	5.7	6.8	7.1
条件2	7.8	8.1	9.5	6.8	6.3	7.2	7.4

===①②③ Excelで計算する場合 ===

①Excel2007　②Excel2010　③Excel Onlineでほぼ同じ操作になる

ア）ワークシート関数TTEST(), TINV()を使うとき

　ワークシート関数は1つの関数が１つの結果を返すため，この問題のように7個の値が必要な場合には，関数を７個書く必要があり，それなりに大変である．
　しかし，ワークシート関数から得られる結果は，元データが更新された場合に，リアルタイムで結果が追随するという良さはある．
　別ルートから計算しているので，点検作業という意味はある．

T.TEST(範囲1, 範囲2, 片側両側の指定, 検定の種類)⇒確率

• Excel2007ではTTEST( ), Excel2010～ではT.TEST( )
• 第3引数は，1が片側検定，2が両側検定を表す
• 第4引数は，1が対応のある検定，2が対応なし等分散，3が対応なし不等分散
※なお，条件1，条件2というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される．

によりｔ検定の確率[p値]が得られる
この問題では，
T.TEST(A群の範囲, B群の範囲, 2,1)⇒0.069..

TINV(確率[p値],自由度)⇒t値

• 対応のあるｔ検定の自由度は，対の数−1とする．この問題では，対が7あるから，自由度は6

この問題では，=TINV(上記の確率[p値]0.069.., 6)⇒t値2.21..となる
なお，有意水準5%の両側検定ｔ境界値を求めるには

TINV(0.05,自由度)⇒t値

とするとよい．この問題では，=TINV(0.05, 6)⇒2.447..となる

※なお，t検定に関するExcelワークシート関数には，もう１つ関数TDIST( )がある．

TDIST(t値,自由度, 片側1両側2)⇒p値

により，与えられたt値に対する確率[p値]が求まるが，上記の手順で行えば，p値は既に求まっているから，確認・点検という使い方はできる．

各々の群の平均と分散を求めるには，
AVERAGE(A群の範囲), AVERAGE(B群の範囲),
VAR(A群の範囲), VAR(B群の範囲)
とする．

【結果のまとめ方】
　表１は，条件1と条件2に対する50m走の平均と標準偏差(秒)を示したものである．(N=7)

《表1》各条件に対する平均と標準偏差
	条件1	条件2
平均	7.314	7.586
標準偏差	1.154	0.958

「ｔ検定の結果，両条件の平均の差は有意でなかった（両側検定：t(6)=2.20, p=.069）．したがって，これらの条件が50m走の時間に影響したとは言えない．」

• t( )の括弧内に自由度を書く
• 小数点の前の0は省略する． 0.05 → .05
• 5%, 1%有意差がある場合，*p<.05, **p<.01を欄外に書き，図または表で対応するデータに*や**を付けることが多い．この表では対応するものがないので，*も**もない．

イ）分析ツールを使うとき
　次のような表が出力される．

t-検定: 一対の標本による平均の検定ツール
		
	変数 1	変数 2
平均	7.314 	7.586 
分散	1.555 	1.071 
観測数	7.000 	7.000 
ピアソン相関	0.976 	
仮説平均との差異	0.000 	
自由度	6.000 	
t 	-2.209 	
P(T<=t) 片側	0.035 	
t 境界値 片側	1.943 	
P(T<=t) 両側	0.069 	
t 境界値 両側	2.447

【結果のまとめ方】
ア）と同様に書く

===④ Rで計算する場合 ===

> cond1<-c(7.5, 8.5, 9.3, 6.3, 5.7, 6.8, 7.1)
> cond2<-c(7.8, 8.1, 9.5, 6.8, 6.3, 7.2, 7.4)
> t.test(cond1, cond2, paired=TRUE)

        Paired t-test

data:  cond1 and cond2
t = -2.2087, df = 6, p-value = 0.06927
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -0.57213045  0.02927331
sample estimates:
mean of the differences 
             -0.2714286

• 各群のデータをベクトルとして入力する
• t.test()の第３引数をpaired=TRUEとする

【結果のまとめ方】
ア）と同様に書く

===⑤筆算で計算する場合 ===

生徒番号	条件1	条件2	差（条件1−2）
No.1	7.5	7.8	−0.3
No.2	8.5	8.1	0.4
No.3	9.3	9.5	−0.2
No.4	6.3	6.8	−0.5
No.5	5.7	6.3	−0.6
No.6	6.8	7.2	−0.4
No.7	7.1	7.4	−0.3
平均値 $\bar{X}$	7.314	7.586	−0.271
標準偏差 $s$	1.154	0.958	0.301

　右図のように表を組み立てて行く．
　なお，標準偏差は対の個数Nで割るものである．
　次の公式に代入する
$t=\frac{\mid\bar{X}\mid}{\sqrt{\frac{s^2}{N-1}}}$
　　≒2.208

ｔ分布表	0.05	0.01
1	12.706	63.657
2	4.303	9.925
3	3.182	5.841
4	2.776	4.604
5	2.571	4.032
6	2.447	3.707
7	2.365	3.499
8	2.306	3.355
9	2.262	3.250
10	2.228	3.169
...	...	...
20	2.086	2.845

　統計の教科書などの巻末に付いている右図のようなｔ分布表を見て，t≒2.20は，自由度6のときのｔ分布表のt境界値(両側)2.447よりも小さいことを確かめる．

【結果のまとめ方】
ア）と同様に書く（p値は書けない）

(1) 対応のあるｔ検定， [B] 要約データのみ有りの場合

【例1B.1】
　７人の生徒に，２つの条件のもとで50m走を行ってもらい，その時間を測定したとき，次の表のようになった．これら２つの条件は50m走の時間に影響したと言えるか．

《表1》各条件に対する平均と標準偏差
	条件1	条件2	差(1−2)
平均	7.314	7.586	−0.271
標準偏差	1.154	0.958	0.301

（集約データのみのときは，筆算で行う）
次の公式に代入する
$t=\frac{\mid\bar{X}\mid}{\sqrt{\frac{s^2}{N-1}}}=\frac{2.71}{\sqrt{\frac{0.301^2}{7-1}}}=2.208$

【結果のまとめ方】
ア）と同様に書く（p値は書けない）

(1)「対応のあるｔ検定」,(A)「元の観測データ有り」,「片側検定」の場合

【例1A.2】

No	前	後
1	54.3	52.6
2	51.9	48.7
3	55.2	56.7
4	55.3	52.5
5	53.8	52.1
6	52.1	53.3
7	53.6	51.4
8	50.2	49.2

　右の表はあるダイエット法を行う前と後の体重の一覧表であるものとする．No欄は被験者の整理番号，Ａ欄は実施前の体重，Ｂ欄は実施後の体重とする．
　この一覧表では8人の被験者について，ダイエット法実施前後の体重が対のデータとなっている．
　これらのデータからＡ欄の値とＢ欄の値を比較すると，Ａ欄のデータとＢ欄のデータは同一被験者のデータであるので，Ａ欄とＢ欄の差はダイエット法の効果と見ることができる．
　この場合，ダイエット法の効果があるとは「体重が減少している」という意味であるから片側検定を用いて，ダイエット効果があるかどうか判断してください．

===①②③ Excelで計算する場合 ===

①Excel2007　②Excel2010　③Excel Onlineでほぼ同じ操作になる

ア）ワークシート関数TTEST(), TINV()を使うとき

=TTEST(条件1範囲, 条件2範囲, 1, 1)

• 第3引数は，片側検定のとき1，両側検定のとき2･･･この問題では，「1」の片側検定を指定
• 第４引数は，ｔ検定の種類を指定する．この問題のような「対応のあるｔ検定」の場合は「1」
※なお，前，後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される．

　結果⇒0.041..

　p値だけで判断するときは，ここまででよいが，一般的な報告書のようにｔ値も付けるには

=TINV(上記のp値×2, 自由度)

とする．

• Excelワークシート関数のTINV()は両側検定の場合のｔ値を返すので，この問題のように片側検定のｔ値を求めるには，確率を２倍しておく（両側で5%の図を片側で5%にする）
• 対応のあるｔ検定の自由度は，対の数−1とする．この問題では，対が8あるから，自由度は7

　結果⇒2.014..

有意水準5%の両側検定ｔ境界値を求めるには

TINV(0.05,自由度)⇒t値

とするとよい．
この問題では，=TINV(0.05, 6)⇒2.364..となる

【結果のまとめ方】
　表1は，ダイエット法を実施する前後の平均体重と標準偏差(kg)を示したものである．(N=8)

《表1》前後の平均体重と標準偏差
	前	後
平均	53.3	52.1 *
標準偏差	2.745	5.432

「ｔ検定の結果，前後の平均の差は有意であった（片側検定：t(7)=2.01, p=.041）．したがって，このダイエット法は効果があったと判断できる．」

*p < .05, **p < .01

イ）分析ツールを使うとき
　次のような表が出力される．

t-検定: 一対の標本による平均の検定ツール
		
	前	後
平均	53.3	52.0625
分散	3.137	6.208
観測数	8	8
ピアソン相関	0.716	
仮説平均との差異	0
自由度	7	
t 	2.014	
P(T<=t) 片側	0.041	
t 境界値 片側	1.894	
P(T<=t) 両側	0.083	
t 境界値 両側	2.3641

【結果のまとめ方】
ア）と同様に書く

===④ Rで計算する場合 ===

> before<-c(54.3, 51.9, 55.2, 55.3, 53.8, 52.1, 53.6, 50.2)
> after<-c(52.6, 48.7, 56.7, 52.5, 52.1, 53.3, 51.4, 49.2)
>  t.test(before,after,paired=TRUE, alternative="greater")

        Paired t-test

data:  before and after
t = 2.0142, df = 7, p-value = 0.04192
alternative hypothesis: true difference in means
 is greater than 0
95 percent confidence interval:
 0.07348583        Inf
sample estimates:
mean of the differences 
                 1.2375

• 各群のデータをベクトルとして入力する
• t.test( )の第３引数をpaired=TRUEとする
• t.tset( )の第４引数を，

両側検定ならば alternative="two.sided"，
左側が小さい片側検定ならば alternative="less"，
左側が大きい片側検定ならば alternative="greater"

とする（上記のTRUEとは異なり引用符に囲まれた"文字列"として"less", "greater"を書く）

【結果のまとめ方】
ア）と同様に書く

===⑤筆算で計算する場合 ===

No	前	後	差
1	54.3	52.6	1.7
2	51.9	48.7	3.2
3	55.2	56.7	−1.5
4	55.3	52.5	2.8
5	53.8	52.1	1.7
6	52.1	53.3	−1.2
7	53.6	51.4	2.2
8	50.2	49.2	1
平均	53.3	52.06	1.24
標準偏差	1.65	2.33	1.63

　右図のように表を組み立てて行く．
　なお，標準偏差は対の個数Nで割るものである．
　次の公式に代入する
$t=\frac{\mid\bar{X}\mid}{\sqrt{\frac{s^2}{N-1}}}=2.014$
　統計の教科書などの巻末に付いているｔ分布表を見て，t≒2.014は，自由度7のときのｔ分布表のt境界値(片側)1.894よりも大きいことを確かめる．

【結果のまとめ方】
ア）と同様に書く（p値は書けない）

(2)「対応のないｔ検定」,(A)「元の観測データ有り」,「両側検定」の場合

【例2A.1】

男子	女子
7.3	8.6
8.2	8.4
8.6	9.5
7.3	7.9
7.9	8.3
8.1	8.5
7.3
7.0
8.2

　右の表は，男子9人，女子６人，計15人の50m走の時間(秒)を測定した結果とします．
　この測定結果から，男女間で50m走の時間に有意差が見られるかどうか，対応のないｔ検定で判断してください．

「F検定→等分散を仮定したT検定」の２段階で行う場合

===①②③ Excelで計算する場合 ===

①Excel2007　②Excel2010　③Excel Onlineでほぼ同じ操作になる

ア）Excelのワークシート関数で行うとき
　関数FTEST(A群, B群)は，A群とB群の分散の差異が認められない「両側確率」を返す．
　F検定を両側検定で行うと，分散に差異がある場合だけでなく，一致し過ぎる「≒0」場合も検出する．

　しかし，ほとんどのF検定で，分散に有意差があると見なすときは，一致する場合は含めないので，F検定は片側検定で行う．
　右図のように，片側確率が5%以下であるかどうかを検定するには

FTEST(A群, B群)/2

とするとよい．
　結果⇒0.4891..
p値>0.05だから等分散という仮定は棄却されない．

=TTEST(A群, B群, 2, 2)

• 第3引数は，片側検定のとき1，両側検定のとき2･･･この問題では，「2」の両側検定を指定
• 第４引数は，ｔ検定の種類を指定する．この問題のような「等分散が仮定できるｔ検定」の場合は「2」
※なお，前，後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される．

　結果⇒0.019..

　p値だけで判断するときは，ここまででよいが，一般的な報告書のようにｔ値も付けるには

=TINV(上記のp値×2, 自由度)

とする．
　結果⇒2.671..

　結果をまとめるには，この他に各群の平均と不偏分散[標本の個数N−1で割る方]が必要であるから，=AVERAGE( ), =VAR( )で求めておく．

【結果のまとめ方】
　表１は，男子9人，女子6人，計15人の50m走の平均時間（秒）と分散を示したものである．

《表1》男女の平均時間と標準偏差（秒）
	男子	女子
平均時間	7.766 *	8.533 *
分散	0.305	0.282
人数	9	6

「ｔ検定の結果，男女の平均時間の差は有意であった（両側検定：t(13)=2.671, p=.019）．したがって，50m走の時間は男女間で差があると考えられる．」

*p < .05, **p < .01

イ）分析ツールを使うとき
《初めに等分散の検定を行う》
　データ→データ分析→F検定により，次のような表が出力される．

F-検定: 2 標本を使った分散の検定
	男子	女子
平均	7.766..	8.533..
分散	0.305	0.282..
観測数	9	6
自由度	8	5
観測された分散比	1.079..	
P(F<=f) 片側	0.489..	
F 境界値 片側	4.818..

p値=0.489>0.05だから等分散という仮定は棄却されない
またはF値=1.079<4.818だから等分散という仮定は棄却されない

《次に，等分散を仮定したT検定を行う》
　データ→データ分析→ｔ検定:等分散を仮定した２標本･･･により，次のような表が出力される．

t-検定: 等分散を仮定した２標本による検定
	男子	女子
平均	7.766..	8.533..
分散	0.305	0.282..
観測数	9	6
プールされた分散	0.296..	
仮説平均との差異	0	
自由度	13	
t 	-2.671..	
P(T<=t) 片側	0.009..	
t 境界値 片側	1.770..	
P(T<=t) 両側	0.019..	
t 境界値 両側	2.160..

【結果のまとめ方】
　ア）と同様に書く

===④ Rで計算する場合 ===
《初めに等分散の検定を行う》

Rで２群の分散を比較する関数 var.test( )の使い方
var.test(x, y, ratio=1, alternative=.., conf.level=..)

• var.test( )の書式で使い，第1，第2引数は必須．２群のデータをベクトルで書く．
• 第３引数以下を省略した場合は，デフォルトで両側検定となる．
• 第３引数以下は，引数の位置ではなく，ratio, alternative, conf.levelなどの名前タグを用いて指定する．
• alternative="two.sided"もしくはalternative="t"により両側検定になる．
• alternative="less"もしくはalternative="l"により，第1引数の分散の方が「小さい」という片側検定を行い、alternative="greater"もしくはalternative="g"により，第1引数の分散の方が「大きい」という片側検定を行う．
• conf.level=0.95により95%の信頼区間が返されるが，これは省略した場合でも既定値となっている．

　前述のExcel分析ツールと同じ結果を得るには，次のように「片側検定，男子が大きいか？」という引数を指定する.

> boy<-c(7.3,8.2,8.6,7.3,7.9,8.1,7.3,7.0,8.2)
> girl<-c(8.6,8.4,9.5,7.9,8.3,8.5)
> var.test(boy,girl,alternative="greater")

        F test to compare two variances

data:  boy and girl
F = 1.079, num df = 8, denom df = 5, p-value = 0.4891
alternative hypothesis: true ratio of variances
 is greater than 1
95 percent confidence interval:
 0.223..      Inf
sample estimates:
ratio of variances 
          1.079009

p値=0.489>0.05だから等分散という仮定は棄却されない
またはF値=1.079は95%信頼区間0.223～∞に入るから等分散という仮定は棄却されない

《次に，等分散を仮定したT検定を行う》

> t.test(boy,girl,var.equal=TRUE)

        Two Sample t-test

data:  boy and girl
t = -2.6718, df = 13, p-value = 0.0192
alternative hypothesis: true difference in means
 is not equal to 0
95 percent confidence interval:
 -1.3865689 -0.1467644
sample estimates:
mean of x mean of y 
 7.766667  8.533333

p値=0.019<0.05だから平均値が等しいという仮定は棄却される
またはt値=−2.67は95%信頼区間−1.39～−0.147に入らないから平均値が等しいという仮定は棄却される

【結果のまとめ方】
　前述と同様

Welch検定で行う場合

===①②③ Excelで計算する場合 ===

①Excel2007　②Excel2010　③Excel Onlineでほぼ同じ操作になる

ア）Excelのワークシート関数で行うとき

=TTEST(A群, B群, 2, 3)

• 第3引数は，片側検定のとき1，両側検定のとき2･･･この問題では，「2」の両側検定を指定
• 第４引数は，ｔ検定の種類を指定する．この問題のような「不等分散のｔ検定」の場合は「3」
※なお，前，後というラベルを「含める」「含めない」は両方同じに揃えると自動で判別される．

　結果⇒0.02063..

※あら不思議！？何度計算しても，次に述べる分析ツールの結果とは小数第４位以下が合わない．Rの結果とこのワークシート関数の結果は一致する！？

　p値だけで判断するときは，ここまででよいが，一般的な報告書のようにｔ値も付けるには

=TINV(上記のp値, 自由度)

とする．
　結果⇒2.70..

この報告書を完成させるには「自由度」を求めて，上記の関数に代入しなければならないが，この自由度を計算するのは，かなり大変．
$\nu=\frac{(\frac{u_X^2}{m}+\frac{u_Y^2}{n})^2}{\frac{(\frac{u_X^2}{m})^2}{m-1}+\frac{(\frac{u_Y^2}{n})^2}{n-1}}$
総合的に考えると，このようにワークシート関数だけで行うのはかなり煩わしい計算になる･･･点検用として参考にする程度と考えるとよい．

　結果をまとめるには，この他に各群の平均と不偏分散[標本の個数N−1で割る方]が必要であるから，=AVERAGE( ), =VAR( )で求めておく．

【結果のまとめ方】
　表１は，男子9人，女子6人，計15人の50m走の平均時間（秒）と分散を示したものである．

《表1》男女の平均時間と標準偏差（秒）
	男子	女子
平均時間	7.766 *	8.533 *
分散	0.305	0.282
人数	9	6

「ｔ検定の結果，男女の平均時間の差は有意であった（両側検定：t(11)=2.70, p=.021）．したがって，50m走の時間は男女間で差があると考えられる．」

*p < .05, **p < .01

イ）分析ツールを使うとき
　データ→データ分析→t-検定: 分散が等しくないと仮定した２標本･･･により，次のような表が出力される．

t-検定: 分散が等しくないと仮定した２標本による検定		
		
	男子	女子
平均	7.766..	8.533..
分散	0.305	0.282..
観測数	9	6
仮説平均との差異	0	
自由度	11	
t 	-2.693..	
P(T<=t) 片側	0.010..	
t 境界値 片側	1.795..	
P(T<=t) 両側	0.02088..	
t 境界値 両側	2.200..

p値=0.020<0.05だから平均値が等しいという仮定は棄却される
または|t|値=2.693>2.20だから平均値が等しいという仮定は棄却される

【結果のまとめ方】
　ア）の場合とほぼ同じ

※Welch検定を用いたということは，自由度がm+n−2よりも小さいことから分かる．

===④ Rで計算する場合 ===

> boy<-c(7.3,8.2,8.6,7.3,7.9,8.1,7.3,7.0,8.2)
> girl<-c(8.6,8.4,9.5,7.9,8.3,8.5)
> t.test(boy,girl,var.equal=FALSE)

        Welch Two Sample t-test

data:  boy and girl
t = -2.6938, df = 11.169, p-value = 0.02064
alternative hypothesis: true difference
 in means is not equal to 0
95 percent confidence interval:
 -1.3919260 -0.1414074
sample estimates:
mean of x mean of y 
 7.766667  8.533333

p値=0.020<0.05だから平均値が等しいという仮定は棄却される
または95%信頼区間に「0」が入っていないから平均値が等しいという仮定は棄却される

【結果のまとめ方】
前述と同じ

※Welch検定の自由度t(11)は，小数点以下切り捨てた整数値で書けばよい．

（携帯版）統計メニューに戻る

...メニューに戻る

...演習問題1（対応のある場合のｔ検定）

...演習問題2（対応のない場合のｔ検定）

■［個別の頁からの質問に対する回答］[Ｆ検定→ｔ検定について／17.2.7］

どうして、大学のテキストは同じ内容があれほど難解に記述するのか、と痛感するばかりです。このページを読むことでようやくテキストの大意がつかめました。ありがとうございました。
＝＞［作者］：連絡ありがとう．

■［個別の頁からの質問に対する回答］[Ｆ検定→ｔ検定･･･平均値の差の検定について／17.2.5］

わかりません
＝＞［作者］：連絡ありがとう．何も手掛かりが書いてないので答えようがありません．