名義尺度データの比率の検定

（結果）
カイ２乗値=0.78368, 自由度=1, p値=0.376（>0.05）
よって，独立という仮説は棄却されない．
---------------
　chisq.test()関数を呼び出すときに，correct=を指定しない場合は，デフォルトで「連続性の補正（イェーツの補正）を行う」が選ばれる．

chisq.test(mx)

カイ２乗値=0.27475, 自由度=1, p値=0.6002（>0.05）
よって，独立という仮説は棄却されない．

○ Excelのワークシート関数を使って解くには，次のようにすればよい．
(1) 観測度数の表と期待度数の表を準備する．

	A	B	C	D
1	観測度数	良	不良	計
2	生産者A	7	10	17
3	生産者B	8	6	14
4	計	15	16	31
5
6	期待度数	良	不良	計
7	生産者A	8.23	8.77	17
8	生産者B	6.77	7.23	14
9	計	15	16	31

　例えば，生産者Aの作柄B7には，=B$9*$D7/$D$9などど記入し，この式を残り3つのセルにコピー・ペーストする．（期待度数は小数のままでよい）
(2)
=CHITEST(観測度数の範囲,期待度数の範囲)と記入する．
例えばE5のセルに，=CHITEST(B2:C3,B7:C8)と記入すると，0.376...（>0.05）になる．
よって，独立という仮説は棄却されない．
　なお，このｐ値は，
$\chi^2=\frac{(7-8.23)^2}{8.23}+\frac{(10-8.77)^2}{8.77}+\frac{(8-6.77)^2}{6.77}+\frac{(6-7.23)^2}{7.23}$
で求めたχ²値=0.783...を，=CHIDIST(χ²値,自由度)→0.376...によって「片側確率」に直したものとなっており，生産者Bの不良品がこれ以上少ない確率（生産者Aの不良品がこれ以上多い確率）を求めたものとなっている．
　なお，自由度1のときのカイ２乗5％限界値を=CHIINV(0.05,1)→χ₀²=3.841...で求めてから，
　　χ²=0.783...<χ₀²=3.841...
であるから，独立という仮説は棄却されないと述べてもよい．

【ここで使った値】
カイ２乗値=0.783＜カイ２乗5％限界値=3.841
　　　p値=0.376＞0.05

【備考】
• 2×2表の場合に，Rでchisq.test()を呼び出した場合，デフォルトで「連続性の補正（イェーツの補正）を行う」が選ばれる．これは，セルの値に，例えば4というような小さな整数が含まれる場合にだけ行われるのではなく，すべてのセルの値が100以上であっても，デフォルトで連続性の補正が行われる設定になっている．
• 2×2表の場合に，Rでchisq.test()を呼び出した場合，「連続性の補正（イェーツの補正）を行わない」方を選ぶには，correct=Fを指定する．
• ExcelでCHITEST()を呼び出し場合，連続性の補正を行わない，片側検定になる．

※連続性の補正（イェーツの補正）を行う方がよいのか，行わない方がよいのか，一概には言えない．
　連続性の補正を行うとχ²の値は小さくなり「早とちりで有意差があると判断してしまう可能性は減るが」「有意差があっても検出できないことが起こる」と言われている．

【例題1.1.2】

-- 表2 --
15	10	10
10	20	25

　右の表2のクロス集計表で示される２種類の分類変数が独立かどうか，カイ２乗検定によって調べてください.

（解答）
○ Rを使って解くには，次のようにすればよい．
(1) 係数行列を入力する.

 mx<-matrix(c(15,10,10,10,20,25),2,3,byrow=T)

(2) カイ２乗検定の関数chisq.test()を呼び出す．なお，２×２表ではないから，連続性の補正を行う引数correctはデフォルトで行われない（FALSE）ことになっているので，省略してよい．

chisq.test(mx)

（結果）
カイ２乗値=6.6456, 自由度=2, p値=0.03605（<0.05）
よって，独立という仮説は棄却される．２種類の分類変数は独立ではない．

○ Excelのワークシート関数を使って解くには，前述の例題1と同様に進めるとよい．
次の結果が得られる．
カイ２乗値=6.646＞カイ２乗5％限界値=5.991
　　　p値=0.036＜0.05 よって，独立という仮説は棄却される．２種類の分類変数は独立ではない．

1.2　カイ２乗検定（適合性の検定）

（↑ページの先頭へ）

　Rでは，観測度数の分布が理論上の分布と一致するかどうかを調べる「適合性の検定」を行う方法も用意されている．
　例えば，ある学年の生徒100人の血液型の分布が，次の表の通りであったとする．

血液型	Ａ型	Ｂ型	ＡＢ型	Ｏ型	合計
人数	37	25	12	26	100

　ところで，日本人全体のABO式血液型の分布はおよそＡ型40%，B型20%，AB型10%，O型30%だといわれている．これを，小数を使って確率で表すと，次の表の通りになる．

血液型	Ａ型	Ｂ型	ＡＢ型	Ｏ型	合計
確率	0.4	0.2	0.1	0.3	1.0

　この生徒100人の血液型分布は，日本人全体の血液型分布とほぼ同じと見なしてよいか？という形で，理論値（ここでは日本人全体の血液型の分布確率）に対して，観測された結果（ここでは生徒100人の血液型の度数分布）がほぼ同じと見なせる（適合する）がどうかを調べるものを「適合性の検定」という．
　Rで適合性の検定を行うには「観測度数の分布」「確率分布」を各々ベクトルで表す（行列にはしない）．
　これら２つのベクトルは同じ要素数でなければならない．また，確率の総和は１に等しくなければならない．
観測度数の分布をベクトルc(n₁, n₂, n₃, ･･･)，確率分布をベクトルc(p₁, p₂, p₃, ･･･)で表すとき，関数chisq.test()を次の形で使うと，適合性の検定を行うことができる．

chisq.test(x=c(n₁, n₂, n₃, ･･･), p=c(p₁, p₂, p₃, ･･･) )

　上記の例では
　　chisq.test(x=c(37, 25, 12, 26), p=c(0.4, 0.2, 0.1, 0.3))
次の結果が得られる．（for given probabilitiesというタイトルで出力がある）

        Chi-squared test for given probabilities

data:  c(37, 25, 12, 26)
X-squared = 2.4083, df = 3, p-value = 0.4921

　この例では，p値が0.4921（>0.05）だから，有意差は認められない．

　この問題をExcelで解くには，次のように観測度数の和と期待度数の和を一致させて期待度数の表を作り，カイ２乗検定を行えば，Ｒで得られた結果と一致する．

血液型	Ａ型	Ｂ型	ＡＢ型	Ｏ型	合計
観測度数	37	25	12	26	100
期待度数	40	20	10	30	100

　この表を使って，=CHITEST(観測度数の範囲, 期待度数の範囲)［ただし，周辺和は含めない］とすると，ｐ値=0.4921が得られる．

【例題1.2.1】

-- 表3 --
出た目の数	1	2	3	4	5	6	計
観測度数	15	20	17	13	16	19	100

　右の表3は，サイコロを100回振って，出た目の数を記録したものです．このサイコロが正しく作られているかどうか，カイ２乗検定を使って調べてください．

-- 表4 --
出た目の数	1	2	3	4	5	6	計
観測度数	150	200	170	130	160	190	1000

　また，右の表4についても同様に調べてください．

（解答）
　Rでは，表3に対しては，次のように入力すればよい．

 chisq.test(x=c(15,20,17,13,16,19),
          p=c(1/6,1/6,1/6,1/6,1/6,1/6))

　次の結果が得られる．

        Chi-squared test for given probabilities

data:  c(15, 20, 17, 13, 16, 19)
X-squared = 2, df = 5, p-value = 0.8491

p値=0.8491（>0.05）だから，適合性の仮定は棄却されない．（不正はない）

　表4に対しては，次のように入力すればよい．

 chisq.test(x=c(150,200,170,130,160,190),
          p=c(1/6,1/6,1/6,1/6,1/6,1/6))

　次の結果が得られる．

        Chi-squared test for given probabilities

data:  c(150, 200, 170, 130, 160, 190)
X-squared = 20, df = 5, p-value = 0.00125

p値=0.00125（<0.05）だから，適合性の仮定は棄却される．正しく作られたサイコロではない．

注：表3と表4は，比率としては同じであるが，表3の程度の凹凸なら「普通に起こる話」であるが，表4のような凹凸は「ほとんど，めったに起こりえない話」ということ．

　この問題をExcelで解くには，次のように観測度数の和と期待度数の和を一致させて期待度数の表を作り，カイ２乗検定を行えば，Ｒで得られた結果と一致する．
表3からは

出た目の数	1	2	3	4	5	6	計
観測度数	15	20	17	13	16	19	100
期待度数	16.667	16.667	16.667	16.667	16.667	16.667	100

※期待度数は，小数のまま．各セルの値は四捨五入されているので，和は100.002などとなるが気にしない．
p値=0.8492

表4からも同様にして，期待度数の各セルを166.667とすると，p値=0.00125が得られる

1.3　フィッシャーの正確確率検定

（↑ページの先頭へ）

　独立性の検定，適合性の検定に使われるカイ２乗検定では，どのセルの期待度数も5以上であれば，近似は十分であると言われているが，もっと小さな値のセルが登場する場合には，フィッシャーの正確確率検定を用いる．

【例題1.3.1】

-- 表5 --
	音楽	美術	計
男子	7	3	10
女子	4	6	10
計	11	9	20

　右の表5は，ある学級の生徒20人の芸術選択科目を男女別に集計したものです．
　この学級の芸術選択科目は男女間で有意な差があると言えるか.

（解答）
　観測度数が小さいセルがあるので，カイ２乗検定に依らず，フィッシャーの正確確率検定によって調べる．
Rで計算する場合
関数fisher.test()を次の形で使うと，フィッシャーの正確確率検定を行うことができる．alternativeを省略すると両側検定になる．
片側検定を行うには，alternative="greater"（または="g"）により連関係数の大きい方（Dの大きい方），alternative="less"（または="l"エル）で連関係数の小さい方（Ｄの小さい方）を指定するための引数を追加する．

fisher.test(観測度数の行列, alternative)

• Rのコンソール画面で，次のように入力して行列を作る

mx<-matrix(c(7,3,4,6),2,2,byrow=T)

•　次にフィッシャー検定の関数にその行列を渡す．

fisher.test(mx)

⇒　既定値で両側検定の結果が得られる．
p-value = 0.3698(>.05)だから有意差なし
　次の入力は，男子の音楽が女子よりも多い方に偏っている（女子の美術が男子よりも多い方に偏っている）片側検定になる．

fisher.test(mx,alternative="g")

⇒　p-value = 0.1849(>.05)だから有意差なし

Excelのワークシート関数で行うには，片側検定なら次のア～エを，両側検定なら、さらにオ～クの表となる組合せを数える．

ア D=90−0=90
	音楽	美術	計
男子	10	0	10
女子	1	9	10
計	11	9	20

イ D=72−2=70
	音楽	美術	計
男子	9	1	10
女子	2	8	10
計	11	9	20

ウ D=56−6=50
	音楽	美術	計
男子	8	2	10
女子	3	7	10
計	11	9	20

エ D=42−12=30
	音楽	美術	計
男子	7	3	10
女子	4	6	10
計	11	9	20

オ D=12−42=−30
	音楽	美術	計
男子	4	6	10
女子	7	3	10
計	11	9	20

カ D=6−56=−50
	音楽	美術	計
男子	3	7	10
女子	8	2	10
計	11	9	20

キ D=2−72=−70
	音楽	美術	計
男子	2	8	10
女子	9	1	10
計	11	9	20

ク D=0−90=−90
	音楽	美術	計
男子	1	9	10
女子	10	0	10
計	11	9	20

ア：₁₁C₁₀×₉C₀=11×1=11
イ：₁₁C₉×₉C₁=55×9=495
ウ：₁₁C₈×₉C₂=165×36=5,940
エ：₁₁C₇×₉C₃=330×84=27,720
小計：34,166
オ：₁₁C₄×₉C₆=330×84=27,720
カ：₁₁C₃×₉C₇=165×36=5,940
キ：₁₁C₂×₉C₈=55×9=495
ク：₁₁C₁×₉C₉=11×1=11
小計：34,166
20人から男子10人をとる組合せ：₂₀C₁₀=184,756
片側確率：34,166÷184,756=0.1849...
両側確率：68,332÷184,756=0.3698...

【例題1.3.2】

-- 表6 --
	効果あり	効果なし	計
旧薬	5	9	14
新薬	10	3	13
計	15	12	27

　右の表6は，新しいお薬と古いお薬の効果を調べたものです．（アンケート結果の人数）
　新薬は旧薬よりも効果があるかどうか検定してください．

（解答）
• Rのコンソール画面で，次のように入力して行列を作る

mx<-matrix(c(5,9,10,3),2,2,byrow=T)

•　次にフィッシャー検定の関数にその行列を渡す．新薬が効果がある方は元の行列とそれより連関が小さい方（D≦15−90=−75）

fisher.test(mx,alternative="l")

⇒　片側検定の結果が得られる．
p-value = 0.03771(<.05)だから有意差あり
新薬は旧薬よりも効果があると言える．

Excelのワークシート関数で行うには，片側検定なら次のア～エの表となる組合せを数える．

ア D=15−90=−75
	効果あり	効果なし	計
旧薬	5	9	14
新薬	10	3	13
計	15	12	27

イ D=8−110=−102
	効果あり	効果なし	計
旧薬	4	10	14
新薬	11	2	13
計	15	12	27

ウ D=3−132=−129
	効果あり	効果なし	計
旧薬	3	11	14
新薬	12	1	13
計	15	12	27

エ D=0−156=−156
	効果あり	効果なし	計
旧薬	2	12	14
新薬	13	0	13
計	15	12	27

ア：₁₅C₁₀×₁₂C₃=3,003×220=6,606,601
イ：₁₅C₁₁×₁₂C₂=1,365×66=90,090
ウ：₁₅C₁₂×₁₂C₁=455×12=5,460
エ：₁₅C₁₃×₁₂C₀=105×1=105
小計：756,315
27人から13人をとる組合せ：₂₇C₁₃=20,058,300
片側確率：756,315÷20,058,300=0.0377...(<.05)だから有意差あり
新薬は旧薬よりも効果があると言える．

2.　対応ありの場合

（↑ページの先頭へ）

　２つの対応のある標本の比率の差の検定（値の変化の比較）

-- 表7 --
前後	支持する	支持しない	計
支持する	24	18	42
支持しない	33	25	58
計	57	43	100

　表7は，100人の有権者に対するアンケート調査の結果で，「ある発表」が行われる前と後のある政党を「支持する」「支持しない」の変化を集計したものとします．（架空データ）
　このように，「ある発表」の前後という異なる条件下で､①同じ参加者（統計的には標本）に対して，②同じ分類項目の質問をしたときの結果が得られたとき，③母比率に変化があると見なせるかどうかを検定するときに「マクネマー検定」が用いられる．
　標本の総数（表7の例では，N＝100）が小さいとき（N≦25）は「二項検定」を用いる．

（閑談）
　マクマネーではない（#怒#）．アイルランド系の人名で「息子」という意味のMacという接頭語のつく姓にはマクドナルド（MacDonald, McDonald），マッキントッシュ（Macintosh, McIntosh）など多数ある．マクネマー（McNemar）という名前もそういう雰囲気であるが，Rの検定で使う関数名は，すべて小文字で mcnemar.test()と書く．

2.1　マクネマー検定

（↑ページの先頭へ）

　表7のデータに対して，カイ２乗検定では行の全体・列の全体を見て，独立かどうかを判断するのに対して，マクネマー検定では「変化のないセルには注目しない」「変化のあるセルだけを見る」．
　表7で前：「支持する」→後：「支持する」，前：「支持しない」→後：「支持しない」の参加者は態度に変化が見られない．
　これに対して，前：「支持しない」→後：「支持する」，前：「支持する」→後：「支持しない」と変化している部分が，偶然的な凸凹の範囲と見なせるか，有意な変化と見なせるかを判断する．

-- 表8 --
前後	○	×	計
○	A	B	A+B
×	C	D	C+D

-- 表9 --
	×→○	○→×	計
観測度数	C	B	C+B
期待度数	$\frac{C+ B}{2}$	$\frac{C+ B}{2}$	C+B

　表8のうちで，支持（○）不支持（×）が変化したセルB,Cだけに注目し，A:○→○，D:×→×を見ないことにすると，表9の上の行ができる．
　合計B+Cの観測度数に対して，「○×の増減が何もない」とすると，期待度数の行の値になるはずであるが，観測度数のような分布になるのは，めったにない有意なことなのか，偶然の凸凹で起こりうることなのかを調べる．
　(観測度数−期待度数)²／期待度数　を足して，カイ２乗の値を求める．通常Qで表す．
$Q=\frac{(C-\frac{C+ B}{2})^2}{\frac{C+ B}{2}}+\frac{(B-\frac{C+ B}{2})^2}{\frac{C+ B}{2}}$
$=\frac{(\frac{C-B}{2})^2}{\frac{C+ B}{2}}+\frac{(\frac{B-C}{2})^2}{\frac{C+ B}{2}}$ $=\frac{\frac{(C-B)^2}{4}}{\frac{C+ B}{2}}+\frac{\frac{(B-C)^2}{4}}{\frac{C+ B}{2}}$
$=\frac{\frac{(B-C)^2}{2}}{\frac{C+ B}{2}}=\frac{(B-C)^2}{B+ C}$
　このQの値を自由度1のカイ２乗検定で調べる．
　上の例では， $Q=\frac{15^2}{51}=4.412(\gt 3.84=\chi_0^2)$
であるから，支持者が有意に増えたと言える．

【Excelで調べる場合】
次の①②③のどれで行っても同じ結果が得られる．
①　=CHIDIST(4.412, 1)→0.0357 (<0.05)
だから変化はないという仮説は棄却される．
②　=CHIINV(0.05, 1)→3.841 (<4.412)
だから変化はないという仮説は棄却される．

	A	B
1	33	18	←観測度数
2	25.5	25.5	←期待度数

③　右のような表（1×2の表を２行並べる）を作っておき，=CHITEST(観測度数の範囲, 期待度数の範囲)→0.0357 (<0.05)
だから変化はないという仮説は棄却される．

• Rを使ってマクネマー検定を行うには，以上の前処理は不要で，単純に行列を入力すればよい．
• Rのコンソール画面で，次のように入力して行列を作る

mx<-matrix(c(24,18,33,25),2,2,byrow=T)

•　次にマクネマー関数にその行列を渡す．ただし，デフォルトで連続性の補正（イェーツの補正）が行われるので，この補正を行わない場合は，correct=FALSE （もしくは =F）を指定する．

mcnemar.test(mx, correct=F)

⇒　p値=0.03569(<.05)となって有意差あり

　セルの値が小さいとき，連続性の補正（イェーツの補正）がしばしば行われる．この場合は，上記のQの値の代わりに，次の式が使われる．
$Q=\frac{(\mid B-C\mid -1)^2}{B+ C}$
　連続性の補正を行う場合の結果は次のようになる．
• Rで行う場合

mcnemar.test(mx)

Q=3.8431, df = 1, p=0.04995(<.05)となって有意差あり

• Excelで行う場合
次の①②のどれで行っても同じ結果が得られる．
①　=CHIDIST(3.843, 1)→0.04994 (<0.05)
だから変化はないという仮説は棄却される．
②　=CHIINV(0.05, 1)→3.841 (<3.843)
だから変化はないという仮説は棄却される．

※変化しないセルの値が大きい場合に，マクネマー検定の結果を鵜呑みにして，機械的に判断するのは危ない場合がある．
　例えば，次の表のように支持→支持，支持しない→支持しないという形で，態度の変化がほどんどない場合でも，マクネマー検定では，変化した部分の増減だけを見ているので，有意差が認められる．

前後	支持する	支持しない	計
支持する	195	5	200
支持しない	18	182	200
計	213	187	400

　この表を見れば，支持率は， 200/400=0.5000 → 213/400=0.5325で，3.3%増えただけというのが常識的な見方になる．（「わかって楽しい心理統計法入門」松田文子他著/北大路書房 P.179の論旨参照）

【例題2.1.1】

-- 表10 --
前後	行く	行かない	計
行く	48	5	53
行かない	18	35	53
計	66	40	106

　右の表10は，スーパーのチラシを見た結果，そのスーパーに行く予定があるか否か，消費者の意識の変化を調べたものです．（アンケート結果の人数：架空データ）
　このチラシの効果を述べてください．

（解答）
• Rを用いてマクネマー検定を行う場合
• Rのコンソール画面で，次のように入力して行列を作る

mx<-matrix(c(48,5,18,35),2,2,byrow=T)

mcnemar.test(mx, correct=F)

⇒　p値=0.006714(<.05)となって有意差あり

連続性の補正を行う場合は

mcnemar.test(mx)

⇒　p値= 0.01234(<.05)となって有意差あり
チラシの効果が認められる

• Excelで行う場合
　変化した部分のカイ２乗値を求める．
$Q=\frac{(B-C)^2}{B+ C}=7.348$
次の①②③のいずれでもよい．（ただし，連続性の補正を行わない場合となっている）
① =CHIDIST(7.348, 1)→0.0067 (<0.05)だから，有意差あり
② =CHIINV(0.05, 1)→3.841 (< 7+348)だから，有意差あり
③　変化を調べるセルの観測度数18, 5に対して期待度数23/2, 23/2のセルを作っておき，=CHITEST(観測度数の範囲, 期待度数の範囲)とすると，0.0067 (<0.05)だから，有意差あり

2.2　二項検定

（↑ページの先頭へ）

　マクネマー検定において，標本総数がN≦25となる場合は，カイ２乗を使った計算の近似が不正確となるので，二項分布を用いた直接計算（二項検定）を行う．

【二項分布とは】
　１回の試行である事柄が起こる確率がpのとき，この試行をn回行ったときに，その事柄がk回起こる確率は
$_nC_kp^k(1-p)^{n-k}$
となる．このような確率分布を二項分布という．

【例1】
　例えば，１枚の10円硬貨を投げたとき，表（平等院鳳凰堂のある方）が出る確率はp=(1/2)，裏が出る確率もq=1−p=(1/2)だから，10円硬貨を6回投げたときに，表が出る回数とその確率は次のようになる．
• 表が0回： $_6C_0(\frac{1}{2})^0(\frac{1}{2})^{6}=1\times(\frac{1}{2})^6$
• 表が1回： $_6C_1(\frac{1}{2})^1(\frac{1}{2})^{5}=6\times(\frac{1}{2})^6$
• 表が2回： $_6C_2(\frac{1}{2})^2(\frac{1}{2})^{4}=15\times(\frac{1}{2})^6$
• 表が3回： $_6C_3(\frac{1}{2})^3(\frac{1}{2})^{3}=20\times(\frac{1}{2})^6$
• 表が4回： $_6C_4(\frac{1}{2})^4(\frac{1}{2})^{2}=15\times(\frac{1}{2})^6$
• 表が5回： $_6C_5(\frac{1}{2})^5(\frac{1}{2})^{1}=6\times(\frac{1}{2})^6$
• 表が6回： $_6C_6(\frac{1}{2})^6(\frac{1}{2})^{0}=1\times(\frac{1}{2})^6$
どの確率にも $(\frac{1}{2})^6$ が掛けられているが，係数だけ書くと次の表になる．

回数	0	1	2	3	4	5	6	計
係数	1	6	15	20	15	6	1	64

　例えば，k=2（10円硬貨を6回投げて，ちょうど２回表が出る）となる確率は， $\frac{15}{64}$
　k≦2（10円硬貨を6回投げて，表が２回以下）となる確率は， $\frac{1+ 6+ 15}{64}=\frac{22}{64}\simeq0.3437$
　次のグラフで桃色の部分の面積は，約34%
○　サイコロを６回投げて，表の出る回数が２回以下となるのは，珍しいことではない．(0.3437 > 0.05)

【例2】
　例えば，１枚の10円硬貨を投げたとき，表（平等院鳳凰堂のある方）が出る確率はp=(1/2)，裏が出る確率もq=1−p=(1/2)だから，10円硬貨を12回投げたときに，表が出る回数とその確率は次のようになる．
• 表が0回： $_{12}C_0(\frac{1}{2})^0(\frac{1}{2})^{12}=1\times(\frac{1}{2})^{12}$
• 表が1回： $_{12}C_1(\frac{1}{2})^1(\frac{1}{2})^{11}=12\times(\frac{1}{2})^{12}$
• 表が2回： $_{12}C_2(\frac{1}{2})^2(\frac{1}{2})^{10}=66\times(\frac{1}{2})^{12}$
･･･
• 表が12回： $_{12}C_{12}(\frac{1}{2})^0(\frac{1}{2})^{12}=1\times(\frac{1}{2})^{12}$
どの確率にも $(\frac{1}{2})^{12}$ が掛けられているが，係数だけ書くと次の表になる．

回数	0	1	2	3	･･･	12	計
係数	1	12	66	220	･･･	1	4096

　例えば，k=2（10円硬貨を12回投げて，ちょうど２回表が出る）となる確率は， $\frac{66}{4096}$
　k≦2（10円硬貨を12回投げて，表が２回以下）となる確率は， $\frac{1+ 12+ 66}{4096}=\frac{79}{4096}\simeq0.019$
　次のグラフで桃色の部分の面積は，約1.9%
○　サイコロを12回投げて，表の出る回数が２回以下となるのは，めったに起こらない．(0.019 < 0.05)

【例題2.2.1】

-- 表11 --
前後	よい	悪い	計
よい	9	2	11
悪い	7	4	11
計	16	6	22

　右の表11は，ある番組を見た結果，その番組の主演タレントの印象がよくなったか悪くなったか，視聴者の意識の変化を調べたものです．（アンケート結果の人数：架空データ）
　この番組で主演タレントの印象がよくなったかどうか述べてください．

（解答）
• 標本が小さい（N≦25）ので，二項検定によって調べる．
• Rを用いて，二項検定を行う場合，binom.test()関数に，次の引数を指定する．

binom.test(x, n, p, alternative)

• 第１引数x･･･n回の試行のうちで，ある事柄がx回起こるという場合の起こる回数がxで，試行回数がn
　だから，9回の試行のうち，ある事柄が2回起こる二項検定を行うには，binom.test(2, 9, ...)とする．
• 1回の試行である事柄が起こる確率がp．p=の形の指定が省略されたときは，p=0.5と見なされる．
• alteranative=により両側検定，片側検定を区別する．alternative=が省略されたとき，またはalternative="two.sided"（="t"でも可）で両側検定になる．
「x以下」となる片側確率を求めるには，alternative="less"（="lエル"も可），「x以上」となる片側確率を求めるには，alternative="greater"（="g"も可）

　この問題では，変化のあった２つのセルについて，観測度数の１×２表を作る．

	×→○	○→×	計
観測度数	7	2	9

　そこで，x=2, n=9,（p=0.5は省略可），alternative="l"（２回以下=0,1,2回となる確率を求める）

 binom.test(2,9,alternative="l")

　次の結果が得られる．
p-value = 0.08984（>0.05）により，有意差は見られない．
印象が悪くなった場合も含めて，印象のよし悪しが変わった確率を求める場合は両側検定とする．この場合は，次のように入力すればよい．

 binom.test(2,9)

結果は，p-value = 0.1797となるが，元の問題文から言えば片側検定で十分だと考えられる．

• Excelを用いて二項検定を行う場合

=BINOMDIST(x, n, p,TRUEまたはFALSE)

　ここで，x, n, pはRと同じ.第４引数はTRUEまたは1により累積確率（その値以下），FALSEまたは0によりその値となる確率が得られる．
　この問題では，=BINOMDIST(2, 9, 0.5, 1)により，上記と同じ片側検定が行われる．（Excelで両側検定にするには，左右対称である場合は片側確率を２倍すればよい）

【例題2.2.2】

-- 表12 --
前後	買う	買わない	計
買う	10	2	12
買わない	9	3	12
計	19	5	24

　右の表12は，ある広告を見た結果，その製品を買う気になったか買う気がないか，消費者の意識の変化を調べたものです．（アンケート結果の人数：架空データ）
　この広告でその製品の購買意欲が変化したかどうか述べてください．

（解答）
• 標本が小さい（N≦25）ので，二項検定によって調べる．
• Rで調べる場合

 binom.test(2,11,alternative="l")

　次の結果が得られる．
p-value = 0.03271（<0.05）により，有意差が見られる．（片側検定）
※両側検定では，binom.test(2,11)→ 0.06543(>0.05)となって､有意差は見られない．

• Excelを用いて二項検定を行う場合
=BINOMDIST(2, 11, 0.5, 1)により，上記と同じ片側検定が行われる．（Excelで両側検定にするには，左右対称である場合は片側確率を２倍すればよい）

...（PC版）メニューに戻る