カイ２乗分布，カイ２乗検定

■カイ２乗分布（χ²分布）[chi-square distribution]　･･･　比率の検定
※　このページは推定･検定の内容を前提としています． ◇簡単な例でイメージ作り(1)◇

例１

　日本人のABO式血液型の分布はおよそＡ型40%，B型20%，AB型10%，O型30%だといわれている．ある村で献血に応じた者のうち先着100人の血液型は次の表のとおりであった．(ただしデータは架空のもの）

血液型Ａ型Ｂ型 AB型 O型計

度数 37 25 12 26 100

　この村の住人の血液型分布は，日本人全体の血液型分布とほぼ同じと見なしてよいか？

(考え方)　

　もし，完全に一致していたら，次の表の期待度数で示される人数となるはずであるが，標本調査の場合には少々の凹凸はありうる．どの程度の差異ならば偶然として許容されるかと考える．

血液型Ａ型Ｂ型 AB型 O型計

観測度数 37 25 12 26 100

期待度数 40 20 10 30 100

　標準偏差を定義したときの式の作り方から類推して　Σ(差)²　を考えると，
(37-40)²+(25-20)²+(12-10)²+(26-30)² 　この式は，観測値が大きくなると必要以上に大きくなり過ぎる．実際，標本を10倍に増やしたときを考えると，次の分布が上の分布と比較して100倍ずれているとは言えない．

血液型Ａ型Ｂ型 AB型 O型計

観測度数 370 250 120 260 1000

期待度数 400 200 100 300 1000

　そこで，各々の(差)²を各々の期待度数で割った次の式を考え，χ²と呼ぶ．（２つの分布が完全に一致していればこの式の値は0となり，食い違いが大きいほど大きな数となる．）

※期待度数で割るということは，期待度数１つ当たりの値に直して考えていることになる

χ² =
= 2.41

　この問題においては，期待度数の4個の数値の内3個までは変数として決められるが残り１個は合計から自動的に定まるので，このような分布を自由度3のχ²分布という．自由度3のχ²分布において，有意水準5%の限界値は，理論的なモデルから7.81と求められていて，これと比較して
χ²＜7.81 だから有意水準5%で「有意差はない」と言える．

［与えられた母集団の分布と一致しているかどうかを判定するものは，適合性の検定と呼ばれる］

（少しだけ理屈を！）
○　次のような観測データの分布を基準の比率と比較するには

	項目1	項目2	･･･	項目n
観測値の度数O	O₁	O₂	･･･	O_n
基準値の度数E	E₁	E₂	･･･	E_n

　次の式で定義されるカイ２乗値
χ² =

を，理論的な計算で求めたχ²値と比較すればよい．
○　なぜ，この方法でできるのかという数学的根拠は難しい
　「ｎ個の変数が各々独立に標準正規分布に従うとき」（自由度ｎ），それらの２乗の和 χ²=Z₁²+Z₂²+…Z_n² は，標準正規分布（の２乗）を単純にｎ倍したものにはならず，自由度ｎのカイ分布と呼ばれるものになる．（シミュレーションにより目で確かめる方法は「仕事に役立つEXCEL統計解析」p.186～に出ている）
　しかし，利用する側から見れば「前提条件に気をつけながら当てはめるだけ」で利用できる．

○　χ²分布関数は自由度に応じて関数の形が異なり，1枚の表にまとめられないので，自由度-よく使う確率（5%，1%など）からχ²を読み取るように作られている．（コンピュータではこの制限はない．）次の表では，自由度3でp=0.05に対応するχ²の値は7.815となる．

（pは右片側面積）

自由度＼ｐ	0.995	0.975	0.05	0.025	0.01	0.005
1	0.000	0.001	3.841	5.024	6.635	7.879
2	0.010	0.051	5.991	7.378	9.210	10.597
3	0.072	0.216	7.815	9.348	11.345	12.838
4	0.207	0.484	9.488	11.143	13.277	14.860
5	0.412	0.831	11.070	12.832	15.086	16.750
･･･	･･･	･･･	･･･	･･･	･･･	･･･

○　χ²は0以上の値に対して定義され，0のとき完全一致し，差異があるほど値が大きくなる．

○　χ²分布表:［ ↓こちら］［非表示］）

自由度＼p 0.995 0.975 0.05 0.025 0.01 0.005

1 0.000 0.001 3.841 5.024 6.635 7.879

2 0.010 0.051 5.991 7.378 9.210 10.597

3 0.072 0.216 7.815 9.348 11.345 12.838

4 0.207 0.484 9.488 11.143 13.277 14.860

5 0.412 0.831 11.070 12.832 15.086 16.750

6 0.676 1.237 12.592 14.449 16.812 18.548

7 0.989 1.690 14.067 16.013 18.475 20.278

8 1.344 2.180 15.507 17.535 20.090 21.955

9 1.735 2.700 16.919 19.023 21.666 23.589

10 2.156 3.247 18.307 20.483 23.209 25.188

11 2.603 3.816 19.675 21.920 24.725 26.757

12 3.074 4.404 21.026 23.337 26.217 28.300

13 3.565 5.009 22.362 24.736 27.688 29.819

14 4.075 5.629 23.685 26.119 29.141 31.319

15 4.601 6.262 24.996 27.488 30.578 32.801

16 5.142 6.908 26.296 28.845 32.000 34.267

17 5.697 7.564 27.587 30.191 33.409 35.718

18 6.265 8.231 28.869 31.526 34.805 37.156

19 6.844 8.907 30.144 32.852 36.191 38.582

20 7.434 9.591 31.410 34.170 37.566 39.997

21 8.034 10.283 32.671 35.479 38.932 41.401

22 8.643 10.982 33.924 36.781 40.289 42.796

23 9.260 11.689 35.172 38.076 41.638 44.181

24 9.886 12.401 36.415 39.364 42.980 45.558

25 10.520 13.120 37.652 40.646 44.314 46.928

26 11.160 13.844 38.885 41.923 45.642 48.290

27 11.808 14.573 40.113 43.195 46.963 49.645

28 12.461 15.308 41.337 44.461 48.278 50.994

29 13.121 16.047 42.557 45.722 49.588 52.335

30 13.787 16.791 43.773 46.979 50.892 53.672

40 20.707 24.433 55.758 59.342 63.691 66.766

50 27.991 32.357 67.505 71.420 76.154 79.490

60 35.534 40.482 79.082 83.298 88.379 91.952

70 43.275 48.758 90.531 95.023 100.425 104.215

80 51.172 57.153 101.879 106.629 112.329 116.321

90 59.196 65.647 113.145 118.136 124.116 128.299

100 67.328 74.222 124.342 129.561 135.807 140.170

110 75.550 82.867 135.480 140.916 147.414 151.948

120 83.852 91.573 146.567 152.211 158.950 163.648

130 92.223 100.331 157.610 163.453 170.423 175.278

140 100.655 109.137 168.613 174.648 181.841 186.847

◇簡単な例でイメージ作り(2)◇

例２

　ある果物をＡ方式で育てたものとＢ方式で育てたものの出荷時の等級が次の表のようになったとき，これらの育て方と製品の等級には関連があると見るべきかどうか．（ただしデータは架空のもの）

集計表優良可計

Ａ方式 12 30 58 100

B方式 14 90 96 200

計 26 120 154 300

(考え方)　

　A，Bが独立であるとき，分割表は次のようになる．

集計表優良可計

Ａ方式 8.7 40.0 51.3 100

B方式 17.3 80.0 102.7 200

計 26 120 154 300

　これらの観測度数と期待度数について，前の例１と同様にカイ2乗値を求める．
χ²=
=6.97
　自由度2，有意水準5%のときχ²⁼5.99　
5.99＜6.97 だから有意差があり，育て方と製品の等級には関連がある．

［２つのグループで比率に差異があるかどうかを判断するものは，独立性の検定と呼ばれる．］

（少しだけ理屈を！）
○　２つの育て方が製品の等級に影響しない（育て方と製品の等級が独立なとき）ときは，次の表においてa₁:a₂:a₃=b₁:b₂:b₃が成り立つはずである．

集計表	優	良	可	計
Ａ方式	a₁	a₂	a₃	100
B方式	b₁	b₂	b₃	200
計	26	120	151	300

　このとき，表の周辺和（黄色の背景で示した値：行小計，列小計）を元に考えると，a₁:b₁=100:200でa₁+b₁=26のように各々の値は，縦の計を右端の周辺和(行小計)の比率に配分したものとなるはずであるから，
a₁ = 26×100/300=8.7
b₁ = 26×200/300=17.3
他の値についても，期待度数を埋めることができる．

○　各マスの (O_ij-E_ij)²/E_ij の和
χ²=

が自由度(m-1)(n-1)についての有意水準αを超えていれば，これらの方式は独立ではない（有意差がある）と言える．

○　日常生活では，行小計に対する割合で表わした表

== データに問題あり ==
集計表	優	良	可	計
Ａ方式	12%	30%	58%	100%
B方式	7%	45%	48%	100%

を元に「少し違う」「あまり違わない」といった議論をしがちであるが，カイ２乗を用いた検定は，割合ではなく，度数を用いて計算することが重要．

※この表のように，元の度数分布表（整数値）がなくて割合の数値だけになっている場合，そもそも検定はできない．

■要約■
1
　ある標本の各カテゴリー（分類項目）ごとの比率が，基準の比率と一致しているかどうかを判定するものは，適合度の判定と呼ばれる．

　観測度数が右の表１のようになったとき，この度数分布が表2で与えられる母集団の割合と一致するかどうかを判断するには，

(1)　表3のように計Nから理論的に求まる期待度数と観測度数を比較して
カイ２乗値
χ² =
を，求める．

(2)　この場合，ｎ個の期待度数を変数と見るとき，これらの和はNでなければならないから，自由に決められるのはn-1個で残り１個は自動的に定まる．→自由度はn-1と考える．

(3)　次のグラフにおいて，多くの場合，右片側検定を考える．（pは右片側面積）
(4)　χ²分布表により，多くの場合，有意水準5%のχ²値と比較し，これよりも大きければ帰無仮説を棄却して有意差ありとし，そうでなければ有意差なしとする．

表1

	項目１	項目２	･･･	項目n	計
観測度数	x₁	x₂	･･･	x_n	N

表2

	項目１	項目２	･･･	項目n	計
割合	p₁	p₂	･･･	p_n	1

表3

	項目１	項目２	･･･	項目n	計
観測度数	x₁	x₂	･･･	x_n	N
期待度数	p₁×N	p₂×N	･･･	p_n×N	N

○　分類項目1～nはカテゴリーデータでもよいし，定量的データ（もしくはそれらの階級）でもよい．

○　期待度数が5未満のものがあるとき，分類の項目を併合して5以上にする．（カイ２乗分布という連続曲線で近似するためには，どの期待度数も p_k×N≧5を満たすことが条件とされている．）
例

	優	良	可	不可	計
観測度数	7	18	10	9	44
期待度数	3	16	15	10	44

	秀	可	不可	計
観測度数	25	10	9	44
期待度数	19	15	10	44

２
　２つの属性によって分類した分割表（クロス集計表）から，これらの分類が独立（無関係）かどうか調べるものは，独立性の検定と呼ばれる．

　右の表4のような分割表（クロス集計表）が得られたとき，２つの属性が独立（無関係）かどうか･･･項目A,B,Cに差異があるかどうかを判断するには

(1)　集計表の周辺和(行小計，列小計)の比率で割り出した期待度数を求める．（たとえば，項目A-項目1の期待度数はn_･1×n_1･/n）→表5

(2)　２つの表のすべてのマス目からカイ２乗値を計算する：
χ² =

(3)　期待度数を計算するときに，右の表6のように行と列の各々残り１つは小計から自動的に決まるから，自由度は2×3
［一般にｍ×ｎの分割表では，自由度は(m-1)(n-1)となる．］

(3)　次のグラフにおいて，多くの場合，右片側検定を考える．（pは右片側面積）
(4)　χ²分布表により，多くの場合，有意水準5%のχ²値と比較し，これよりも大きければ帰無仮説を棄却して有意差ありとし，そうでなければ有意差なしとする．

※重要　観測値は，観測度数を用いることが重要--割合表（％）では検定はできない．（同じ割合でも度数が異なれば検定結果は異なる．）

表4

観測度数	項目1	項目2	項目3	項目4	計
項目A	O₁₁	O₁₂	O₁₃	O₁₄	n_1･
項目B	O₂₁	O₂₂	O₂₃	O₂₄	n_2･
項目C	O₃₁	O₃₂	O₃₃	O₃₄	n_3･
計	n_･1	n_･2	n_･3	n_･4	n

表5

期待度数	項目1	項目2	項目3	項目4	計
項目A	E₁₁	E₁₂	E₁₃	E₁₄	n_1･
項目B	E₂₁	E₂₂	E₂₃	E₂₄	n_2･
項目C	E₃₁	E₃₂	E₃₃	E₃₄	n_3･
計	n_･1	n_･2	n_･3	n_･4	n

表6　［自由度］

期待度数	項目1	項目2	項目3	項目4	計
項目A	E₁₁	E₁₂	E₁₃	*	n_1･
項目B	E₂₁	E₂₂	E₂₃	*	n_2･
項目C	*	*	*	*	n_3･
計	n_･1	n_･2	n_･3	n_･4	n

※　E₁₁～E₃₄は小数部分を四捨五入して整数化してもよいが，途中経過はすべて実数（小数）でおこなうので，小数のままでもよい．

※　２×２の分割表では，期待度数のうち幾つかが4以下であっても分類の項目を併合すると意味がなくなる．この場合，標本の個数（観測度数）を大きくすることができなければ，「イエーツ（イエツ）の(連続)補正」呼ばれる方法（小さい方の期待度数に0.5を加える方法）がとられることがある．（離散分布を連続分布で近似するときに，真の値の限界を２つの整数の中央とするのと同様の考え方で，この方が経験的にも有効であるとされている．なお，列小計，行小計は変えない．

期待度数	項目１	項目２	計
項目A	4	15	19
項目B	7	11	18
計	11	26	37

期待度数	項目１	項目２	計
項目A	4+0.5	15-0.5	19
項目B	7-0.5	11+0.5	18
計	11	26	37

【フィッシャーの正確確率検定について】
　５よりも小さなセルの値を含む分割表に対しては，カイ２乗曲線で近似できず，カイ２乗検定をそのまま適用するのは無理がある．
　このような場合に対しては，「フィッシャーの正確確率検定」が適用できる．これは，条件を満たす組合せに対して直接確率計算を行うもので，理屈上は各セルの値が大きい場合にも適用できる．ただし，各セルの値が２桁，３桁になるとフィッシャーの正確確率検定では，巨大な整数の掛け算・割り算になるため，誤差がひどくなる．セルの値が大きな場合は，やはり「カイ２乗検定」が有利だと言える．
　フィッシャーの正確確率検定の解説は，このページ

※　カイ２乗検定で「有意差がある」かどうかを調べるには，右側の片側検定を用いればよい．

「一致し過ぎ」を捉えたいとき（似すぎている文体を特定語彙の使用頻度で検出するなど）は左側の片側検定とすればよい．

「一致し過ぎ」のも「離れ過ぎ」のも捉えるには両側検定とすればよい．（5%のときは左右2.5%ずつ→97.5%と2.5%の表を読む）

※　２×２分割表とそれ以外とで公式を分けて考える解説書もあるが，このページでは１つの公式で解説した．（別公式で考える立場もあるということは頭の隅に！）　

■例と答■
(1)　［適合性の検定･･･片側検定］

　さいころを600回ふったとき出た目の回数は次のとおりとなった．このさいころは正しく作られているか．有意水準5%で検定せよ．

出た目	1	2	3	4	5	6	計
回数	103	95	102	97	108	95	600

（解答）
「帰無仮説：H₀　さいころは正しく作られている．
　対立仮説：H₁　さいころは正しく作られていない．」とする．
　帰無仮説を元に期待度数を計算すると，正しく作られたさいころは各目の出る確率が等しいから，期待度数は各々100となる．

出た目	1	2	3	4	5	6	計
回数	103	95	102	97	108	95	600
期待度数	100	100	100	100	100	100	600

　χ²=3²/100+5²/100+･･･+5²/100 = 1.36
　自由度5，α=0.05のとき， χ²=11.07＞1.36だから有意差はない．正しく作られていると考えられる．

(2)　［独立性の検定･･･片側検定］
　ある単元の授業をA方式で行った50人とB方式で行った50人に各々事後アンケート調査を行った結果は次の表のとおりであった．これら２つの方式は分かりやすさに有意差があるといえるか．有意水準5%で検定せよ．（ただしデータは架空のもの）

	分かりやすい	分かりにくい	計
A方式	28	22	50
B方式	35	15	50
計	63	37	100

　（参考）
　新しい教育システムを考案して，その効果を確かめたいとき，計画，試作，受講の依頼などに数ヶ月かかってしまうため標本データが50人程度しか確保できないことが多い．次の表で実験群，統制群とも50人，統制群が25対25の場合に，シミュレーションしてみると，

測定度数	効果あり	効果なし	計
実験群	34	16	50
統制群	25	25	50
計	59	41	100

　この程度の標本数で「有意差あり」と言えるためには，「効果あり」の度数が「効果なし」の２倍以上なければならないことが分かる．
　標本数が実験群200，統制群200程度になると，もっと低いレベルで有意差が得られる．

（解答）
「帰無仮説：H₀　分かりやすさと教え方の方式は無関係である．
　対立仮説：H₁　分かりやすさと教え方の方式は関係がある．」とする．
　観測度数の周辺和（行小計，列小計）を元に，帰無仮説を前提としたときの期待度数を計算する．

観測度数O_ij	分かりやすい	分かりにくい	計
A方式	28	22	50
B方式	35	15	50
計	63	37	100

期待度数E_ij	分かりやすい	分かりにくい	計
A方式	31.5	18.5	50
B方式	31.5	18.5	50
計	63	37	100

　各成分について (O_ij-E_ij)²/E_ijを求める．

(O_ij-E_ij)²/E_ij	分かりやすい	分かりにくい
A方式	0.389	0.662
B方式	0.389	0.662

　χ²=0.389+0.662+0.389+0.662=2.102
　自由度1，α=0.05のとき χ²=3.84＞2.102であるから帰無仮説は棄却されない．有意差はない．

(3)　［イエーツの補正］
　ある会社の製品を２つの工場で生産したものについて抽出検査をした結果，良品，不良品の度数は次の表のとおりであった．これら２つの工場の不良品発生状況について有意差が見られるか．有意水準5%で検定せよ．
　イエーツの補正を行って近似を良くした場合についても述べよ．（ただしデータは架空のもの）

観測度数	良品	不良品	計
Ａ工場	196	4	200
B工場	93	7	100
計	289	11	300

（解答）
「帰無仮説：H₀　２つの工場の不良品発生比率は同じ．
　対立仮説：H₁　２つの工場の不良品発生比率は同じでない．」とする．
　観測度数の周辺和（行小計，列小計）を元に，帰無仮説を前提としたときの期待度数を計算する．

観測度数O_ij	良品	不良品	計
Ａ工場	196	4	200
B工場	93	7	100
計	289	11	300

期待度数E_ij	良品	不良品	計
Ａ工場	192.7	7.3	200
B工場	96.3	3.7	100
計	289	11	300

各成分について (O_ij-E_ij)²/E_ijを求める．

(O_ij-E_ij)²/E_ij	良品	不良品
A工場	0.058	1.515
B工場	0.115	3.030

　χ²=0.058+1.515+0.115+3.030=4.718
　自由度1，α=0.05のとき χ²=3.84＜4.718であるから帰無仮説は棄却される．有意差が見られる．

(イエーツの補正を行う場合)

期待度数E_ij	良品	不良品	計
Ａ工場	192.7+0.5	7.3-0.5	200
B工場	96.3-0.5	3.7+0.5	100
計	289	11	300

各成分について (O_ij-E_ij)²/E_ijを求める．

(O_ij-E_ij)²/E_ij	良品	不良品
A工場	0.042	1.175
B工場	0.084	1.923

χ²=0.042+1.175+0.084+1.927 = 3.227
自由度1，α=0.05のとき χ²=3.84＞3.227であるから帰無仮説は棄却されない．有意差が見られない．

(4)　［カテゴリーの併合］
　次の表は３つの地区の年齢別人口構成とする．（ただしデータは架空のもの）これら３地区の年齢別人口構成について有意差は認められるか．有意水準5%で検定せよ．

観測度数	0-24	25-49	50-74	75-100	計
A地区	1	13	20	4	38
B地区	4	12	17	9	42
C地区	5	11	17	7	40
計	10	36	54	20	120

（解答）
「帰無仮説：H₀　年齢別人口構成は地区によって変わらない．
　対立仮説：H₁　年齢別人口構成は地区によって差異がある．」とする．
　観測度数の周辺和（行小計，列小計）を元に，帰無仮説を前提としたときの期待度数を計算する．

観測度数	0-24	25-49	50-74	75-100	計
A地区	1	13	20	4	38
B地区	4	12	17	9	42
C地区	5	11	17	7	40
計	10	36	54	20	120

期待度数	0-24	25-49	50-74	75-100	計
A地区	3.2	11.4	17.1	6.3	38
B地区	3.5	12.6	18.9	7.0	42
C地区	3.3	12.0	18.0	6.7	40
計	10	36	54	20	120

０-24歳の期待度数が小さすぎる（≦4）ので，カテゴリーを併合して0-49を１つのカテゴリーとする．

観測度数O_ij	0-49	50-74	75-100	計
A地区	14	20	4	38
B地区	16	17	9	42
C地区	16	17	7	40
計	46	54	20	120
期待度数E_ij	0-49	50-74	75-100	計
A地区	14.6	17.1	6.3	38
B地区	16.1	18.9	7.0	42
C地区	15.3	18.0	6.7	40
計	46	54	20	120

各成分について (O_ij-E_ij)²/E_ijを求める．

(O_ij-E_ij)²/E_ij	0-49	50-74	75-100
A地区	0.022	0.492	0.860
B地区	0.001	0.191	0.571
C地区	0.029	0.056	0.017

　χ²=0.022+0.492+･･･+0.017 = 2.238
　自由度4，α=0.05に対応するχ²値は9.49＞2.238だから帰無仮説は棄却されない．年齢構成に有意差はない．

■Excelの利用■（解説）
○　CHIDIST(カイ２乗値, 自由度)
　右図のようなχ²分布関数[chi-square distribution]において，正の数xと自由度を指定したとき，P(X≧x)となる確率を返す．
　次のχ²分布表との関係では，

自由度＼ｐ	0.995	0.975	0.05	0.025	0.01	0.005
1	0.000	0.001	3.841	5.024	6.635	7.879
2	0.010	0.051	5.991	7.378	9.210	10.597
3	0.072	0.216	7.815	9.348	11.345	12.838
4	0.207	0.484	9.488	11.143	13.277	14.860
5	0.412	0.831	11.070	12.832	15.086	16.750
･･･	･･･	･･･	･･･	･･･	･･･	･･･

=CHIDIST(7.81, 3)　が　0.05
=CHIDIST(13.27, 4)　が0.01　などとなる．

○　CHIINV(確率p, 自由度)
　右図のようなχ²分布関数において，指定された自由度について，確率がp となる正の数ｘを返す．
=CHIINV(0.05, 3)　が　7.815
=CHIINV(0.01, 4)　が　13.277　などとなる．

○　CHITEST(実測値範囲，期待値範囲)
(1)　右表のように観測度数以外に期待度数をあらかじめユーザが入力しておく．
　CHITEST()の実測値範囲に右のB2:G2を指定，期待値範囲に右のB3:G3を指定すると確率pが返される．
　有意水準αと比較して
　CHITEST()＞α　ならば　帰無仮説採択
　CHITEST()＜α　ならば　帰無仮説棄却
　上の例(1)の問題では，=CHITEST(B2:G2,B3:G3) が0.9286　＞0.05 となるから，帰無仮説が採択される．

(2)　独立性の検定の場合も同様．右表の場合，期待度数はあらかじめユーザが入力しておき，実測値範囲にB2:C3を指定，期待値範囲にB6:C7を指定すると，=CHITEST(B2:C3,B6:C7)が0.1470と＞α=0.05なるので帰無仮説採択

◇以上のまとめ◇･･･右片側検定の場合，次のいずれかによる
○カイ２乗値を自分で求めるとき
　CHIDIST(カイ２乗値, 自由度)＜α　ならば棄却域
　　　実演　右の表7でCHIDIST(H5, 5)=0.9286＞0.05　だから帰無仮説採択
　CHIINV(α, 自由度)＜カイ２乗値　ならば棄却域
　　実演　右の表7でCHIINV(0.05, 5)=11.07＞1.36　だから帰無仮説採択
○カイ２乗値を自分で求めないとき
　CHITEST(実測値範囲, 期待値範囲)＜α　ならば棄却域
　（自由度は向こう合わせ）
　　実演　右の表7でCHITEST(B2:G2, B3:G3)=0.9286＞0.05　だから帰無仮説採択

表7

	A	B	C	D	E	F	G	H
1	出た目	1	2	3	4	5	6	計
2	観測度数O	103	95	102	97	108	95	600
3	期待度数E	100	100	100	100	100	100	600
4
5	(O-E)²/E	0.09	0.25	0.04	0.09	0.64	0.25	1.36

表8

	A	B	C	D
1	観測度数O	分かりやすい	分かりにくい	計
2	A方式	28	22	50
3	B方式	35	15	50
4	計	63	37	100
5	期待度数E	分かりやすい	分かりにくい	計
6	A方式	31.5	18.5	50
7	B方式	31.5	18.5	50
8	計	63	37	100

■Excelの利用．例と答■
(1)
　さいころを60回振って出た目を記録した．このさいころは正しく作られているかどうか有意水準5%で検定せよ．

	A	B	C	D	E	F	G	H
1	出た目	1	2	3	4	5	6	計
2	回数	14	5	6	13	6	16	60

（解答）　～検算の意味で幾通りかやっておくとよい．～
　次の表のように，あらかじめ期待度数を入力しておく．

	A	B	C	D	E	F	G	H
1	出た目	1	2	3	4	5	6	計
2	回数O	14	5	6	13	6	16	60
3	期待度数E	10	10	10	10	10	10	60
4
5	(O-E)²/E	1.6	2.5	1.6	0.9	1.6	3.6	11.8

解1
CHIDIST(H5, 5) = 0.038＜0.05　だから，さいころは正しくない．
解2
CHIINV(0.05, 5) = 11.07＜11.8　だから，さいころは正しくない．
解3
CHITEST(B2:G2,B3:G3) = 0.038＜0.05　だから，さいころは正しくない．

(2)
　あるコンビニの３支店での１日の売り上げ個数は，次の表のとおりであった．この３支店の売り上げ個数の比率には有意差があるか．有意水準5%で検定せよ．

売り上げ個数	パン	おにぎり	弁当	飲み物	計
A支店	82	60	15	120	277
B支店	12	15	10	50	87
C支店	50	72	20	95	237
計	144	147	45	265	601

（解答）　～検算の意味で幾通りかやっておくとよい．～
　次の表のように，あらかじめ期待度数を入力しておく．
(CHITEST()で行うときは12行目以下は不要）

	A	B	C	D	E	F
1	観測度数O	パン	おにぎり	弁当	飲み物	計
2	A支店	82	60	15	120	277
3	B支店	12	15	10	50	87
4	C支店	50	72	20	95	237
5	計	144	147	45	265	601
6
7	期待度数E	パン	おにぎり	弁当	飲み物	計
8	A支店	66.37	67.75	20.74	122.14	277
9	B支店	20.85	21.28	6.51	38.36	87
10	C支店	56.79	57.97	17.75	104.50	237
11	計	144	147	45	265	601
12
13	(O-E)²/E	パン	おにぎり	弁当	飲み物
14	A支店	3.68	0.89	1.59	0.04
15	B支店	3.75	1.85	1.87	3.53
16	C支店	0.81	3.40	0.29	0.86
17						22.55

解1　自由度は2×3=6
CHIDIST(F17, 6) = 0.00096＜0.05　だから，有意差あり．
解2　自由度は2×3=6
CHIINV(0.05, 6) = 12.59＜F17　だから，有意差あり．
解3　自由度は向こう合わせ
CHITEST(B2:E4,B8:E10) =0.00096 ＜0.05　だから，有意差あり．

（参考）　■カイ２乗分布と２項分布，正規分布の関係
■カイ２乗，カイ２乗（χ²）分布とは

○　標準正規分布に従う確率変数ｚの２乗がなす確率分布を自由度１のカイ２乗分布という．

χ2=z2

（２乗しているので正または0の値のみをとる．）
○　標準正規分布に従う２個の確率変数z₁，z₂の２乗の和がなす確率分布を自由度2のカイ２乗分布という．

χ2=z12+z22

（２つの変数が独立に動くので，自由度1のときと比べると縦に２倍になるのでなく横に広がった形になる．）
○　一般に標準正規分布に従うｎ個の独立な確率変数の２乗の和は自由度ｎのカイ２乗分布に従うという．

χ2=z12+z22+···+zn2

※　このように「カイ２乗分布（χ²分布）」は，もともと数学的に定義された連続関数に付けられた名前である．
　これに対して「カイ２乗検定」に登場する「カイ２乗」はｍ×ｎ分割表などにおいて各セル（窓枠）に入ったデータの観測度数（離散的なデータ）をもとに計算される式の値である．
　以下においては，観測度数をもとに計算される「カイ2乗」をグラフや表で示される「カイ２乗分布」と照らし合わせことによって比率の検定ができる仕組みを考える．

　カイ２乗分布は右図2のように自由度（degree of freedom → df と略されることが多い）ごとに異なる形をした連続型の確率分布で，ｘ≧0の区間において定義され，与えられたxの値よりも上側に来る確率は，自由度ごとに計算されて参考書の巻末表に掲載されていることが多い．（カイ２乗分布表を調べるときは自由度dfとｘの値の２つ指定しなければならない．）
　右図2で赤で示した自由度４（df=4）のカイ２乗分布を例として見ると，ｎ個の確率変数が独立に動くために自由度が１のときの4倍になるのでなく（縦に伸びるのではなく）右側のすそ野の長い曲線になっており，左右非対称な山形をしている．

図1
↓

図2

■２つの比率に分かれる確率･･･２項分布
　１回の試行で事象Ａの起こる確率がp，事象Ａが起る確率がq (=1-p)であるとき，この試行をＮ回行ったときに事象Ａがm回，事象Aがn回（合計N回）起こる確率は２項定理で求められ

NCmpmqn

となる．

■２項分布の正規分布による近似
　右の表１においてNが十分大きな値のとき事象Ａが起こる回数をxとすると，xは平均Np，標準偏差

の正規分布で近似され，

は標準正規分布に従う．
　ここで，事象Ａが起こる観測度数がmとなるときのχ²を求めると

･･･(1)

(1)は次のように変形できる．(*)

･･･(2)

(2)式は表1における事象A，事象Ａの観測度数，期待度数が各々m，Np，n，Nqであることに注意すると

の形になっている．

　一般にすべてのセル（マス目）について

を加えたもの

を「カイ２乗」という．

表1

	事象A	事象Ａ	計
確率	p	q	1
観測度数	m	n	N

　さいころを100回投げて１の目が20回出た場合に，このさいころが正しく作られたものかどうか判断したい場合を考えてみると，事象Aは「さいころを投げたときに１の目が出ること」を表し，Ａは「１以外の目が出ること」を表す．確率ｐは1/6，qは5/6，観測度数mは20，nは80，総度数Ｎは100になる．
　正しく作られたさいころでは，１の目が100÷6≒17回程度出るはずだが確率的な偶然で実際には多少の増減はある．とすれば20回なら偶然の範囲と言えるかどうか．このように指定された比率（1/6）と実際の観測度数(100のうちの20)が等しいとみなせるかどうかを判断するのが「比率の検定」の問題である．

(*)
(2)を変形すると(1)に等しくなることが示せる．

■カイ２乗の値の例
例１
　右の表2において期待度数はさいころを60回投げたときに出た目の回数を集計したものとする．このさいころが「どの目も確率1/6で出るように作られているかどうか」を検定するには，
(1)　はじめに観測度数の他に「どの目も確率1/6で出るように作られている」という仮定を満たす場合の期待度数を計算する･･･60×1/6=10になる．
　これは基準とすべき確率分布が与えられている場合，したがって基準となる期待度数が与えられている場合になっている･･･適合性の検定の場合にはこのようにして期待度数が求められる．
(2)　次にすべてのセル（マス目）に対してχ²を求め，その和

を計算する．
(3)　検定の内容に応じてこのχ²値をχ²表と見比べて判断する．（この例では自由度5のχ²分布表を見る．）

表２

出た目	1	2	3	4	5	6	計
観測度数	13	12	8	6	11	10	60
期待度数	10	10	10	10	10	10	60

χ²=

=3.40

例2
　右の表３において観測度数は男女合計100人にある製品の好感度をアンケート調査した結果だとする．このとき，この製品の好感度は男女の性別によって違いがないかどうかを検定したいものとする．
(1)　帰無仮説として「男女の性別によって好感度には違いがない」と仮定したときの，各々のセルの期待度数の表を作る．
　たとえば「男子」「よい」のセルの期待度数は，列の和27を54:46に配分したものになるべきだから27*54/100=14のように求める．（小数のままでも四捨五入して整数にしたものを使ってもよい．）
　これは，性別に対して独立という仮定に基づいて，周辺度数（列の小計，行の小計）から期待度数を求めていることになる．このような独立性の検定においては，帰無仮説に基づいて観測度数から周辺和を計有して期待度数を求めることになる．
(2)　次にすべてのセル（マス目）に対してχ²を求め，その和

を計算する．
(3)　検定の内容に応じてこのχ²値をχ²表と見比べて判断する．（この例では自由度2のχ²分布表を見る．）

表3

観測度数	よい	普通	悪い	計
男子	12	30	12	54
女子	15	21	10	46
計	27	51	22	100

期待度数	よい	普通	悪い	計
男子	14	27	11	54
女子	12	23	10	46
計	27	51	22	100

χ2	0.286	0.333	0.091
	0.750	0.174	0.000
				1.634

■自由度と確率変数の個数
　２つの事象のどちらかになる回数は２項分布で与えられるが，3つの事象Ａ，Ｂ，Ｃに分かれるときの自由度を考えてみる．たとえば，ある人がジャンケンでＮ回手を出すときに，グーをa回，チョキをb回，パーをc回出したとき，この手の出し方は均等であったかどうか調べたいものとする．
　これを２段階に分けて考えて，まずＡとそれ以外（ＢまたはＣ）に分かれると考えると
　まずＡとそれ以外に分かれる確率を求めるために確率変数z₁を用い，さらにBとCに分かれる確率を求めるために確率変数z₂を用いるので，Ａ，Ｂ，Ｃの３つに分かれる確率を求めるためには確率変数が２つ必要になる．
　このようにして，順次にｎ個の事象に分けるためには確率変数がn-1個必要になるから，自由度はn-1になる．
　
　これに対して，右の表４の２×２分割表で周辺度数が与えられているときは，１つのセルの値が決まれば残りのセルの値が決まるから，２×２分割表を埋めるときの自由度は１になる．
　一般に表5のようにｍ行×ｎ列の分割表においてセルの期待度数を求めるときの自由度は(m-1)(n-1)になる．

２項展開の繰り返しによって多項展開を行う考え方

　(a+b)^Nを展開したときのa^rb^N-rの係数は２項定理によって求められ，_NC_rになる．
　そこで(a+b+c)^Nを展開したときのa^rb^sc^tの係数を求めるには，まず(a+(b+c))^Nを展開してa^r(b+c)^N-rの係数を求めると
_NC_r
　次に(b+c)^N-rを展開するとよい．

表4

a	b	a+b
c	d	c+d
a+c	b+d	N

表5

					行和１
					行和２
					行和３
					行和４
					行和５
					行和６
					行和７
					行和８
					行和９
列和1	列和2	列和3	列和4	列和5	合計

（さらに掘り下げて考えてみると）

表	裏	計
2	8	10

(1)　あるスポーツでは，先攻後攻をコイントスで表が出たか裏が出たかによって決める．
　本来，表と裏は等しい確率で出るはずであるが，試しに10回の試行を行ったとき，右のような結果になった場合，このコインを公平な材料として使えるかどうか判断したい．

	表	裏	計
観測度数	2	8	10
期待度数	5	5	10

　これは，このページの初めの方に述べた「適合性の検定」にあたり，期待度数も書き込むと右の表のようになる．
(2)　ところが，そもそも整数値の度数分布表から計算した「カイ２乗」の値を，数学で連続関数として定義されている「カイ２乗分布」に当てはめることができるのは，表の中に5よりも小さな値が登場しない場合で，5未満の数値が登場したら，「カイ２乗分布」曲線で近似することはできないと言われている．（イエーツの補正も賛否両論あり，使わない人もいるらしい）
　この表のように2×2の表では，カテゴリーの併合もできない（比較する対象がなくなってしまう）．
　結局，この表ではカイ２乗検定は適用できないので，確率を直接計算するしかない．
　その確率計算を実演してみる中で，このページで述べてきた「カイ２乗検定」について，補足説明を行ってみる．
(3)　１回の試行で表が出る確率が $p=\frac{1}{2}$ ，裏が出る確率が $q=\frac{1}{2}$ であるときに，10回の試行で表が２回，裏が８回出る確率は，二項定理によって計算することができ
$_{10}C_2p^2q^8=45\times(\frac{1}{2})^2(\frac{1}{2})^8=\frac{45}{1024}=0.04395$
となるが，「この確率」で判断するのではないことに注意．

　(4)　右図１のように，連続分布となっている確率分布関数において，ある特定の値をとる確率というものは考えない（線の面積は０）．
　したがって，期待度数と比較して観測度数がズレているときに，「そんなにズレることは，偶然的に起こり得るのか」という疑問に答えるときに，右図１のようにちょうどその値になる確率を求めているのではなく，図２のように「その値以上ズレることが，偶然的に起こり得るのか」どうかを計算することになる．

　10回の試行中，「表が２回以下」となる確率は

表が0回： $_{10}C_0p^0q^{10}=1\times(\frac{1}{2})^0(\frac{1}{2})^{10}=0.00098$
表が1回： $_{10}C_1p^1q^{9}=10\times(\frac{1}{2})^1(\frac{1}{2})^9=0.00977$
表が2回： $_{10}C_2p^2q^{8}=45\times(\frac{1}{2})^2(\frac{1}{2})^8=0.04395$

これらを加えて，図２で示した「表が２回以下」となる確率は，0.0547>.05となって，5％の有意差は認められない．
　もっと，慎重に考えると，そもそも「表が２回以下」となる場合だけが公平でない訳でなく「表が８回以上=裏が２回以下」の場合も同様に公平でないと考えるのが普通で，図３で示した桃色部分を求める方がよい．（=両側検定にする）
　表が8回，９回，10回となる確率も求めると，上記と同じ値になって，両側で合計は２倍になり，0.1094>.05だから，5％の有意差は認められない．
　確率0.5であっても，このくらいの凹凸は珍しくないということになります．
(5)　それでは，度数分布表で最も小さい値が5以上あって，カイ２乗検定が適用できる場合に，上のように正確な確率で計算した場合と，カイ2乗検定の結果が同じになるかどうか実演してみる．（あまり大きな値を使うと，手書きの計算ができないだけでなく，Excelでも無理になることがあるので，控えめに！）
　ある都市の1月の初め25日間の冬日（最低気温が0°未満の日）について，平年の回数を期待度数とし，今年の回数を観測度数として表にすると，次のようなったとする．
　この表で，今年の冬日の回数が平年並みかどうかをカイ２乗検定で調べたい．

	冬日	否	計
観測度数	18	7	25
期待度数	15	10	25

i)　右の表について CHITEST()関数を適用すると，0.22>.05 となって，5％の有意差は認められない．
ii) 正確に確率計算で行うには，二項定理を用いて
1回につき確率 10/25=0.4で起こるはずのことが 25回中r回起こり，1回につき確率 15/25=0.6で起こるはずのことが25回中 (25−r)回起こる
$_{25}C_r0.4^r0.6^{25-r}\hspace{5}(0\underline{\le}r\underline{\le}7)$
の和をExcelなどで計算すると（筆算では無理），0.15となるから，両側確率として0.30と考えれば，5％の有意差は認められない．
※カイ2乗で求めた確率は近似値ではあるが，この問題のように1桁程度の度数が含まれている場合には，あまりよい近似にならないようです．

確率統計のメニューに戻る

高校数学のメニューに戻る

■［個別の頁からの質問に対する回答］[カイ２乗分布について／17.2.8］

いま有斐閣の「統計学」2008年版を独習して、どうにもわからなくなって本サイトにお助けいただいているところです。大学生用の教科書だとはいえ、どうしてこれほどわかりにくいのかと困っていたところ助かりました。やはり、手で計算すると分かりやすくなると実感しています。EXCEL2013では少し関数が違うので、フォローしていただけるとなおうれしいです。
＝＞［作者］：連絡ありがとう．関数が違うということはないと思いますが，画面上端のメニュー構成は変わっています．
最近のPCはあまり壊れないので，筆者はExcel2007までしか持っていません．

■［個別の頁からの質問に対する回答］[カイ２乗分布（χ2分布）について／16.10.13］

とてもわかりやすいですが、途中式をいれていただけるとありがたいです。
＝＞［作者］：連絡ありがとう．後半の「途中式」については，書けるものは書いているつもりですが，Excelがどんな処理をしているのかというようなことは全く書きえないことです･･･どの式とどの式の間という具合にもっと具体的に質問してください．