■検定 ・・・ 標本が大きく (概ねn が30以上)正規分布が使える場合
○ 要点
 一方の集団の母平均の信頼区間に,他方の集団の母平均がなければ,これら2つの母平均は等しくないと考えてよい. ・・・ 例えば,一方の母平均の推定において,95%の信頼区間よりも外に他方の母平均があれば,検定においては,5%の有意差があると考えるとよい.
.
◇簡単な例でイメージ作り(1)◇

例1
 あるスポーツでは先攻後攻をコインのトスで決めている.このコインが正しく作られているか否かをテストするために,50回投げたところ,表が35回出た.
 このコインは正しいと言えるか?
(考え方) 
 コインのトスの結果は偶然に支配されるので,テストしたときに表がちょうど半分出るとは限らない. 
 コインの表が出る回数は二項分布 B(n, p) をなし,試行回数が多いときは正規分布 N(np, np(1-p) )と見なしてよい.
 この問題ではμ=np=25,σ==3.536の正規分布となる.

 もし,コインが正しく作られていれば(p=0.5ならば)「広く見積もっても(95%の確率で)」表の出る回数は18回〜32回の間にあるはずであるが,35回も出ている.

 これは「めったにないことが起こった」というよりは,コインが正しく作られているという仮定が間違っていると考えるべき.
 → このコインは正しく作られていない.

 正規分布表で下図のように真ん中部分が95%になるのは(右が47.5%になるのは) p(u) = 0.475 となる u の値から,u = 1.96
 すなわち,P(μ-1.96σ≦X≦μ+1.96σ) = 0.95
μ-1.96σ=25-1.96×3.536=18.07
μ+1.96σ=25+1.96×3.536=31.93


◇少しだけ理屈を ! (1)◇
 偶然に支配される世界を扱っているので,100%確実とは言えないが,コインが正しく作られていると見なす範囲をかなり広くとって確率95%採択しているのに,その範囲に入らない.

 95%もの範囲に入らない理由としては,「コインが正しくない」場合と,「コインは正しいがめったにないことが起こった」場合の2つが考えられるが,「宝くじが当たるようなことを前提とした」判断をせずに,「コインが正しくない」方を選ぶ.(社会の安全,会社の信用などがかかっていたらどうだろうか・・・)

 もちろん偶然に支配される世界の話なので,めったにないことが起こる確率を5%とすれば,このコインを正しくないと判断したときに,正しく作られたコインを「正しくない」と判断する危険率は5%ある.
=== 
○ 元の仮説(p = 0.5)が正しくないと判断する範囲を棄却域という.
○ 元の仮説(p = 0.5)が正しくないと判断したときに,その判断が間違っているかもしれない確率を有意水準もしくは危険率といいαで表わす.(この問題ではα=0.05)
○ 有意水準もしくは危険率として通常5%が用いられるが,特に精度の高い判断が必要なときは1%を用いることもある.
 危険率1%の場合は,仮説が採択される範囲が99%となるので,正規分布で両側が棄却域の場合 X<μ-2.58σおよびX>μ+2.58σが棄却域となる. 






※ 正しいものを間違っていると判断する誤りを第1種の過誤という.左の説明は,第1種の過誤を犯す危険率αを5%ないし1%にとることを表わしている.
 常識的に考えれば,危険率は小さい方が望ましいが第1種の過誤を小さくとり過ぎると,帰無仮説の採択域が大きくなり「間違っているものも正しものに入れてしまう過誤」:第2種の過誤を犯す確率(β)が大きくなる.βは標本の大きさ n を大きくとることにより低く押さえることができる.

(標本数を大きくすると分布が分かれる)
◇簡単な例でイメージ作り(2)◇

例2
 あるサイコロが正しく作られているかどうか調べるために600回投げてテストしてみたところ,1の目が90回出た.有意水準5%として,このサイコロが正しく作られているかどうか判断せよ.
(考え方) 
 1の目が出る回数は二項分布 B(n, p) に従い,試行回数が多いときは正規分布 N(np, np(1-p))と見なしてよい.
 この問題では μ = 100,σ = 9.129 の正規分布となる.
μ-1.96σ=82.1,μ+1.96σ=117.9
90回は仮説 p = 1/6 を採択する範囲に入る.
 このような場合,仮説 p = 1/6 は棄却できないが,正しいとも言い切れない.









[ →参考 ]
◇少しだけ理屈を ! (2)◇
 元の仮説を「帰無仮説」といいH0で表わす.
(この問題では,帰無仮説は「サイコロが正しい」「1の目が出る確率はp =1/6」)

 元の仮説が棄却されたときに採択される仮説を「対立仮説」といいH1で表わす.
(この問題では,対立仮説は「サイコロは正しくない」「1の目が出る確率はp≠1/6」)

⇒ 帰無仮説(本音でない方)を前提にすると棄却域に入ってしまうことから対立仮説(本音)を導くというのが検定の手法.
 例2の考え方のように両側に棄却域をとるものを両側検定という.)
 このサイコロは「1の目の確率が少ないのではないか」と疑う場合,帰無仮説として「1の目が出る確率は p = 1/6」として,大きい方95%を帰無仮説が採択される範囲に選び,小さい方5%を棄却域に選ぶ.その場合,正規分布表で p(u)=0.45となるuの値を調べると1.65となるから,右図のような棄却域となる.(これを片側検定という.
 片側検定の場合,棄却域は X <100-1.65×9.129=84.9となる.
 上記の問題では,片側検定でも棄却域に入らない.
 元の仮説の採択される範囲が95%,棄却される範囲が5%という基準は,元の仮説に対して非常にゆるく,対立仮説に対して厳しいものとなっている
 このため,元の仮説が採択されても p =1/6 であると主張するための積極的な根拠とはならない.
 実際,n = 90回は,p = 1/7, p = 1/8の場合でも95%の範囲に入る.

※ 帰無仮説が採択されたら,検定は無に帰してしまう.帰無仮説が棄却されて対立仮説が採択されるときのみ検定として積極的な判断ができる.
⇒ 言いたくない方を帰無仮説に,言いたい方を対立仮説に選ぶことが重要




片側検定の場合

◇簡単な例でイメージ作り(3)◇

例3
 ある規格の鶏卵は重さの平均61(g),標準偏差1(g)の条件を満たすものと定められている.ある日,出荷予定の鶏卵100個を抽出検査した結果,平均が59.0(g)であったとき,この日出荷予定の鶏卵は規格の範囲内にあるといえるか.有意水準5%で検定せよ.
(考え方) 
帰無仮説H0:出荷予定の鶏卵の重さμ=61
対立仮説H1:出荷予定の鶏卵の重さμ≠61
とする.
(以下は解説の都合で両側検定とするが,少ないという疑いがあるときは片側検定とする.)
 標本抽出をするとき,標本平均の期待値=母平均,標本平均の標準偏差=

 出荷予定の鶏卵全体を母集合とすると,有意水準5%の両側検定の場合,採択域は
m-1.96≦μ≦m+1.96
58.8≦μ≦59.2<61
棄却域に入るから,鶏卵は規格外
※ m - 1.96μ≦ m + 1.96
の範囲に入るかどうか調べる.

※ 母標準偏差σが分かっているときは,これを使う.

 この式は,
-1.96 ≦ m -μ≦1.96
-1.96≦≦1.96
と書けるから,標準正規分布における z値
が幾らになるかで判断することとなる.
 左の問題では,z = (59-61)/0.1=-20 < -1.96となって帰無仮説は棄却される.

 他の解説書やソフトの利用も考えると,z値に慣れる方が分かりやすい.
◇簡単な例でイメージ作り(4)◇

例4
 春に1群の稚魚であった養殖魚を2つの池に分けて飼育し,秋に100尾ずつ標本を抽出して体重を測定したところ,A池の養殖魚は平均体重20(g),標準偏差3(g),B池の養殖魚は平均体重21(g),標準偏差4(g)であった.B池の養殖魚が良く育っていると言えるか.α=0.05で検定せよ.
(考え方)
帰無仮説H0:平均体重 μ1 = μ2
対立仮説H1:平均体重 μ1 < μ2

平均の差は m2-m1 = 1(g)
分散は=0.25 → 標準偏差は0.5
z = 1/0.5 = 2.0>1.65
したがって,片側検定で棄却域に入る.
B池の養殖魚が良く育っている.
 確率変数の変換に関する性質から,2つの確率変数X, Y について期待値は
E(aX + bY) = aE(X) + bE(Y)
 2つの変数X, Yが独立ならば,分散は
V(aX + bY) = a2V(X) + b2V(Y)
が成り立つ.

 したがって,2つの独立な確率変数については
E(X - Y) = E(X) - E(Y)
V(X - Y) = V(X) +V(Y)
が成り立つ.

 そこで,
平均の差を検定するときは
z = を有意水準と比較する.
■要約■
 標本の大きさ n が概ね30以上のときは,標本平均は正規分布をなすと見なしてよい.

(1) 母数(母集団が満たす値・・・母平均,母比率など)に関する帰無仮説H0を決める. 例 母平均μ = 10
 帰無仮説は,母数がある値に等しいという形で決める.(不等号で表わされるような帰無仮説ではそれに基づく計算が複雑すぎて検定できない.)
 (言いたくない方を帰無仮説に選ぶ)
(2) 帰無仮説が棄却されたときに採択される対立仮説H1を定める.(調べたい事柄に応じて両側検定,片側検定を選ぶ.) 例 母平均μ≠10 (μ>10,μ<10)
 (言いたい方が対立仮説になるようにする)
(3) 有意水準(危険率)を5%ないし1%に設定する.

(4) 標本について求めた量が帰無仮説の棄却域に入れば,帰無仮説を棄却して対立仮説を採択する.帰無仮説の採択域に入れば,帰無仮説は棄却はされないが,積極的な判断はできない.
 (計算結果がp値 [有意確率・・・帰無仮説を前提としたときに,その値よりも外側に来る確率] で表示される場合には, p値<有意水準 のとき帰無仮説を棄却する.)
(i) 両側検定
 ア) 有意水準5%(α=0.05)のとき
    が±1.96の外にあれば棄却
 イ) 有意水準1%(α=0.01)のとき
    が±2.58の外にあれば棄却
(ii) 片側検定
 ア) 有意水準5%(α=0.05)のとき
    右側:>1.65のとき棄却
     左側:<-1.65のとき棄却
 イ) 有意水準1%(α=0.01)のとき
    右側:>2.33のとき棄却
     左側:<-2.33のとき棄却

※ 比率を調べるときは
またはを用いる.

※ 平均の差を検定するときは
z = を有意水準と比較する.
■例と答■
.
(1) 1枚の硬貨を200回投げたとき表が85回出た.この硬貨の表裏は等しい確率で出ると言えるか.有意水準5%で検定せよ.
(1)
H0:表の出る確率は p = 0.5
H1:表の出る確率は p ≠ 0.5
μ= 100,σ= = 7.07,m = 85
z = (85-100)/7.071 =-2.12<-1.96
帰無仮説は棄却される.表裏は等しい確率では出ない.
(別解)
H0:表の出る確率は p = 0.5
H1:表の出る確率は p ≠ 0.5
R = 85/200=0.425
z = (R - p)/ = -2.12<-1.96により棄却
表裏は等しい確率では出ない.
(2) ある製品の出荷基準として平均重量55(g),標準偏差1(g)以下と定められているとき,母集団から400個を抽出して検査したところ,平均重量が54.8(g)であったとき,この母集団は出荷基準を満たしていると考えてよいか.有意水準5%で検定せよ. (2)
H0:母平均 μ = 55
H1:母平均 μ ≠ 55
m = 54.8,σ= 1 (母標準偏差が与えられているときはこれを使う)
z = (m-μ)/ = -4.0<-1.96
帰無仮説は棄却される.
出荷基準を満たしていない.
(3) ある議員が現在審議中の条例改正案について有権者の支持状況を無作為聞き取り調査で実施したところ,40人中24人が賛成と回答した.この条例改正案は有権者の過半数の支持を得ていると考えてよいか.有意水準5%で検定せよ.
 また,400人中の240人が賛成の場合はどうか.
(3)
H0:p = 0.5
H1:p > 0.5(片側検定とする)
n = 40,R = 24/40 = 0.6 (母比率が与えられていないので R で代用)
z = (R - p)/ =(0.6-0.5)/0.0775 = 1.29<1.65
帰無仮説は棄却できない.(半数またはそれ以下の可能性がある.)
n = 400, R = 240/400 = 0.6 のときは
z = (R - p)/ =(0.6-0.5)/ 0.0245 = 4.08>1.65
帰無仮説は棄却される.過半数の支持を得ている.
○=== メニューに戻る
■[個別の頁からの質問に対する回答][検定について/17.2.5]
大変わかりやすく、助かりました。
=>[作者]:連絡ありがとう.
■[個別の頁からの質問に対する回答][検定について/17.1.24]
例3の右側の解説についてです。 「左の問題では,z = (59-61)/0.1=-2.0 < -1.96となって帰無仮説は棄却される」となっていますが、(59-61)/0.1=-20となるように思われます。
=>[作者]:連絡ありがとう.訂正しましたが−20<−1.96は成り立ちます.(もっと微妙な問題にしないと離れすぎだろ!と突っ込みどころ満載になってしまった)
■[個別の頁からの質問に対する回答][検定について/17.1.24]
例題(2)は出荷基準がある値以下であるのに、どうして片側検定でないのでしょうか?
=>[作者]:連絡ありがとう.まず両側検定にするか片側検定にするかはデータから自動的に決まるのではなく,分析者が何に関心があるかによって決まるということを押さえておきましょう.ある値から離れていたら困る場合は両側検定に,ある値よりも小さければ困るが大きいのは構わないという場合は片側検定と考えましょう.
 さて,標準偏差1(g)以下と,言葉としては「以下」と言っていますが

の「範囲内にある」というのが帰無仮説なので,その両側に外れたら棄却域になります.だから両側検定で調べようと考えたわけです.