■母平均の推定・信頼区間(問題練習:正規分布を利用する場合)

.
○ 基本の復習
【中心極限定理】
○ 母集団が正規分布でないときでも,nが十分大きくなると標本平均の分布は,
平均μ,標準偏差の正規分布
に近づく.
○ 概ねn30のとき,標本平均の分布は正規分布とみなしてよい.

【母平均の信頼度95%の信頼区間】
nが十分大きいとき,母平均μ
−1.96≦μ≦+1.96
の区間にある確率は95%である.
※この区間のことを,母平均μに対する信頼度95%の信頼区間という.

※母平均の推定と信頼区間の問題については上の式のまま考えてもできるが,後に出てくるt検定,F検定などと統一的に理解するためには,上の式をと変形して,の値が-1.96と1.96の間になるかどうかで考えるとよい.(この値をz値ということがあり,z値の大小によって考えることにするのである.)
【母標準偏差が未知のとき】
nが十分大きいとき,母標準偏差σは標本標準偏差sに等しくなることが知られている.

(微妙な話になるが避けて通れない話題)
 母平均μが標本平均に等しいなどということではないし,母標準偏差σが標本平均の標準偏差に等しいなどということでもない.nが十分大きいときに,等しいといえるのは母標準偏差σと標本標準偏差sだけ.
 上の性質により,
概ねn30のとき,母標準偏差σが未知で標本標準偏差sが既知のとき,母平均の95%信頼区間を

−1.96≦μ≦+1.96
によって求めることができる.
[記号の約束]
 母集団の平均,標準偏差をギリシャ文字μ(ミュー),σ(シグマ)で表し,標本の平均,標準偏差を , sで表す.

[おとぎ話による解説]
 1人の母親の子供は多様であるが,子供の平均は母親の平均のまわりに集まる.(子供を見れば,親が分かる.)
正規分布では(平均)±1.96×(標準偏差)の範囲に入る確率は95%になる.(z=1.96のときの正規分布表の値が0.475だから両側で0.95になる.)



※ 標本平均の標準偏差として利用するもの
標本平均の
標準偏差
n≧30のとき n<30のとき
母標準偏差σが
既知のとき
…(*1) …(*2)
母標準偏差が
未知のとき
…(*3) (t分布として
後に登場する)

 (*1)(*2) 母標準偏差σが既知のときはn≧30であると否にかかわらず,σを利用して計算すればよい.
 (*3) 母標準偏差が未知のとき,n≧30であれば標本の標準偏差sをσの代わりに用いる.母標準偏差が未知でn<30のときは正規分布ではなく後に習うt分布を利用する.
○…例題と問題…
【与えられているもの】μ,σ,n
【求めるもの】a<<bとなる確率
【例題1】
母平均60,母標準偏差4の母集団から,大きさ64の標本を無作為抽出するとき,標本平均59以上61以下となる確率を求めよ.
(解答)
だから0z2となる確
率を正規分布表から読み取ると0.4772
従って,2×0.4772=0.9544…(答)

※ 正規分布表が手元になくてExcelで行うときは,
○ =NORMSDIST(2)によって標準正規分布における水色部分の面積(確率)が求まるので,=NORMSDIST(2)-NORMSDIST(−2)により−2z2の確率が得られる.(0.9545 4桁目は四捨五入の仕方で変わる)
○ 平均60,標準偏差4/8の正規分布を用いるときは,=NORMDIST(61,60,4/8,TRUE)で61以下となる確率が求まり,=NORMDIST(59,60,4/8,TRUE)で59以下となる確率が求まるから,=NORMDIST(61,60,4/8,TRUE)&minsu;NORMDIST(59,60,4/8,TRUE)によって求めることもできる.
(参考)
 正規分布においてちょうどz=2となる確率は0だから (ちょうどある値になる確率が問われることはなく,ある「区間」に入る確率が問われるのが普通) ,問題が「以上」「以下」となっていても「より大」「未満」となっていても,答え方は同じになる.




【問題1】
母平均50,母標準偏差10の母集団から,大きさ100の標本を無作為抽出するとき,標本平均53よりも大きくなる確率を求めよ.
(解答)
だから0z3となる確率を正規分布表
から読み取ると,0.4987
 右側の残りの部分の確率は0.5−0.4987=0.0013…(答)

○ Excelで標準正規分布を用いるときは,<z3となる確率が=NORMSDIST(3)で求められるから,=1-NORMSDIST(3)によりz>3となる確率が求まる.(0.0013)

○ Excelで平均50,標準偏差10/10の正規分布を用いるときは,=NORMDIST(53,50,10/10,TRUE)で53以下となる確率が求まるから,=1−NORMDIST(53,50,10/10,TRUE)によって求めることもできる.(0.0013)

【与えられているもの】 σ,n,
【求めるもの】 母平均に対する95%信頼区間
【例題2】
ある県で12歳男子を100名無作為抽出して身長を測定したところ,平均152.0(cm)であった.この県の12歳男子の身長の標準偏差が8.1(cm)であるとき,この県の12歳男子の平均身長に対する95%信頼区間を求めよ.
(解答)
σ=8.1 , n=100 , =152.0
−1.96≦μ≦+1.96に代入する.
−1.59≦μ≦+1.59
150.41≦μ≦153.59
※信頼度95%というためには,四捨五入するときに広い方を選ぶ.
150.4≦μ≦153.6…(答)



【問題2】
ある県で6歳児女子を500人無作為抽出したとき,平均体重は21.0(kg)であった.この年の同県の6歳児女子の体重の標準偏差は3.3(kg)であった.同県の6歳児女子の平均体重の95%信頼区間を求めよ.
(解答)

21.0−1.96×0.15≦μ≦21.0+1.96×0.15
20.71≦μ≦21.29
20.7≦μ≦21.3…(答)
※(余談閑談)・・・あなたは【例題2】の条件設定に疑問を持たなかったか
 次の考え方は統計の教科書にはっきり書かれている訳ではないので,筆者の単なるつぶやきである.何かの参考になれば・・・

 【例題2】を解くときに「母集団の標準偏差σが既知で母集団の平均μが未知」という設定が不自然に思えて,虫食い算の練習問題をわざと作ったような印象を持ったことがある.母集団についての最も重要な情報である平均値の部分だけが虫に食われていて(データが欠損になっていて),標準偏差だけが分かっているようなことが現実的な条件設定とは考えにくいので,単に練習用の問題設定ではないかと疑ったのである.
 しかし,次のような場合には母平均が分かるとは限らない.
例1
 ある学校の中学3年生100人を無作為抽出して数学のテストについて調査したら平均72.5点であった.このテストについて全国の平均点は73.6点,標準偏差は5.8点であった.この中学校3年生の数学の学力は全国平均と比べて格差があるのだろうかという疑問を持ったとする.
 この中学校3年生が属する母集団をAとし,全国の中学校3年生からなる母集団をBとする.後に登場する仮説・検定では,この学校の中学3年生が母集団Bと同じ分布をしていると仮定したとき,標本の大きさ(ここでは100)によっては確率的に平均72.5点ということが起こりうるのかどうかを調べる.母集団の平均や分散が等しいと仮定して,そのときに平均72.5点ということが起こる確率の大小によってその仮説が採択できるかどうか判断するのである.
 その場合,標本が属する母集団Aの平均点が未知だから,その値の範囲を調べたのである.
例2
 ある地方都市の年間平均降水量は1544(mm)で標準偏差は278(mm)である.今年は年末までに2042(mm)の降水量があった.今年の降水量は統計的に見て異常に多かったといえるだろうか.
 この問題を判断するためには,まず今年の降水量が平年(母集団Bとする)並みであったと仮定して,降水量2042(mm)ということが確率的な凹凸の範囲(95%以内)とみなせるかどうか調べる.もし,95%以内に入っていれば平年並みという仮説には無理がないことになるが,そうでなければ今年の降水量が属している母集団(これを母集団Aとする)は母集団Bとは別のものであることになり降水量は異常に多かったといえる.
 この場合,標本が属する母集団Aの降水量の平均が未知なのである.
【与えられているもの】 σ,95%の信頼区間の幅
【求めるもの】 標本の大きさn
【例題3】
ある県においては15歳男子の平均体重について過去の統計から標準偏差が10.0(kg)になることが分かっている.この県の15歳男子の平均体重を信頼度95%で推定して信頼区間の幅を1.0(kg)以下にするためには,標本の大きさを幾らにしなければならないか.
(解答)
信頼度95%の信頼区間は
−1.96≦μ≦+1.96
だから,信頼区間の幅
2×1.961.0
より
n39.22=1536.64
1537以上…(答)



【問題3】
ある学力テストにおいて全国平均は73.2点,標準偏差は6.0点であった.ある県の生徒の平均得点を信頼度95%で推定して信頼区間の幅を1.0点以下にするためには,標本の大きさを幾らにしなければならないか.
(解答)
(全国の平均点は関係ない)
−1.96≦μ≦+1.96
だから,信頼区間の幅
2×1.961.0
より
n23.522=553.19
554以上…(答)
.

【与えられているもの】 標本平均,標本標準偏差s,標本の大きさn
【求めるもの】 信頼度95%の信頼区間
【例題4】
ある学校で15歳女子の生徒150人を無作為抽出して調査したとき,平均身長は157.5(cm),標準偏差は5.1(cm)であった.この学校の15歳女子の平均身長について信頼度95%の信頼区間を求めよ.
(解答)
標本が大きい(150人)から,母標準偏差σは標本標準偏差sに等しいとみなしてよい.
信頼度95%の信頼区間は
−1.96≦μ≦+1.96
より
157.5−0.8162≦μ≦157.5+0.8162
156.684≦μ≦158.316
156.7≦μ≦158.3…(答)



【問題4】
ある工業製品から50個を無作為抽出して重量を調査したとき,平均重量は32.0(g),標準偏差は3.2(g)であった.この工業製品の平均重量について信頼度95%の信頼区間を求めよ.
(解答)
標本が大きい(50個)から,母標準偏差σは標本標準偏差sに等しいとみなしてよい.
信頼度95%の信頼区間は
−1.96≦μ≦+1.96
より
32.0−0.887≦μ≦32.0+0.887
31.1≦μ≦32.9…(答)
○===メニューに戻る
■[個別の頁からの質問に対する回答][母平均の推定・信頼区間について/17.5.30]
標本サイズN=300、ある意見が40%、信頼度95%、という条件で信頼区間を求めるとしたら、どれに当てはまりますか?
=>[作者]:連絡ありがとう.ある意見が40%とは何を表しているのか,何の分布についての母平均の信頼区間を求めようとしているのか,どれに当てはまりますかというためには選択肢を示さないと議論が成り立たない,標準偏差が不明のままで?・・・もっと質問内容を正確に表現してみる必要があります.そうすれば,尋ねるまでもなく自分で解けることがあります.
■[個別の頁からの質問に対する回答][母平均の推定・信頼区間について/17.2.21]
問題1の解説で、なぜ解説のような式が成り立つのかということがわかりまかせん。解説をお願いできますか。
=>[作者]:連絡ありがとう.

という式を変形して,

という形にしてzの範囲を求めています(この変形は上の不等式を「芋づる形」「連なり形」ではなく切り離して2つにして,1つずつ変形すればできます.教材の記述は少々不親切かもしれません)
■[個別の頁からの質問に対する回答][母平均の推定・信頼区間(問題練習について/17.2.4]
例題4の最後のμの平均の範囲158.3じゃなくて168.3です
=>[作者]:連絡ありがとう.途中計算に入力ミスがあったのは事実です.少々ややこしいですが,168.3が間違いで158.3が正しいです.