◇正規分布◇

■はじめに

 統計の基本となる最も重要な確率分布が正規分布.
 正規分布の解説に登場する関数や記号が分からなくても,実際の問題は「ノリとハサミ」で切り紙・張り紙する感覚で誰でも簡単に解ける.(小数の足し算,引き算ができればよい.)

解説(視覚的なイメージでつかむと分かりやすい)

○ 正規分布は,統計でしばしば登場する確率分布で,右のように「富士山型」「釣り鐘型」のグラフになる.
 正規分布は,これを最初に研究したドイツの数学者の名前をとってガウス分布とも呼ばれる.

○ 期待値(平均値)がm,標準偏差がσの正規分布を表わす確率分布関数は で表わされる.特に,期待値(平均値)が0,標準偏差が1の正規分布は標準正規分布と呼ばれ,確率分布関数は になる.
 実務上はこの式自体を使うことはなく,正規分布表を使う.(正規分布表は,数学や統計の書物の巻末に付いていることが多い.手元になければ[このページ]参照)

 正規分布表は,標準正規分布において,Z が0以上u 以下となる確率を表わし,グラフで青で示した図形の面積に等しい.よく登場する値を示すと次のようになる.
uの値 0.0 1.0 2.0 3.0
確率 0.0000 0.3413 0.4772 0.4987


■標準正規分布(正規分布表はこのグラフに対応)
  0 ≦ Z ≦ u となる確率

■正規分布
  m ≦ X m+uσ となる確率

※ 正規分布表の値を覚える必要はないが,よく使う値の範囲について確率の「目安」は分かる方がよい.
P(m ≦ X ≦ m + σ ) = P( 0 ≦ Z ≦ 1 ) = p(1) = 0.3413 だからP(m - σ ≦ X ≦ m + σ ) = 0.6826 ( 68.3%)
P(m ≦ X ≦ m + 2σ ) = P( 0 ≦ Z ≦ 2 ) = p(2) = 0.4772 だからP(m - 2σ ≦ X ≦ m + 2σ ) = 0.9544 ( 95.4%)
P(m ≦ X ≦ m + 3σ ) = P( 0 ≦ Z ≦ 3 ) = p(3) = 0.4987 だからP(m - 3σ ≦ X ≦ m + 3σ ) = 0.9974 ( 99.7%)

○ 標準正規分布のグラフは左右対称なので,Z < 0 のときの確率を求めるには,鏡に映す要領で右半分の面積で計算する.
 P ( -2 ≦ Z ≦ -1) = P ( 1 ≦ Z ≦ 2)

○ 正規分布表は平均値が0,標準偏差が1のとき(=標準正規分布)の表であるが,これ以外の正規分布は,標準正規分布のグラフを平行移動してから拡大縮小したものとなっているので,その確率は標準正規分布に直して読み取ることができる.
 標準正規分布での変数を Zで表わし,正規分布での変数を X で表わすと,
X = m+Zσ
Z =
たとえば,Z = 2 の値には,X = m+2σの値が対応する.
標準正規分布
での値
正規分布
での値
-3 m-3σ
-2 m-2σ
-1 m-σ
0 m
1 m+σ
2 m+2σ
3 m+3σ
■参考■
○ 正規分布のような連続分布においては,変数 x が「ちょうどある値になる確率」という形で確率を考えるのではなく,a ≦ x ≦ b のように指定された区間にある確率を考える.
 たとえば,多人数の人の身長が正規分布をしているとき,抽出された1人の身長がちょうど x = 170.0000000・・・(cm)となる人はいないので,1人選んでx=170.00000・・となる確率を求めても 0 となって意味がなく,身長が 165 ≦ x ≦ 175 (cm) のように幅のある区間で考える.
 このような連続分布では,曲線の下にある図形の面積がその区間にある確率を表わす.

■Excelで計算するには
 標準正規分布の確率を計算するには,関数 NORMSDIST(u) が使える.
(正規分布:normal distribution,標準正規分布:standard normal distribution)
この関数を使うには,セルに直接 =NORMSDIST(数字) を書き込むか,メニューから[挿入→関数→統計→NORMSDIST]を選択し,Z (と表示される入力欄)に数値を入力する(または数値の書かれたセル番地を指定する).
ただし,この関数は次図のような確率を表わしているので,数学で使う値に直すには,左半分を引いて,
= NORMSDIST(u) - NORMSDIST(0) または = NORMSDIST(u) - 0.5 とすればよい.
 このExcel関数は,Z <0 の値にも使えるので,a,bの正負にかかわらず,確率 P( a ≦ Z ≦ b ) は
= NORMSDIST(b) - NORMSDIST(a) で求められる.
 Excelで一般の正規分布(期待値0,標準偏差1とは限らない場合)の確率を計算するには,関数 NORMDIST(xの値, 期待値, 標準偏差, 1) が使える.上の図のような確率(曲線の下にある図形の面積)を求めるには,4番目の数字に1または TRUE を代入する.(確率密度関数の値 [グラフのy座標=縦線の長さ]を求めるときには,4番目の数字に0またはFALSEを代入する.)


■記号と用語
 期待値m,標準偏差σの正規分布N(m,σ2) で表わす.このとき,確率変数 X は,正規分布 N(m,σ2) に従うという.
 標準正規分布N(0,1) で表わされる.このとき,確率変数 Z は標準正規分布 N(0,1) に従うという.

2つ目の数には,分散を使うことになっている.分散は標準偏差の2乗なので:V = σ2 が入る.
たとえば,期待値 20,標準偏差 10 の正規分布は
N (20,100)となる.

■問題例
【例1
確率変数 Z が 標準正規分布 N(0, 1)に従うとき,P( 0 ≦ Z ≦ 1 )を求めよ.
( 標準正規分布において, 0 ≦ Z ≦ 1 となる確率を求めよ。)

(答案)
次の正規分布表でz = 1.0 のときの値を読み取る.
z 0.0 1.0 2.0 3.0
p(z) 0.0000 0.3413 0.4772 0.4987

P( 0 ≦ Z ≦ 1 ) = 0.3413 ・・・答え
【例
確率変数 X が正規分布 N(60, 202) に従うとき,P(80 ≦ X ≦ 100 )を求めよ.
(期待値が60,標準偏差が20の正規分布において,80 ≦ X ≦ 100 となる確率を求めよ.)

(答案)
m = 60, σ = 20 のとき,80 = m + σ,100 = m + 2σ
P(m + σ ≦ X ≦ m + 2σ ) = P(1 ≦ Z ≦ 2 )
= 0.4772 - 0.3413 = 0.1359 ・・・答え

■要点
 正規分布で確率を計算するには,「のりとハサミ」のイメージで図形の切り貼りを考える.


■問題(以下において,標準正規分布の確率変数は Z ,正規分布の確率変数は X で表わす.)[ → 正規分布表 ]
(1) 確率変数 Z が N( 0, 1 ) の正規分布に従うとき,
P( 1 ≦ Z ≦ 3 )を求めよ.
小数第4位まで →
[考え方: 見る | 隠す ]
(2) 確率変数 X が N( 12, 32 ) の正規分布に従うとき,
P( 9 ≦ X ≦ 18 )を求めよ.
小数第4位まで →
[考え方: 見る | 隠す ]
(3) 平均値が 60 で標準偏差が 15 の正規分布において,確率変数 X の値が 75以上90以下となる確率を求めよ.
小数第4位まで →
[考え方: 見る | 隠す ]
(4) ある試験の受験者1000人の得点の平均は55点,標準偏差は15点であった.得点の分布がほぼ正規分布とみなせるとき,得点が85点の人は得点の高い方から数えて約何人目にいるか.

整数で →人目
[考え方: 見る | 隠す ]
(5) 模擬試験などでよく使われる「偏差値」は,平均が50点,標準偏差が10点の正規分布に直したときの変数 X の値を示している.例えば,偏差値50とは,その得点がちょうど平均点に等しいことを表わしており,偏差値60とはその得点が m+σに等しいことを表わしている.
 平均70点,標準偏差15点の試験において,得点が55点のときの偏差値を求めよ.

整数で →
[考え方: 見る | 隠す ]
(6) ある生徒の試験の得点は,平均60点,標準偏差10点の英語で72点,平均65点,標準偏差15点の数学で78点であったとする.この生徒の偏差値は,英語と数学でどちらが高いか.
教科名 →
[考え方: 見る | 隠す ]
 (7)定員200人に対して受験者が1000人あった入学試験について,300点満点の試験に対して平均が120点,標準偏差が80点であった.得点はほぼ正規分布をしているとし,得点の上位者から順にちょうど定員に達するまでを合格者とするとき,合格者の最低点は約何点になると予想されるか.
整数で →
[考え方: 見る | 隠す ]
(8) ある野鳥のための巣箱を作るときに,巣箱の入り口の直径を28.0mmにするとその野鳥の90%が通れず,直径を30.0mmにすると90%が通れるものとする.野鳥の直径が正規分布をしているものとして,この野鳥の直径の平均値と標準偏差を求めよ.
平均値:小数第1位まで → mm

標準偏差:小数第1位まで → mm
[考え方: 見る | 隠す ]

...(携帯版)メニューに戻る

...(PC版)メニューに戻る