定性的データ ( 質的データ,カテゴリーデータ,カテゴリカルデータ )
(単にカテゴリーデータという場合,名義尺度を指すことがある.この場合,順序尺度は順序カテゴリーデータという.)名義尺度(nominal scale)
・・・離散的な数値を用いる
単に分類するために整理番号として数値を割り当てたもの
名義尺度の数値が同じならば同じ分類に属し,数値が異なれば異なる分類に属する.区別するためだけに用いられている数値なので,等しいか等しくないかのみ意味があり,幾ら大きいか,何倍大きいかなどの意味はない.
度数を数えることはできるが,2が1と3の間という意味もないく,2が1の2倍という意味もない.
→[○]度数,最頻値
→[×]平均,分散,標準偏差例 血液型(A型:1,B型:2,・・・,O型:4),男女の性別(男:0,女:1),電話番号
(血液型 [A型:1,B型:2,AB型:3,O型:4] の例 1, 4, 2, 3 , 1, 2 , 4, 1, 4, 1 のようなデータでは,度数は数えられるが,平均には意味がなく,B型はA型とAB型の間という意味もない.)順序尺度(ordinal scale)
・・・離散的な数値を用いる順序には意味があるがその間隔には意味がない数値を割り当てたもの 大小比較は可能であるが,間隔や比率には意味がない.
→[○]度数,最頻値,中央値
→[×]平均,分散,標準偏差例 好きなスポーツの順位(野球:1,サッカー:2,・・・),マラソンの着順(1位,2位,・・・)
(マラソンの着順で考えると,1位は2位よりも上位であるが,1位と2位の間隔は2位と3位の間隔と同じとは言えず,4位が2位の2倍のタイムとも言えない.)定量的データ ( 量的データ ) 間隔尺度(interval scale)
[距離尺度(distance scale)]目盛が等間隔になっている(等間隔であると仮定されている)もの 和差には意味があるが比率には意味がない.
例 知能指数,摂氏の温度
(*)客の満足度(非常によい:4,よい:3,悪い:2,非常に悪い:1)比例尺度(ratio scale)
[比尺度,比率尺度]原点(0)の決め方が定まっていて,間隔にも比率にも意味があるもの 和差積商の計算が自由にできる.
例 身長,体重,金額,絶対温度 ※ 名義尺度<順序尺度<間隔尺度<比例尺度 の順に情報量が多くなり,大は小を兼ねることができる.
(例) 比例尺度のデータを元にして,等間隔の階級に分けられたヒストグラムを作ることができる.この場合,比例尺度のデータを間隔尺度に変換していることになる.しかし,逆に低い方の尺度から高い方の尺度に変換することはできない.
※ 間隔尺度以上と言えば,間隔尺度と比例尺度を表わし,間隔尺度以下と言えば,間隔尺度,順序尺度,名義尺度を表わす.
※ 水準・・・目盛りの数.目盛りが5個あれば5水準という.※ この項目についての他の分かりやすい解説
○「図解 アンケート調査と統計解析がわかる本」(酒井隆著/日本能率協会マネジメントセンター)・・・23調査対象者を測る4つの尺度
○「図解入門 よくわかる統計解析の基本と仕組み(改訂版)」(山口和範著/秀和システム)・・・1-4データの尺度
○Wikipedia http://ja.wikipedia.org/wiki/%E5%B0%BA%E5%BA%A6%E6%B0%B4%E6%BA%96
| (*) アンケート調査などに用いる尺度: 「非常によい:4,よい:3,悪い:2,非常に悪い:1」 が要注意のようだ. 右図Aのような目盛りは順序尺度で,定性的データとなるが,間隔尺度として用いるには,右図Bのような等間隔・等距離の選択肢でなければならない.これら2つの間には,定性的データと定量的データという大きな相違があって安易に同一視すると危ない. 実際上の必要のため,本来は順序尺度であるものを間隔尺度とみなすためには,「心理的に等距離・等間隔な選択肢」を目指す他,前提を忘れた議論をしないことが重要だと考えられる. 次のアンケートAで平均が3.0の場合とBで平均が3.0の場合,何が違うか?どちらのアンケートが適切か?その集計に基づいて,何らかの計画を実施してよいといえるか? A:「非常によい:4,よい:3,悪い:2,非常に悪い:1」 B:「非常によい:5,よい:4,普通:3,悪い:2,非常に悪い:1」 |
![]() |
|
|