.

■Rコマンダーによる因子分析

○はじめに
 因子分析はなかなかハードルが高く,どんなデータで何をしているのか,結果が何を表しているのかなど分かりにくいので,ここでは因子分析の体験・入門として,専門家が分析したデータを用いてその通りの結果が出るかどうか確かめることとする.
 金明哲(Jin Mingzhe)先生のサイトに因子分析の簡単な解説とデータ,Rによる分析方法があるのでこれを利用させてもらうことにする.ただし,元の頁ではRのコマンドラインからキーボードを使って入力することになっているが,ここではRコマンダーを用いてマウスで簡単に行うこととする.
○因子分析の概要とExcelデータの入手
 この頁のメニューから因子分析の概要を読むことができる.(PDFファイル)
 この頁のメニューから因子分析に使うデータをダウンロードできる.(職業適性能力検査データ)
 ・・・注:ファイルのデータとして日本語2バイト文字(漢字など)が使われているのは構わないが,ダウンロード先の自分のパソコンのフォルダ名に日本語2バイト文字が使われているとRからインポートできないことがあるので,英数字のフォルダ名を作りその中に保存した方がよい.
 ・・・なお,文字化け対策についてはhttp://cwoweb2.bai.ne.jp/~jgb11101/などに丁寧な解説がある.
○Rコマンダーによる因子分析
  • Excelを起動する.
  • Rを起動する.(*1)
  • Rコマンダーを起動する.(*2)
  • 上記のExcelをインポートする.(*3)
  • 【ここからが因子分析】
    • 統計量→次元解析→因子分析
    • →変数を選択するときに,右に述べたようにF1という変数を取り込まないように気をつける(元順ではなくアルファベット順に並ぶので先頭の整理番号が紛れ込まないように気をつける).
    • →因子の回転:バリマックス,因子スコア:バートレットの方法→OK
    • →抽出する因子数は4にする→OK
Excel2007での操作
(*1)アドイン→RExcel→Start R
(*2)アドイン→RExcel→Rcomannder→with separate menus

【以下はRコマンダーのメニューから】
(*3)データ→データのインポート→ExcelまたはAccess,dBaseのデータセットから→(データセット名はそのままでよい)OK→保存したフォルダのCATB50.xlsを開く→職業適性検査のシートを指定する
⇒データが正しくインポートされているかどうか【データセットを表示】により確かめる.
※ 【データセットを表示】するとデータの整理番号としてF1というフィールド(列)が作られていることが分かる.F1という列ラベル(変数名)は,Rによる因子分析において潜在変数を表す名前に使われるのでこの列を含めると名前が重複してしまう.
○出力ウィンドウにおける表示
 右のように出力され,専門家の行った通りにトレースできたことが分かる.(上記のPDFファイルの記述と一致する.)
 出力された結果の解釈の仕方はもとのPDFファイルに書かれている.

 ここで行った実技体験を思い出しながら,「因子の回転とは」「因子スコアとは」「因子数とは」などについて因子分析の理論にも当たってみるとよい.
Uniquenesses :        
A B C D E F G H I J K
0.575 0.56 0.653 0.429 0.467 0.34 0.5 0.354 0.278 0.277 0.4
Loadings:    
  Factor1 Factor2 Factor3 Factor4
A       0.649
B 0.146 0.16 0.303 0.549
C 0.333 0.332 -0.177 0.308
D 0.646 0.312 0.212 0.11
E 0.574 0.286 -0.321 0.137
F 0.26 0.722   0.26
G     0.682 0.167
H 0.747   0.242 0.144
I 0.211 0.802 0.185  
J 0.786 0.196 0.126 -0.226
K 0.276 0.351 0.616 -0.144
  Factor1 Factor2 Factor3 Factor4
SS loadings 2.247 1.653 1.23 1.038
Proportion Var 0.204 0.15 0.112 0.094
Cumulative Var 0.204 0.355 0.466 0.561

Test of the hypothesis that 4 factors are sufficient.
The chi square statistic is 11.2 on 17 degrees of freedom.
The p-value is 0.846
...メニューに戻る ..Rのメニューに戻る