■Excelデータなどのインポート

.
.
○他のソフトのデータをRに読み込む(インポートする)には
 Rのデータセットになっているものについては様々な分析ができるが,我々が日常的に使うデータはもっと汎用的なExcelデータなどになっていることが多い.これを手動でRのデータセットに入力する方法もあるが,手作業で転記を行うと転記ミスが発生しやすいので好ましくない.そこでExcelなどで得られたデータをRに取り込む方法が必要になる.


○1 Excelファイルを直接Rにインポートする方法

※以下においてRとRコマンダーは起動されているものとする.また,メニューはExcelメニューではなくRコマンダーのメニューとする.
(1) データ→データのインポート→ExcelまたはAccess,dBaseのデータセットから

(2) データセット名を入力→OK

(3) ファイルを選択→表を1つ選択:シートを選択する
 (「データセットを表示」で確かめるとよい.)

 Excelファイルのファイル名やファイルが格納されているフォルダ名に日本語全角文字(2バイト文字)が含まれている場合には,Rからそのファイルが読めないことがある.・・・ファイル名やフォルダ名は半角英数字にするほうがよい.

 ExcelファイルはExcel2007以降の *.xlsx の形式になっていてもインポートできるようである.
 ExcelデータはいずれかのシートにA1〜始まる1行目に列ラベルがあって,2行目以降にはデータがあるのがベストだと考えられるが,空白行や空白列が含まれていてもある程度は融通がきくようである.
 先頭の列(通常はA列)に1〜,No.1〜のような整理番号がなくてもRのデータセットとして整理番号が付加される.付加された整理番号には列ラベルが付かないので,様々な分析において変数(列ラベルが変数名)と混同することはない.
 これに対してExcelデータの段階で整理番号に列ラベルが付いていると,整理番号も変数に取り込むミスが起こりやすい.
⇒Excel上で整理番号がない形式をインポートする方が扱いやすい.

○2 テキストファイルからRにインポートする方法
1. データの間がタブやカンマで区切られたテキストファイルから
(Excelファイルをテキスト保存すると通常この形式になる)
(1) データ→データのインポート→テキストファイルまたはクリップボード,URLから
(2) 右図のように身長,体重という列ラベルがあればこれが変数になるので「ファイル内に変数名あり」はチェックをそのままにする,データファイルの場所=ローカルファイルシステムのまま,フィールドの区切り記号=拡張子がCSV(Comma Separated Values)のファイルからカンマを選択,自分でExcelファイルを単純にテキスト保存したものならタブを選択→OK→ファイルを選択
 (データセットを表示して確かめるとよい.)
2. 個々のデータが固定長になっていて,特に区切り文字のないテキストファイルから
(Rの出力結果をテキストファイルとして保存したときは,右の表1のような形式になる.このような形式でも「フィールドの区切り記号=スペース」でインポートできることになっているが,必要な情報が足りなくて不要な情報が入っていることが多いので一旦Excelに読み込んで形を整えてからインポートした方が安全なようである.)
表1
Comp.1 Comp.2 Comp.3
A -0.05245387 -0.193993 0.65282528
B -0.21255948 0.118915427 0.5567238
C -0.27274913 -0.367111929 0.12403292
D -0.40864003 0.069270558 -0.06599976
E -0.30879561 -0.40750123 -0.14397497
F -0.35221413 -0.250719463 0.11048695
G -0.11297299 0.58464385 0.2717937
H -0.37578149 0.114126876 -0.05848239
I -0.34911512 -0.005714217 -0.01967668
J -0.36117785 0.0760876 -0.35195268
K -0.29150189 0.468063463 -0.09824258


○3 メモリ(クリップボード)からRにインポートする方法

(1) Excelファイルの一部分をRにインポートしたいとき,たとえば右図1のB1:C10の範囲をインポートするには,Excel上でB1:C10の範囲を選択・反転表示にし,コピーする.
Excelのセルとセルの間はタブで区切られる.
 以上により選択された範囲のデータがパソコンのメモリ(クリップボード)に入るので,Rコマンダーのメニューを用いて次の操作でデータセットにインポートできる.

(2) データ→データのインポート→テキストファイルまたはクリップボード,URLから
(3) 右図のように身長,体重という列ラベルがあればこれが変数になるので「ファイル内に変数名あり」はチェックをそのままにする,データファイルの場所=クリップボードを選択,フィールドの区切り記号=タブ→OK
 (データセットを表示して確かめるとよい.)

図1
...メニューに戻る ..Rのメニューに戻る