Rを使った分析(相関分析)

■ 分析前にやっておくこと

(1) Rのインストール
(2) 作業ディレクトリの確認と変更をしておく
(3) 作業ディレクトリにデータを入れておく
(4) 必要なパッケージをインストールしておく

 


データの読み込み

書籍使用データ(右クリックで「別名で保存」して作業ディレクトリに入れる)

dat <- read.csv("ch09correl.csv", header=TRUE, fileEncoding="CP932")
# fileEncoding="CP932"はMacの場合入れる

もしくは,Excel を開いてデータ範囲をコピーしてから読み込む
(クリップボードからのデータ読み込み)

Macの場合

dat <- read.table(pipe("pbpaste"), header=TRUE)  
# header=TRUEで変数名を含む,FALSEにすると含まない

Windowsの場合

dat <- read.table("clipboard", header=TRUE) 
# header=TRUEで変数名を含む,FALSEにすると含まない

 

相関係数を求める

attach(dat)    # dat$国語 などと書かなくていいようにattach
cor(国語, 英語)  # 何も指定しなければピアソンの積率相関係数

相関行列表(correlation matrix)を出す場合

cor(cbind(dat))

相関係数以外(p値など)も出す場合

cor.test(国語, 英語)

スピアマンの順位相関係数

cor(国語 , 英語, method="spearman")

ケンドールの順位相関係数(データが少なくて,同率順位が多いとき)

cor(国語, 英語, method="kendall")

 

散布図を描く

par(family="HiraKakuPro-W3")  # Macで日本語表記する
plot(国語, 英語, xlim=c(0,100), ylim=c(0,100)) # xlimとylimで範囲を指定
# 回帰直線を入れる場合は以下を追加
abline(lm(国語~英語), col="red")

 

psychパッケージを使って散布図作成(相関係数,ヒストグラム,回帰直線)

library(psych)                # psychパッケージ
par(family="HiraKakuPro-W3")  # Macで日本語表示する
pairs.panels(dat)

 

 


■ Rcommanderを使う場合

library(Rcmdr)   # Rcommanderパッケージの読み込み

コンソールでデータの読み込みができている場合は,
<アクティブデータセットなし>をクリックし,datを選択。
参照 Rコマンダーでデータを読み込む場合

[統計量]→[要約]→[相関行列]で変数を選択する。
「相関のタイプ」を選ぶことができる。
デフォルトはピアソンの積率相関。

相関の検定は, [統計量]→[要約]→[相関の検定]で
変数を選択し実行。

散布図は,[グラフ]→[散布図]で作図できる。