分析前にやっておくこと
(1) Rのインストール
(2) 作業ディレクトリの確認と変更をしておく
(3) 作業ディレクトリにデータを入れておく
(4) 必要なパッケージをインストールしておく
データの読み込み
説明用データ(右クリックで「別名で保存」して作業ディレクトリに入れる)
dat <- read.csv("ch03sample.csv",header=TRUE,fileEncoding="CP932") # fileEncoding="CP932"はMacの場合入れる
・ダイアログボックスから選択する方法
dat <- read.csv(file.choose())
・もしくは,Excel を開いてデータ範囲をコピーしてから読み込む
(クリップボードからのデータ読み込み)
Macの場合
dat <- read.table(pipe("pbpaste"), header=TRUE) # header=TRUEで変数名を含む,FALSEにすると含まない
Windowsの場合
dat <- read.table(“clipboard", header=TRUE) # header=TRUEで変数名を含む,FALSEにすると含まない
データの確認
colnames(dat) # 列名の確認
信頼性係数の確認(第02章の復習)
library(ltm) cronbach.alpha(dat[,5:64]) # [,5:64]は5列目から64列目までの指示
dat$Total # $ で dat というデータフレームの Total 列の指定 dat[,65]でも同じ
※(参考)合計点をRで計算する場合は以下の方法
rowSums(dat[,5:64]) # データが含まれている行の合計 rowMeans()は平均 # データフレームに追加する場合 Sum <- rowSums(dat[,5:64]) # 合計 dat <- cbind(dat, Sum) # datにSumの列を追加
分析対象のTotalの列のみを取り出してxとする
x <- dat$Total
記述統計
関数を使う方法
mean(x) # 平均 sd(x) # 標準偏差 var(x) # 分散 median(x) # 中央値 min(x) # 最小値 max(x) # 最大値 range(x) # 範囲
psych パッケージを使用する方法
library(psych) describe(x)
尖度と歪度
library(e1071) # e1071パッケージ使用 skewness(x) kurtosis(x)
library(fBasics) # fBasicsパッケージ使用 skewness(x, na.rm=T) kurtosis(x, na.rm=T)
正規性の検定
コルモゴロフ・スミルノフ検定(ケース数が30以上の場合)
ks.test(x, "pnorm", mean=mean(x), sd=sd(x)) # もしくは ks.test(scale(x), "pnorm")
シャピロ・ウィルク検定(ケース数が50以下の場合)
shapiro.test(x)
ヒストグラム作図
hist(x, breaks="FD") # breaks=“FD”を入れた方が良い
箱ひげ図(box plot)
boxplot(x) #horizontal=TUREで横向きになる boxplot(x, horizontal=TRUE)
QQプロット
直線上にプロットがあればデータが正規分布しているとわかる。
qqnorm(x) # QQプロット qqline(x, col=2) # 直線を赤(col=2)で描く
Rcommanderを使う場合
library(Rcmdr) # Rcommanderパッケージの読み込み
コンソールでデータの読み込みができている場合は,
<アクティブデータセットなし>をクリックし,datを選択。
参照 Rコマンダーでデータを読み込む場合
(1) 信頼性係数の確認は,[統計量]→[次元解析]→[スケールの信頼性]を選ぶ。
(2) 平均と標準偏差は,[統計量]→[要約]→[数値による要約]で分析する変数を選ぶ。
※その他は上述の関数やパッケージを使う必要がある。
(3) 正規性の検定は,[統計量]→[要約]→[シャピローウィルクの正規性の検定]で確認。
※コルモゴロフ・スミルノフ検定はない。
(4) ヒストグラム作図は,[グラフ]→[ヒストグラム]で実行。
(5) 箱ひげ図は [グラフ]→[箱ひげ図],QQプロットは[グラフ]→[QQプロット]で作図。