Rを使った分析(一元配置分散分析)

■ 分析前にやっておくこと

(1) Rのインストール
(2) 作業ディレクトリの確認と変更をしておく
(3) 作業ディレクトリにデータを入れておく
(4) 必要なパッケージをインストールしておく

 


■ 繰り返しなしの一元配置分散分析

データの読み込み

書籍使用データ(右クリックで「別名で保存」して作業ディレクトリに入れる)

dat <- read.csv("ch06one-way.csv", header=TRUE, fileEncoding="CP932")
# fileEncoding="CP932"はMacの場合入れる

もしくは,Excel を開いてデータ範囲をコピーしてから読み込む
(クリップボードからのデータ読み込み)

Macの場合

dat <- read.table(pipe("pbpaste"), header=TRUE)  
# header=TRUEで変数名を含む,FALSEにすると含まない

Windowsの場合

dat <- read.table("clipboard", header=TRUE) 
# header=TRUEで変数名を含む,FALSEにすると含まない

 

データの加工
クラスを因子の型に変更

dat$Class <- factor(dat$Class)  # ここでは上書き

attachすることで,dat$Classなどとわざわざ書かなくても良いように指定

attach(dat)

 

グループごとの平均と標準偏差

table(Class)                # 各グループの人数確認
tapply(Score, Class, mean)  # 各グループの平均
tapply(Score, Class, sd)    # 各グループの標準偏差
# psychパッケージを利用する場合
library(psych)
describe.by(Score, list(Class))

 

等分散性の検定(Levene Test)

library(car)   # car パッケージを使用
leveneTest(Score, Class, center=mean)
# SPSSと同じ結果を得るためにcenter=meanを指定

 

繰り返しなしの一元配置分散分析の実行

anova(lm(Score~Class))
繰り返しなしの分散分析結果

繰り返しなしの分散分析結果

 

多重比較

TukeyHSD(aov(Score~Class))     #テューキーの方法
pairwise.t.test(Score, Class)  #Holm法
pairwise.t.test(Score, Class, p.adjust.method="bonferroni")  
                               #ボンフェローニの方法
Tukeyの方法

Tukeyの方法

 

効果量

分散分析の効果量イータ2乗は以下で計算可能。

η2 = グループ間の平方和 / 平方和の合計

そのため,「繰り返しなしの分散分析結果」の出力を使い,
848/(848+37260) で算出が可能(結果は η2 = .022)。

分散分析の出力を利用した場合

result <- anova(lm(Score~Class))  #resultに結果を入れる
result$"Sum Sq"[1]/(result$"Sum Sq"[1]+result$"Sum Sq"[2])

 

多重比較の効果量は,組み合わせごとに計算する。
検定の効果量算出方法を参照)

 


■ 繰り返しありの一元配置分散分析

データの読み込み

書籍使用データ(右クリックで「別名で保存」して作業ディレクトリに入れる)

dat <- read.csv("ch06one-way-repeated.csv", header=TRUE, fileEncoding="CP932")
# fileEncoding="CP932"はMacの場合入れる

もしくは,Excel を開いてデータ範囲をコピーしてから読み込む
(クリップボードからのデータ読み込み)

Macの場合

dat <- read.table(pipe("pbpaste"), header=TRUE)  
#header=TRUEで変数名を含む,FALSEにすると含まない

Windowsの場合

dat <- read.table(“clipboard", header=TRUE) 
#header=TRUEで変数名を含む,FALSEにすると含まない

 

繰り返しありの場合は,ANOVA君を使うとデータの加工が必要ない。
ここではANOVA君を使った方法を説明する。

ANOVA君を使えるようにする

これを右クリックで「別名で保存」して作業ディレクトリに入れて
以下のように入力

source("anovakun_420.txt")

 

繰り返しありの一元配置分散分析の実行

anovakun(dat, "sA", 3, holm = T, mau = T, eta = T)

“sA”は被験者内を示し,3で水準を指定している。
holm = T でHolmの方法による多重比較,mau = T で Mauchlyの球面性検定,
eta =T で効果量のイータ2乗(peta = T で偏イータ2乗)を出力する。
auto = T を入れれば,Greenhouse-Geisser で調整した分散分析表が算出される。
その他のオプションは, ANOVA君のサイトを確認。

one-way-repeated_anovakun-results

繰り返しのある一元配置分散分析結果

 


■ Rcommanderを使う場合

library(Rcmdr)   # Rcommanderパッケージの読み込み

コンソールでデータの読み込みができている場合は,
<アクティブデータセットなし>をクリックし,datを選択。
参照 Rコマンダーでデータを読み込む場合

 繰り返しなしの一元配置分散分析

(1) データをRコマンダーから読み込んだ場合は,クラスを因子の型に
変更する。[データ]→[アクティブデータセット内の変数の管理]→[数値変数を
因子に変換]で,「変数」でClassを選択し,「因子水準」は「数値で」に
チェックを入れ,変数の上書きをする。

(2) 記述統計は,[統計量]→[要約]→[数値による要約]を選び,
「層別して集約」でClassを層別変数に選択し,グループごとに算出。

(3) 等分散性の検定は,[統計量]→[分散]→[ルビーンの検定]を選び,
「中心的傾向」を「平均」にしてOKをクリックする。

(4) 一元配置分散分析は, [統計量]→[平均]→[1元配置分散分析]で実行。
「2組ずつの平均の比較(多重比較)」にチェックを入れておくと,
Tukeyの方法で多重比較が実行される。

繰り返しありの一元配置分散分析
Rcommander では,データ入力方法を変更しない限りできないため,
ここでは説明を省略する。詳しくはこちらを参照。