ジャーナル最新号のチェック

 

これまで,このHPに掲載している自分が読みたいジャーナルは,
はてなアンテナにこのような形で登録して,通知メールを受けてから
確認するようにしていましたが,うまくできないケースが増えてきたので,
Google Reader で RSS のフィードを読み込むようにしました。

本当はこういうのが作りたかったのですが,時間がかかりそうだったので断念。

RSSがないものや(残念なオンラインジャーナルに多い!),
CiNiiで発行1年後から公開される以下のようなものは,
これまで通りはてなアンテナに入れて確認するようにします。

Language Education & Technology (CiNii)

ARELE (CiNii)

JALT Journal

JACET Academic Journals (CiNii)

教育心理学研究 (CiNii) 

教育心理学年報 (CiNii)
 


 

Larson-Hall (2010) の R 版

 

Larson-Hall, J. (2010). A guide to doing statistics in second language research using SPSS. New York: Routledge.

この本の冒頭で,著者は「本当は R の本が書きたかったけど,出版社にそれでは売れないから,SPSS の本にしてくれ」と言われたと書いています。

その無念(?)を晴らすためかどうかはわかりませんが,この SPSS 本のコンパニオンサイトには,無料でこのような資料があります。

A Guide to Doing Statistics in Second Language Research Using R

この資料は,SPSS本での分析に加えて,特に作図の際の R のコードが丁寧に説明されていたり,robust statistics の説明も詳しいため(外れ値を多く含む値を扱う研究では,参考にしてみてもよるとよいかもしれません),とても参考になります。

ちなみに,この資料では,mixed-effects models について,次のように書いていました。

“There is then ample reason to consider the use of mixed-effects models above a traditional RM ANOVA analysis for repeated-measures data. … I do recommend that readers take a look at other treatments of mixed-effects models, including the very clear Crawley (2007), and also Baayen (2008), which contains examples from psycholinguistics, especially work with reaction times and decision latencies” (p. 255).

Baayen, R. H. (2008). Analyzing linguistic data: A practical introduction to statistics using R. Cambridge: Cambridge University Press.
Crawley, M. J. (2007). The R book. New York: Wiley.

こういう優れた資料をオンラインで無料で入手できるのは,R を使う大きな利点だと思います。

 

階層線形モデル/マルチレベルモデル/線形混合モデル

 

このタイトルの分析方法(モデル)について,
2012/11/10にメソドロジー研究部会・言語テスティング
第二言語習得合同発表会にてお話しました。
 

 iOSの場合は,”Sorry! Page not found”と表示されるので,こちらからご覧下さい

 

外国語教育研究ハンドブック」で紹介している,検定や,
分散分析(ANOVA),回帰分析は, 一般線形モデル(general linear model)
と呼ばれる枠組みのものです。

一方,一般化線形モデル (generalized linear model; GLM)は,
その枠組みを拡張したもので,ランダム効果が入ったら,
一般化線形混合モデル (generalized linear mixed model; GLMM)と
呼ばれます。ランダム効果については,資料をご確認ください。

分野や分析方法によって,線形混合モデルと呼んだり,
階層線形モデル (hierarchical linera model; HLM)と呼んだり,
マルチレベルモデル (multilevel movel)と呼んだりするので,
ややこしいですが,基本的な考え方は同じものです。

一番わかりやすい資料としては,土屋政雄先生のこの資料だと思います。
初心者による初心者のための「線形混合モデル」 

Rを使った初心者向けの資料としては,
川端一光先生の「マルチレベルモデル-Rによる実行-」が,
とても参考になります。Rだと,数式に対応している部分が
コードの中でわかるので,理解もしやすいのではないでしょうか。

入り口の内容が理解できたら,Rでコードと数式を丁寧に説明してある,
中級者による初心者のための「線形混合モデル」」(奥村泰之先生)が
よいでしょう。前提条件なども詳しく書いてあるので,貴重な資料だと思います。
<その他のわかりやすい説明や資料>

階層的線形モデル(HLM)について(奥村太一先生)

マルチレベルモデリング(ppt)(尾崎幸謙先生)

一般化線形モデルおよび混合モデル(Memorandums)

一般線形モデル(シリウス先生の心理統計学)

量的分析法勉強会(Miyazawa’s Pukiwiki)

Mixed model おすすめ文献集(エビ研)

マルチレベル分析講習会の資料(Sunny Side Up!)

R でマルチレベルモデル(myscratchpad)

統計分析リンク集(縄田健悟先生)

 

久保拓弥さんの「データ解析のための統計モデリング入門:
一般化線形モデル・階層ベイズモデル・MCMC
は,さまざまなところで取り上げられています。

 

書籍では,”Discovering Statistics Using R” の第19章で,
“Multilevel linear models” が詳しく説明されています。
これは本当にわかりやすいです。

 

『回帰分析入門 (Rで学ぶ最新データ解析)』の
第9章「階層線形モデル」もかなり参考になります。

 

その他に『マルチレベルモデル入門―実習:継時データ分析』は,
説明がかなり詳しいと思います。SPSS,SAS,R,それぞれのコードが
入っているので,実際にソフトを動かしながら学ぶことが可能です。
(数式が多いので,この本は初心者にはハードルが高いです。)

 

ちなみに,以下の論文は最近のもので,SLAにおいて
線形混合モデルを使うべき理由が説明されています。

Cunnings, I. (2012). An overview of mixed-effects statistical models for second language researchers. Second Language Research, 28, 369–382. doi:10.1177/0267658312443651

 

 

 

 

Q & A about journal publishing 延長戦

 

印南 洋 先生が,全国英語教育学会で Orega 先生
Journal publishing seminar 終了後に個別質問した内容を
転載許可いただきましたのでアップします。

 

(Q1) 研究業績書に under submission や under review の論文を書いて良いか?

投稿中の論文を
Yamada, T. (under submissionもしくはunder review). Title…
Journal name… のように研究業績書に書いている人がいるのですが,
google searchすれば著者がすぐに分かってしまい、blind reviewにならないのでは?

A1. その通りだが、そこまで著者に制限はできないが、研究業績書には
書かないで欲しい。

 

(Q2) 査読者のコメントをcut and pasteして自分の論文内で使うと
plagiarismになりますか?

A2. いい質問。なるだろう。cut and paste するのは良いが、
その後たくさん revise するうちに形跡がなくなると思う。
まさに的確な表現のため cut and paste して使いたいのであれば、
As reviewer 1 says, “…” のように引用すべき。査読者も喜ぶ。

 

(Q3) journal editorになるにはどうすればいいですか?

A3: たくさんの論文をreviewするうちに、このreviewerはジャーナルに
とって重要な人だとeditorが思うはず。
editorial boardに入れてもらえないか丁寧にリクエストしてみる。

 

t値と自由度から計算する効果量rはηと同じもの

 

外国語教育研究ハンドブック水本・竹内(2008)では,

検定のときの効果量として,r を紹介しています。

平均や標準偏差から計算する効果量の d は,指標として

わかりやすいものですが,検定から得られる 値と自由度(df)を

使って計算する効果量の r は,一体何を示しているのか,

わかりづらいといえば確かにそうだと思います。

 

大学院の授業でも毎年,学生が混乱しているようですし,

海外のジャーナルに論文を投稿して,査読者から

「この効果量の という指標は見たことがない」というコメントを

もらったという方もいましたので,説明をここにまとめておきます。

 

水本・竹内(2008, p. 61)を確認してみるとわかるように,

効果量の r は η (イータ)と同じものです。

ちなみに,t 検定の効果量として説明した r は相関比の

特殊な形であるため,η2 は,分散説明率と呼ばれる

相関係数(r)を 2 乗した r2 やR2 (回帰分析の決定係数,

coefficient of determination)と同じものであると

考えてよい (Field, 2005, p.357)。

 

そのため,論文には η と書いても構いません。

 

事実,Hatch and Lazaraton(1991) では,検定の効果量は,

r と同じように 値と自由度で計算していますが,

η として紹介されています。

Hatch, E., & Lazaraton, A. (1991). The research manual: Design and statistics for applied linguistics. Boston: Heinle & Heinle.

 

効果量の r は η は同じものだと言われても,

なぜ同じなのかわからないと思いますので,

ここでは,外国語教育研究ハンドブック第5章で使われている,

独立した(対応のない)検定のデータを使用して確認します。

 

R をお使いの方は,特別なパッケージは使わずに実行しますので,

コピーアンドペーストして試してみて下さい。

 

まず,データを読み込んで,検定を実行します。

dat <- read.csv(“http://mizumot.com/handbook/wp-content/uploads/ch05independent.csv”, header=T, fileEncoding=”CP932″)

dat # どのようなデータか確認

# 等分散を仮定した t 検定

t.test(dat$Score~dat$Group, var.equal=TRUE)

 

 

次に, 値と自由度から,効果量 r を計算します。

少し長いコードですが,上記の結果から手計算でも

構いませんし,Excelの計算シートを使ってもよいでしょう。

t検定の効果量算出についてはこちらを参照

t.result <- t.test(dat$Score~dat$Group, var.equal=TRUE)

r <- sqrt(t.result$statistic[[1]]^2/(t.result$statistic[[1]]^2+t.result$parameter[[1]]))

r

 

 

同じデータを使って一元配置の分散分析を行い,

効果量の η2 を計算します。

検定でも分散分析でも得られる p 値は同じになります)

anova(lm(dat$Score~dat$Group))

result <- anova(lm(dat$Score~dat$Group))

eta.squared <- result$”Sum Sq”[1]/(result$”Sum Sq”[1]+result$”Sum Sq”[2])

eta.squared #イータ2乗

 

 

上記の結果から得られる η2 はイータを2乗したものなので,

も同じように2乗して比較してみます。

r^2  # 値と自由度から計算した効果量 を2乗したもの

eta.squared #イータ2乗

 

 

同じ値になっていることが確認できます。

また,確認のために ηの2乗を外して r と比較します。

r # 値と自由度から計算する効果量 r

sqrt(eta.squared) # 2乗を外したイータ

 

 

こちらも同じ値になっています。

このように,r は η と同じものであることがわかります。

 

なぜ違う計算から得られる,r と η が同じ値になるのでしょうか。

 

値と自由度から計算できる,効果量 r は点双列相関係数

(point-biserial correlation coefficient) と同じものです。

 

点双列相関とは,以下の図のように,2つのグループを

示す値(1と2)と得点との相関係数のことです。

(グループを示す値は名義尺度なので,1と2でなくても,

2と3だったとしても同じです。)

 

 

上記までのデータで,Rを使って計算してみます。

pb.r <- cor(dat$Score, dat$Group)

pb.r

 

 

効果量では,正負の符号は関係ありません。

上で計算した,r と η と同じ値になっています。

 

また,t 値と自由度で計算した効果量rの2乗と,

点双列相関を2乗した値と,分散分析の結果から

計算される ηの3つを比べてみましょう。

r^2

eta.squared

pb.r^2 #を2乗したもの

 

 

同じ値になっていることがわかります。

 

点双列相関をグラフにしてみます。

attach(dat)

plot(Score~Group, ylim=c(0,100), xaxp =c(1, 2, 1), yaxp =c(0, 100, 10))

abline(lm(Score~Group), col=”red”)

 

 

グループ1と2の点数に差があれば,回帰直線の傾きも

急になる(つまり,r の値が大きくなる)はずですが,

差がないために,r の値が非常に小さくなっています。

 

参考までに,r = 0.1(効果量小),r = 0.3(効果量中),

r = 0.5(効果量大)の場合の2つのグループの差を図示します。

(効果量 d も一応入れています)

 

 

このように,どちらのグループに振り分けられたかに

よって,点数に差が生じるかどうかというのは,

分散分析における効果量の計算式

η2 = グループ間の平方和 / 平方和の合計

で確認している,「群の効果によるばらつき」

(グループの違いによって生じるばらつき)の割合と

同じものをみているといえるわけです。

 

結論:効果量の r と η は同じものである。