量的な研究のお話をするときには,いつも再現性の確保のために,フリーでオープンソースの統計解析環境 R をお薦めしています。しかし,「Rは使ってみたいけど,どうやって始めればよいかわからない」というご意見をよく耳にします。
「Rなんてマニアックそうなのは自分には使えない。」というのが,まったく使ったことのない人が持つ印象かもしれません(私も10年ぐらい前まではそう思っていました)が,こちらの冒頭に書いてあるように,Rは現在,計算統計学におけるリンガ・フランカ(国際共通語)と考えられているため,量的な研究を行う研究者は使っておいて損はないと言えるでしょう。
Since its publication by Ihaka and Gentleman (1996), R (R Development Core Team 2012) has become a successful language for statistical computing and graphics. Today, it is often regarded as the lingua franca of computational statistics.
そこで,今回はRを触ったことがない人が,まず第一歩を踏み出すための資料をいくつか紹介したいと思います。
フリーでオープンソースであることもあり,R に関するわかりやすい資料はどんどんウェブで新しく出てきますが,2014年2月の段階で個人的にお薦めしたいオンライン上の資料は以下です。
- Rオンラインガイド(山口大学教育心理学教室)
→ ビデオなので非常にわかりやすいです。 - Rチュートリアルセミナーテキスト(山口大学教育心理学教室)
- LET2012 WS「R による教育・言語データ処理のススメ」(阪上さん)
- R入門 Ver. KG.R [pdf] (林さん)
- 統計解析ソフトR の活用 [pdf] (舟尾さん) → 少し難易度高め
書籍では,『Rによるやさしい統計学』(山田 剛史,杉澤 武俊,村井 潤一郎 / オーム社)が抜群にわかりやすいです。(Kindle版もあり)
外国語教育研究に興味がある研究者の方は,とりあえず R をインストールしてから,『外国語教育研究ハンドブック』のコンパニオン・ウェブサイトにRのコードがありますので,書籍を読み進めながらRを実行してみると,理解が深まると思います。
また,過去にこのブログでも紹介したのですが,Larson-Hall (2010) の R 版 は書籍自体がフリーでオンラインにあります。こちらは SLA 研究の実例データが多く含まれているので,SLA 研究者にはとても参考になると思います。
その他にも,心理学のほうでは,”Discovering Statistics Using SPSS” (最新版はIBMと入っているところに大人の事情がありそうだけどとてもわかりやすい本)の R 版 “Discovering Statistics Using R” もあります。
R自体は,SPSSのようにGUI (Graphical User Interface) があるわけではなく,コマンド入力をしなければならないというところが,その普及の大きな障害となっていますが,R Commander (Win/Mac) や MacR (Macのみ) を使えば,GUIベースの統計解析ソフトのように直感的に分析を実行することも可能です。
実際,「道具は何でも構わない」というのが私のスタンスです。しかし,「再現性」ということを考えた場合には,どうしてもRが他の統計解析ソフトよりも上位に来ます。SPSSを使う場合も,再現性を重視する研究者の方はシンタックスをできるだけ用いるように心がければよいかと思います。
Rだとコードが残っているので,見ながら思い出すことができるし,だいぶ前の分析でも「やり方を忘れた」ということがなくなりました。SPSSでもシンタックスを保存しておけば,同じ作業を繰り返したり,後からの再分析が楽になると思います。 http://t.co/KZOWVaL8
— 水本 篤 (@MizumotoAtsushi) 2012, 9月 26