Rのはじめかた


 

量的な研究のお話をするときには,いつも再現性の確保のために,フリーでオープンソースの統計解析環境 R をお薦めしています。しかし,「Rは使ってみたいけど,どうやって始めればよいかわからない」というご意見をよく耳にします。

「Rなんてマニアックそうなのは自分には使えない。」というのが,まったく使ったことのない人が持つ印象かもしれません(私も10年ぐらい前まではそう思っていました)が,こちらの冒頭に書いてあるように,Rは現在,計算統計学におけるリンガ・フランカ(国際共通語)と考えられているため,量的な研究を行う研究者は使っておいて損はないと言えるでしょう。

Since its publication by Ihaka and Gentleman (1996), R (R Development Core Team 2012) has become a successful language for statistical computing and graphics. Today, it is often regarded as the lingua franca of computational statistics.

そこで,今回はRを触ったことがない人が,まず第一歩を踏み出すための資料をいくつか紹介したいと思います。

フリーでオープンソースであることもあり,R に関するわかりやすい資料はどんどんウェブで新しく出てきますが,2014年2月の段階で個人的にお薦めしたいオンライン上の資料は以下です。

 

書籍では,『Rによるやさしい統計学』(山田 剛史,杉澤 武俊,村井 潤一郎 / オーム社)が抜群にわかりやすいです。(Kindle版もあり)


外国語教育研究に興味がある研究者の方は,とりあえず R をインストールしてから,『外国語教育研究ハンドブック』のコンパニオン・ウェブサイトにRのコードがありますので,書籍を読み進めながらRを実行してみると,理解が深まると思います。

また,過去にこのブログでも紹介したのですが,Larson-Hall (2010) の R 版 は書籍自体がフリーでオンラインにあります。こちらは SLA 研究の実例データが多く含まれているので,SLA 研究者にはとても参考になると思います。

その他にも,心理学のほうでは,”Discovering Statistics Using SPSS” (最新版はIBMと入っているところに大人の事情がありそうだけどとてもわかりやすい本)の R 版 “Discovering Statistics Using R” もあります。

R自体は,SPSSのようにGUI (Graphical User Interface) があるわけではなく,コマンド入力をしなければならないというところが,その普及の大きな障害となっていますが,R Commander (Win/Mac)MacR (Macのみ) を使えば,GUIベースの統計解析ソフトのように直感的に分析を実行することも可能です。

実際,「道具は何でも構わない」というのが私のスタンスです。しかし,「再現性」ということを考えた場合には,どうしてもRが他の統計解析ソフトよりも上位に来ます。SPSSを使う場合も,再現性を重視する研究者の方はシンタックスをできるだけ用いるように心がければよいかと思います。

 

 

メタ分析はすべきではない?


 

昨年10月に秋田で開催されたメソドロジー研究部会で,浦野研先生と亘理陽一先生による,「英語教育研究における追試(replication)の必要性」というタイトルの発表がありました。

浦野先生のブログで公開されている資料からもわかるとおり,発表の内容はとてもすばらしく,英語教育研究の分野で(メタ分析よりも先に)追試(replication)の必要性があるということをわかりやすくお話いただきました。

この発表で主張されていた内容にはほとんど賛成なのですが,2点ほど個人的に気になっている点(というか引っかかっている点)がありますので,すでに数ヶ月経ってしまっていますが,こちらに書いておきたいと思います。

まず1点目は,亘理先生がブログでも書かれている以下の点についてです。

指導方法や対象となっている文法項目があまりにも異なり,また十分網羅されているとは言えず,こうした研究をsynthesizeしても広くぼやけたことしか言えない(のでひとつにまとめるべきではない)というのが結論です。

前半部分は,メタ分析における分類が適切ではない(もしくはそもそもの研究数が足りない)ということですが,「分類が適切ではない」もしくは「十分網羅されていない」という結論を導き出したのが,メタ分析の論文 (Norris & Ortega, 2000) の再分析によるものですから,逆説的ですが,少なくともこの論文の存在意義はあると言えるのではないかと思います。

また,「分類が適切ではない」というのであれば,同じデータを用いて,再度,moderator variable(調整変数)のコード化を行い,メタ分析をし直せばよいのです。そのため,メタ分析ではそのような再分析が可能であるように,使用した論文や詳細が示されています。(実際,亘理先生はそのように再度コード化をしています。その moderator variable を使ったメタ分析はいつ見れるのか楽しみにしているところです。)

後半部分の「広くぼやけたことしか言えない(のでまとめるべきではない)」というところも,メタ分析の目的が「これまでの先行研究の全体像を示す」ということにあるのであれば,その目的にかなったメタ分析になります。広くぼやけたことでも,先行研究を統合することによって,先行研究で不足している点や,今後の研究での課題などが見えてくるはずです。

次に2点目ですが,浦野先生が主張されていた以下の点についてです。

突き詰めると、メタ分析を行うには、独立変数と従属変数のそれぞれで統制をおこなった研究のみを対象にしないと、いわゆる「統合」にならないと主張したと言えると思っています。. . . 「どんな言語項目・規則を対象にどのような指導を行ったのか」(=独立変数)と「学習者の知識をどのように測定したのか」(=従属変数)にばらつきがあると、メタ分析の結果、具体的な提案には至りません(Norris & Ortega, 2000もそう)。

この主張を行うために,浦野先生は,統制された実験を行いやすい医学系のメタ分析を比較対象として挙げていました。しかし,実際,メタ分析を行うには「統制された研究のみ」を対象にする必要があるのでしょうか?— それも「目的による」でしょう。浦野先生が主張されている「メタ分析とはこういうものだ」というのは,「純粋な」メタ分析のあるべき形ですが,必ずしもそういうものだけがメタ分析というわけではありません。

外国語教育研究ハンドブック』で印南洋先生が書かれているように,メタ分析は「先行研究での全体的な傾向や,研究間の不一致を調べる場合」(p. 227)にも用いられるべきなのです。(『教育・心理系研究のためのデータ分析入門』でも印南先生がメタ分析のわかりやすい解説をしてくれています。)

また,後半部分の「具体的な提案をする」ということについても,メタ分析の目的が「これまでの先行研究の全体像を示す」ということにあるのであれば,「具体的な提案」が目的とはならないはずです。このあたりの議論は,Borenstein et al. (2009) の Chapter 40: When Does it Make Sense to Perform a Meta-Analysis? [pdf] に解説があります。(Chapter 43: Criticism of Meta-Analysis [pdf] も参考になります。)

浦野先生と亘理先生の主張は,結局は「構成概念と操作的定義がはっきりしていないものについては,メタ分析をすべきではない」ということだと思いますが,私は上述の理由から全く逆の立場です。

目的に合ったメタ分析はどんどんしましょう。

一般的な研究論文の先行研究のレビュー(ナラティブ・レビュー)では,その論文に関連のある内容のみが取り上げられて,(紙面の都合や著者の不勉強にもよる場合もありますが)メタ分析のように包括的・系統的なレビューはできません。そのため,たとえ構成概念がごちゃ混ぜになったものであったとしても,メタ分析によって初めて先行研究の全体像や特に問題点が明らかになることも多いと言えます。また,論文著者や,浦野先生や亘理先生のような批判的な読者が,先行研究で不足している点や,今後の研究での課題を指摘することによって,その研究テーマが精緻化されていきます。

さらに,実際にメタ分析を行ってみて,メタ分析の考え方を理解することによって,1つ1つの研究結果は再現性に乏しい(特に p 値!)ということがわかれば,自分や他の研究者の行った研究結果に対する見方が変わりますし,なぜ 追試(replication)が必要かということも身をもって知ることができます。メタ分析は実際にしなくても,「メタ分析的思考」はこれからの研究者は必ず身につけるべきでしょう。

浦野先生と亘理先生のご発表内容,そして発表資料を見ただけでは,「メタ分析はすべきではない?」と思ってしまう人もいるかもしれませんので,私のような擁護派の意見もご参考にしていただき,それぞれの研究者が自分にとってメタ分析が必要かどうかを判断していただきたいと思います。

CentOSのRにsemPlotパッケージをインストール


 

 

Shiny を使い,SEM をオンライン上で実行できるこのWeb Application を作っていて,自分のサーバー(CentOS 6)に semPlot パッケージがインストールできなかったのをどうにか解決したのでメモ。

<症状>
semPlotを install.packages(“semPlot”)とやっても,最後に以下のようなエラーが出る。

dat <- Warning in install.packages :
installation of package ‘XML’ had non-zero exit status
ERROR: dependencies ‘jpeg’, ‘png’ are not available for package ‘qgraph’
* removing ‘/home/XXX/qgraph’
Warning in install.packages :
installation of package ‘qgraph’ had non-zero exit status
ERROR: dependencies ‘qgraph’, ‘XML’ are not available for package ‘semPlot’
* removing ‘/home/XXX/semPlot’
Warning in install.packages :
installation of package ‘semPlot’ had non-zero exit status

<原因>
“had non-zero exit status” でググってみると結構ヒットする。
その中で,特に以下の記事にヒントがあった。
「XMLパッケージのインストール」| My Life as a Mock Quant

CentOSだとインストールの方法が違うので,以下の記事を参考にインストール。
「yum経由でCentOSにlibxmlをインストールする方法」| Layer8

yum -y install libxml2-devel

続いて,jpeg と png もインストール。

yum -y install libjpeg-devel
yum -y install libpng-devel

これで,install.packages(“semPlot”) で,semPlotパッケージのインストールが無事成功。

 

英語論文を書くときに必要な道具2013夏


 

 

ここ最近使ってる「仕事道具」です。(※ちなみにMacの話をしています)

 

(1) LaTeX

何よりも書くことに集中できます。ただし,ファイルは pdf で出力されるので,投稿先も pdf で出せるところ限定になります。

 

(2) CasualConc

英語論文コーパスを自作してフレーズを確認しています。

 

(3) Mendeley

LaTeX(やWord)で参考文献を自動作成。普段は文献管理で使用しています。

 

(4) CrossRef Metadata Search

参考文献の詳細や doi がわからないときに使います。

 

(5) シソーラス

Macの標準搭載辞書のOxford American Writer’s Thesaurusを使っています。

 

(6) 新編英和活用大辞典

Mac 版アプリでたまにコロケーションの確認をします。

 

(7) Google (Scholar)

もろもろの検索と英語のフレーズチェックのために。

 

(8) 先行研究(論文のpdf)

引用はもちろんですが,研究者コミュニティーの academic writing でよく使われているフレーズは積極的に真似します。しかし,こちらの説明(pdf)にあるように,剽窃(plagiarism)にならないように「よく使われるフレーズ」でないものは引用が必要です。

Some English phrases are very common and will obviously show up in the writing of many different people. Plagiarism only arises when a string of words or thoughts is long enough that individual variations in expression are likely to occur.

※「よく使われるフレーズ」がどういうものかというのは,Hyland (2008) の論文などが参考になります。

 

(9) R

分析とグラフ作図はだいたいRを使っています。

 

(10) OmniGraffle

パス図などはこれで描いています。

 

(11) Keynote

Rのグラフ作図で物足りないときにヘルプで使っています。

 

(12) APA Publication Manual 6th

pdf 化していつでも検索できるようにしています。

 

(13) Twitter

論文を書き始めるときに閉じて,疲れたらたまに開きます。
なぜか執筆がだいぶ遅くなります。

 

すべてMac上で開いて使いますので,いくらモニターがあっても足りません。

 

 

RSSリーダーを使ったジャーナル最新号のチェック(2013年夏)


 

(トップ)ジャーナルに掲載された最新の論文はできるだけ確認したいものです。

これまでは,こちらに書いていたように,Google Reader を利用していましたが,Google Reader が2013年7月1日に終了してしまったので,一時的な避難先として,Feedspot を使っていました。しかし,ジャーナルの最新号や Early View (Online First) が更新されたタイミングで通知する方法を知らなかったため,2ヶ月近く放置してしまっていました。そこで,今回使い方を見直してみました。

ジャーナルの最新号が公開されたときに,どう知らせてほしいかという理想は以下のようなものでした。

  1. メールでの通知。
  2. ブラウザ上での通知。
  3. iOS (iPhone や iPad) でプッシュ通知。

そこで,Feedspot と,他にも評価の高い Feedlyの2つのサービスを,数日間使って比較してみました。
GoogleリーダーからFeedlyに移行すべき8つの理由

(その他のサービスは以下を参照)
Google Readerに代わるRSSリーダー(Feedly、Flipboardなど) – NAVER まとめ
Googleリーダー難民へ贈る! 本当に使いやすいRSSリーダーまとめ

まず,1の「メールでの通知」ですが,FeedspotFeedly ともに,Google Reader のように,RSSを集めた自分のサイトを公開することができないので,そのサイトをはてなアンテナに入れて,メールで通知するという使い方はできませんでした。しかし,ジャーナルの RSSはこちらに登録しているので,単純に自分のブログをアンテナで拾えば,ジャーナルの最新号が更新されたときに,メールで通知することもできたということを思い出し… まぁ,何事も勉強ですね。

次に,2の「ブラウザ上での通知」ですが(※ちなみに,Macでの話をしています),Feedspot,Feedly ともに,Chrome や Safari の拡張機能を利用した通知がありますが(Feedly は Firefox のプラグインもある),Chrome の Feedly  Notifier が Feeddspot の拡張機能よりも速かったです。実際に,あるジャーナルの更新通知では4時間近い差がありましたので,Feedly (Notifier) の勝利。

ただし,Safari の 拡張機能だと,unread の件数を示してくれないので,通知に関しては Chrome のほうがベターです。
Add number of unread items on the Safari feedly button

3の「iOS (iPhone や iPad) でプッシュ通知」ですが,iOSアプリ自体があるのはFeedly だけです。ただ1つだけ Feedly が残念なのは,iOS のプッシュ通知がありません。しかし,別アプリの Reeder を使えば,Feedly の内容も以下のようにプッシュ通知ができます(ただ,iPad版のアプリはないので,iPhone版を拡大して使う必要があります)。

Reeder
ただし, このプッシュ通知ですが,アプリを起動しないと同期しない仕組みになっているので,純粋な「プッシュ通知」ではありません。残念すぎる…

とりあえずは,Chrome の Feedly Notifier でかなり速い通知があり,自分のブログをはてなアンテナに入れているのでメールでの通知も来ますし,その通知を確認してから,iPhone や iPad で内容を確認することもできるというのが,2013年夏の状態です。

もっと良い方法を使っている(知っている)という方がいたら,ぜひご教示下さい。

 

ARELE掲載論文に見る英語教育研究の現在—テーマと研究法—


 

2013年08月11日(日)全国英語教育学会第39回北海道研究大会でのワークショップ
『英語教育実践と研究の接点―研究の在り方と手法―』での私の担当箇所である,
「ARELE掲載論文に見る英語教育研究の現在—テーマと研究法—」のスライド,
参考文献・資料などのリンクをこちらでは公開しています。

共同発表者の浦野研先生のブログに,Ustreamの動画(録画・いつでも再生可能)と
浦野先生の担当パートのスライドもアップされています。
また,WS中・WS後の関連したTweetもこちらのTogetterにまとめています。
ご興味のある方は併せてご確認下さい。

 

私の担当パートの前半は全国英語教育学会の紀要である,Annual Review of English
Language Education in Japan の1~24号までの掲載論文を分析した結果です。

後半はそれに関連して,効果量と検定力分析,そして信頼区間報告の重要性に
ついてまとめ,ARELE掲載論文の一部を用いてメタ分析,検定力分析を行った
結果を報告しています。

スライド(slideshareからダウンロード可能)

 

参考文献・資料などのリンク(スライド出現順)

参考にした資料