はじめに
この記事では、科学研究における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐ方法を学ぶために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。
なお、『ダメな統計学――悲惨なほど完全なる手引書』は、科学の世界での統計の誤用について説明した本で、私が日本語訳に当たった。2017年1月27日から販売された。この本の詳しい紹介は、「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事に書いたので、そちらもご参照願いたい。
- アレックス・ラインハート〔著〕・西原史暁〔訳〕.(2017).『ダメな統計学――悲惨なほど完全なる手引書』東京:勁草書房.
- 原書:Reinhart, A. (2015). Statistics Done Wrong: The Woefully Complete Guide. San Francisco: No Starch Press.
さて、冒頭で触れたように、この本には科学研究におけるさまざまな統計の誤用が取り上げられている。しかし、この本には、技術的な詳細はほとんど書かれていない。この本は、まずは統計的な概念の基本を把握させることを重視しており、細かすぎる話はしていないのだ。とはいえ、実際の統計分析の際には、この本で扱われていない技術的な詳細をも理解する必要が出てくるかもしれない。
さらに理解したいという読者のために、この本にはかなりの量の参考文献が挙げられている。挙げられた参考文献を読めば、技術的な詳細が分かるというわけだ。
だが、この本がもともと英語で書かれたこともあり、こうした参考文献も英語のものばかりになっている。普段、日本語を使う読者にとっては、こうした英語の文献で学んでいくというのは難しいかもしれない。
というわけで、『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に役立つような日本語の書籍をいくつか紹介したいと思う。
統計のどんな誤用・悪用があるかを学ぶ
まずは、『ダメな統計学』で挙げられた統計の誤用以外に、どんな統計の誤用・悪用があるかを知ることができる書籍を紹介しよう。
統計の誤用について扱った古典的な名著として、『統計でウソをつく法』という本がある。
- ダレル・ハフ〔著〕・高木秀玄〔訳〕.(1968). 『統計でウソをつく法』東京:講談社.
『ダメな統計学』が主に科学研究での統計の誤用を論じた本ならば、『統計でウソをつく法』は主に一般向けのマスメディアでの統計の誤用・悪用を論じた本だ。『統計でウソをつく法』の方が、比較的簡単な例としてはシンプルだろう。
統計の悪用に関連する書籍をもう1冊挙げよう。
- ベン・ゴールドエイカー〔著〕忠平美幸・増子久美〔訳〕(2015). 『悪の製薬――製薬業界と新薬開発がわたしたちにしていること』東京:青土社.
この本は、製薬業界でのデータの捏造などの問題を扱ったものである。『ダメな統計学』の原著者のアレックス・ラインハート氏はこの本の原書を読んで、血圧に「統計的に有意な増加」を見せたという。
統計的仮説検定について学ぶ
『ダメな統計学』では、前半の方で統計的仮説検定にまつわる誤解や誤用がさまざまな側面から扱われている。そして、知っておくべき道具立てとして信頼区間や検定力といったものが取り上げられている。
統計的仮説検定、信頼区間、検定力といったものはあまり理解しやすいものではない。これらをしっかりと使いこなすためには、しっかりと勉強することが必要になる。
しかし、学ぶと言っても、統計的仮説検定のロジックはそもそも理解することが難しい。このロジックをなるべく簡単な事例を通じて理解できる書籍として、以下の書籍を挙げたい。
- 結城浩.(2016). 『数学ガールの秘密ノート/やさしい統計』東京:SBクリエイティブ.
この本では、最小限の数学的な道具立てを使って、統計的仮説検定のロジックを説明することに成功している。本格的な入門書では難しく書いてあることが、この本では比較的分かりやすく書かれている。それなりの量の数式は出てくるが、本格的な統計の入門書に比べればかなり控え目なのだ。
なお、この本については、当ブログで「数学好きから統計好きに――『数学ガールの秘密ノート/やさしい統計』」という紹介記事を書いたので、興味がある方はそちらも参照されたい。
検定力・信頼区間について学ぶ
『ダメな統計学』で繰り返し述べられている検定力や信頼区間についてしっかりまとまっている統計の教科書はあまりない。そういった中で、以下の書籍は検定力や信頼区間を学ぶ際に非常に有用なものになっている。
- 大久保街亜・岡田謙介.(2012). 『伝えるための心理統計――効果量・信頼区間・検定力』東京:勁草書房.
この本では、冒頭で心理学研究において統計が適切に用いられていないことを説明している。その説明は『ダメな統計学』で扱われた統計の不適切な使用と軌を一にするところがある。そして、サブタイトルにある効果量・信頼区間・検定力について詳しく説明している。また、メタ分析についても少し扱われている。ちなみに、「心理」という限定がタイトルに付いているが、心理学以外の分野で統計を使う人にとっても十分使える。
検定力について、もっと気合を入れて学びたい場合は、以下の書籍もある。
- 永田靖.(2003). 『サンプルサイズの決め方』東京:朝倉書店.
こちらはもう少し難しい本だ。内容としては、さまざまな検定において検定力をどのようにして考えれば良いか、適切な検定力を持つ標本の大きさ(サンプルサイズ)をどうやって求めれば良いかと言うことが書かれている。ちなみにこの本では「検出力」という言葉が使われているが、「検定力」と同じ意味である。
統計モデルについて学ぶ
『ダメな統計学』の第7章や第8章では、適切でない統計モデルを立てて失敗する例が論じられている。
統計モデルについてもっと学びたい場合は、まず以下の書籍を読むことをお勧めする。
- Grafen, A., Hails, R.〔著〕、野間口謙太郎・野間口眞太郎〔訳〕(2007). 『一般線形モデルによる生物科学のための現代統計学――あなたの実験をどのように解析するか』東京:共立出版.
この本は「生物科学」という限定がタイトルに出ているが、それ以外の分野の人にも共通する話が書かれている。
また、上記の書籍の他に、以下の定番書がある。
- 久保拓弥 (2012). 『データ解析のための統計モデリング入門―一般化線形モデル・階層ベイズモデル・MCMC』 東京:岩波書店.
この本はダメなモデルを立てることに関して再三注意を述べており、その点でもダメな統計学に立ち向かう際の助けになるだろう。
なお、この本については、当ブログで「『データ解析のための統計モデリング入門』のレビュー」という紹介記事を書いたので、興味がある方はそちらも参照されたい。
良きプログラミング実践について学ぶ
『ダメな統計学』の第10章では、データや分析用のコードがしっかりと管理されないために失敗した事例が挙げられている。こうした失敗を防ぐためには、良きプログラミング実践について学ぶことが重要である。
統計分析で使われるR言語について、初心者が良きプログラミング実践を学べる書籍としては以下のものがある。
- Lander, J. P.〔著〕、高柳慎一・牧山幸史、箕田高志〔訳〕(2015). 『みんなのR:データ分析と統計解析の新しい教科書』東京:マイナビ出版.
この本では、かなり早い段階から、統合開発環境 (IDE) とバージョン管理について紹介している。これらを使いこなせると、コードがばらばらになってしまうことなどが防ぐことができ、結果として統計分析が台無しにならなくなるだろう。
なお、この本については、当ブログで「Rのプログラミング言語的側面を学びたい人のための『みんなのR』」という紹介記事を書いたので、興味がある方はそちらも参照されたい。
『みんなのR』の内容をしっかりと理解している人は、以下の書籍を読んでさらにR言語によるプログラミング能力を高めることもできる。
- Wickham, H.〔著〕、石田基広・市川太祐・高柳慎一・福島真太朗〔訳〕.(2016).『R言語徹底解説』東京:共立出版.
この『R言語徹底解説』は、Rの中級者に向けた書籍で、効率的な分析プログラムを書く際に大いに助けになると思う。
また、R言語によるプログラミングに限らず、どのプログラミング言語にも共通するような良きプログラミング実践について扱った書籍として、以下のものがある。
- Boswell, D., Foucher, T.〔著〕、角征典〔訳〕(2012). 『リーダブルコード――より良いコードを書くためのシンプルで実践的なテクニック』東京:オライリージャパン.
より良い教育方法について学ぶ
『ダメな統計学』の12.1節では、統計教育の改善について議論されている。そこでは、一方的な講義による授業では学生が概念を理解しにくいということが、物理教育の例で説明されている [3] 。
ここで説明されている物理教育の事例について、もっと詳しく書いてある文章が『ディープ・アクティブラーニング』という本の第5章に載っている。初修物理学教育の問題点について触れ、ピア・インストラクションの良さを述べている。
- 松下佳代〔編〕.(2015). 『ディープ・アクティブラーニング』東京:勁草書房.
もちろん物理教育で言われていることが、統計教育にそのまま当てはまるとは限らない。とはいえ、これからの統計教育を考えるに当たり、参考になることはあるだろう。