ダメな統計学を防ぐための書籍11冊

概要
科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良い本について紹介する。

はじめに

この記事では、科学研究における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだに、実際に統計の誤用を防ぐ方法を学ぶために役立つと思われる書籍を紹介する。主に、統計的仮説検定で間違いを犯さないようにする場合に役立つ書籍を紹介するが、それ以外の分野の書籍についても紹介する。

なお、『ダメな統計学――悲惨なほど完全なる手引書』は、科学の世界での統計の誤用について説明した本で、私が日本語訳に当たった。2017年1月27日から販売された。この本の詳しい紹介は、「『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版」という記事に書いたので、そちらもご参照願いたい。

さて、冒頭で触れたように、この本には科学研究におけるさまざまな統計の誤用が取り上げられている。しかし、この本には、技術的な詳細はほとんど書かれていない。この本は、まずは統計的な概念の基本を把握させることを重視しており、細かすぎる話はしていないのだ。とはいえ、実際の統計分析の際には、この本で扱われていない技術的な詳細をも理解する必要が出てくるかもしれない。

さらに理解したいという読者のために、この本にはかなりの量の参考文献が挙げられている。挙げられた参考文献を読めば、技術的な詳細が分かるというわけだ。

だが、この本がもともと英語で書かれたこともあり、こうした参考文献も英語のものばかりになっている。普段、日本語を使う読者にとっては、こうした英語の文献で学んでいくというのは難しいかもしれない。

というわけで、『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に役立つような日本語の書籍をいくつか紹介したいと思う。

ダメな統計学が続くのを止めるために勉強しよう<sup> [<a href="#footnote_0_3453" id="identifier_0_3453" class="footnote-link footnote-identifier-link" title="Pixabayよりivanacoi氏のパブリックドメイン画像を使用。">1</a>] </sup> 。
ダメな統計学が続くのを止めるために勉強しよう [2]

統計のどんな誤用・悪用があるかを学ぶ

まずは、『ダメな統計学』で挙げられた統計の誤用以外に、どんな統計の誤用・悪用があるかを知ることができる書籍を紹介しよう。

統計の誤用について扱った古典的な名著として、『統計でウソをつく法』という本がある。

ダメな統計学』が主に科学研究での統計の誤用を論じた本ならば、『統計でウソをつく法』は主に一般向けのマスメディアでの統計の誤用・悪用を論じた本だ。『統計でウソをつく法』の方が、比較的簡単な例としてはシンプルだろう。

統計の悪用に関連する書籍をもう1冊挙げよう。

この本は、製薬業界でのデータの捏造などの問題を扱ったものである。『ダメな統計学』の原著者のアレックス・ラインハート氏はこの本の原書を読んで、血圧に「統計的に有意な増加」を見せたという。

統計的仮説検定について学ぶ

『ダメな統計学』では、前半の方で統計的仮説検定にまつわる誤解や誤用がさまざまな側面から扱われている。そして、知っておくべき道具立てとして信頼区間や検定力といったものが取り上げられている。

統計的仮説検定、信頼区間、検定力といったものはあまり理解しやすいものではない。これらをしっかりと使いこなすためには、しっかりと勉強することが必要になる。

しかし、学ぶと言っても、統計的仮説検定のロジックはそもそも理解することが難しい。このロジックをなるべく簡単な事例を通じて理解できる書籍として、以下の書籍を挙げたい。

この本では、最小限の数学的な道具立てを使って、統計的仮説検定のロジックを説明することに成功している。本格的な入門書では難しく書いてあることが、この本では比較的分かりやすく書かれている。それなりの量の数式は出てくるが、本格的な統計の入門書に比べればかなり控え目なのだ。

なお、この本については、当ブログで「数学好きから統計好きに――『数学ガールの秘密ノート/やさしい統計』」という紹介記事を書いたので、興味がある方はそちらも参照されたい。

検定力・信頼区間について学ぶ

ダメな統計学』で繰り返し述べられている検定力信頼区間についてしっかりまとまっている統計の教科書はあまりない。そういった中で、以下の書籍は検定力や信頼区間を学ぶ際に非常に有用なものになっている。

この本では、冒頭で心理学研究において統計が適切に用いられていないことを説明している。その説明は『ダメな統計学』で扱われた統計の不適切な使用と軌を一にするところがある。そして、サブタイトルにある効果量・信頼区間・検定力について詳しく説明している。また、メタ分析についても少し扱われている。ちなみに、「心理」という限定がタイトルに付いているが、心理学以外の分野で統計を使う人にとっても十分使える。

検定力について、もっと気合を入れて学びたい場合は、以下の書籍もある。

こちらはもう少し難しい本だ。内容としては、さまざまな検定において検定力をどのようにして考えれば良いか、適切な検定力を持つ標本の大きさ(サンプルサイズ)をどうやって求めれば良いかと言うことが書かれている。ちなみにこの本では「検出力」という言葉が使われているが、「検定力」と同じ意味である。

統計モデルについて学ぶ

ダメな統計学』の第7章や第8章では、適切でない統計モデルを立てて失敗する例が論じられている。

統計モデルについてもっと学びたい場合は、まず以下の書籍を読むことをお勧めする。

この本は「生物科学」という限定がタイトルに出ているが、それ以外の分野の人にも共通する話が書かれている。

また、上記の書籍の他に、以下の定番書がある。

この本はダメなモデルを立てることに関して再三注意を述べており、その点でもダメな統計学に立ち向かう際の助けになるだろう。

なお、この本については、当ブログで「『データ解析のための統計モデリング入門』のレビュー」という紹介記事を書いたので、興味がある方はそちらも参照されたい。

良きプログラミング実践について学ぶ

『ダメな統計学』の第10章では、データや分析用のコードがしっかりと管理されないために失敗した事例が挙げられている。こうした失敗を防ぐためには、良きプログラミング実践について学ぶことが重要である。

統計分析で使われるR言語について、初心者が良きプログラミング実践を学べる書籍としては以下のものがある。

この本では、かなり早い段階から、統合開発環境 (IDE) とバージョン管理について紹介している。これらを使いこなせると、コードがばらばらになってしまうことなどが防ぐことができ、結果として統計分析が台無しにならなくなるだろう。

なお、この本については、当ブログで「Rのプログラミング言語的側面を学びたい人のための『みんなのR』」という紹介記事を書いたので、興味がある方はそちらも参照されたい。

みんなのR』の内容をしっかりと理解している人は、以下の書籍を読んでさらにR言語によるプログラミング能力を高めることもできる。

この『R言語徹底解説』は、Rの中級者に向けた書籍で、効率的な分析プログラムを書く際に大いに助けになると思う。

また、R言語によるプログラミングに限らず、どのプログラミング言語にも共通するような良きプログラミング実践について扱った書籍として、以下のものがある。

より良い教育方法について学ぶ

『ダメな統計学』の12.1節では、統計教育の改善について議論されている。そこでは、一方的な講義による授業では学生が概念を理解しにくいということが、物理教育の例で説明されている [3]

ここで説明されている物理教育の事例について、もっと詳しく書いてある文章が『ディープ・アクティブラーニング』という本の第5章に載っている。初修物理学教育の問題点について触れ、ピア・インストラクションの良さを述べている。

もちろん物理教育で言われていることが、統計教育にそのまま当てはまるとは限らない。とはいえ、これからの統計教育を考えるに当たり、参考になることはあるだろう。

脚注
  1. Pixabayよりivanacoi氏のパブリックドメイン画像を使用。 []
  2. Pixabayよりivanacoi氏のパブリックドメイン画像を使用。 []
  3. 統計教育の例でなく、物理教育の例が挙げられた理由は、統計教育における先行研究が少なく、物理教育の方がはっきりしているからだ。 []