はじめに
このたび、私の翻訳した『ダメな統計学――悲惨なほど完全なる手引書』という本が勁草書房から出版されることになった。2017年1月27日ごろから書店などで手に入るようになる予定である。
- アレックス・ラインハート〔著〕・西原史暁〔訳〕.(2017).『ダメな統計学――悲惨なほど完全なる手引書』東京:勁草書房.
- 訳書版元サイトでの紹介:ダメな統計学――悲惨なほど完全なる手引書|勁草書房
- 訳書版元サイトでの紹介その2(けいそうビブリオフィル):訳書の「はじめに」を閲覧可能 [1]
- 原書:Reinhart, A. (2015). Statistics Done Wrong: The Woefully Complete Guide. San Francisco: No Starch Press.
- 原書版元サイトでの紹介:Statistics Done Wrong: The Woefully Complete Guide | No Starch Press
この本は、科学の世界での統計の誤用について説明した本である。科学にたずさわる人の多くにとって、きっと役立つ1冊だと思う。ご興味がある方は、ぜひご一読いただきたい。
ちなみに、統計に関する前提知識は、基本的に必要ない。統計に関する概念は、この本の中で逐一説明してあるので、大丈夫だ。
どんな本か
この本は、端的に言えば、科学における統計の誤用について説明した書籍である。
現代の科学研究は、統計に支えられているところが非常に多い。科学研究者は、自分の仮説を検証するために、統計を利用することが多いのだ。しかし、科学者は統計を適切に使っているとはかぎらない。むしろ、しばしば統計を誤用している。つまり、「ダメな統計学」が科学研究のあちこちで見られるのだ。
こうした科学における統計の誤用にどのようなものがあるか、どのようにして誤用を防げば良いのか――といった問題に答えているのが、今回翻訳した『ダメな統計学――悲惨なほど完全なる手引書』である。
ウェブ版と何が違うのか
ここで、よくある質問に答えておきたい。私のウェブサイトに「ダメな統計学」という文章が公開されている [2] が、そのウェブ版の「ダメな統計学」と、今回出版する『ダメな統計学――悲惨なほど完全なる手引書』とは何が違うかという質問である。
端的に言えば、ウェブ版に比べて、今回新たに出版されるものは、内容が大幅に増補されている。ウェブ版は日本語のPDFでは90ページに満たない小冊子だったのだが、書籍化にあたって200ページ近くになった。また、ウェブ版に比べて、今回の書籍化で、扱われる事例がさらに豊富になり、さらに説明が深くなっている。
だから、ウェブ版を読んだことがある人でも、今度出版されるものを読んで新たに得ることはあると思う。また、日本語訳についても、ウェブ版に比べて、今回の書籍の翻訳の方が洗練されたものにしたつもりだ。文章としては、前に比べてかなり読みやすくなったと思う。
各章の内容
この本には、科学における統計の問題についての概説を記した「はじめに」と、12の章がある。
「はじめに」は、科学における統計の誤用について大まかな説明がなされ、それがいかに問題であるかということが説明される。また、この本がどのような見地からこの問題に取り組むかと言うことが記されている。本を読み始めるときに、「はじめに」を飛ばしてしまう人も少なくないだろうが、この本のエッセンスがつまっている重要な部分なので、ぜひ「はじめに」を読むと良いと思う。
なお、「はじめに」はけいそうビブリオフィルの該当ページで読むことができる [3] 。
それ以降の各章の内容は以下の通りである。
- 第1章:統計的有意性入門
- 統計でよく使われる p 値とは何か、そしてその問題点は何かということについて。信頼区間を p 値の代わりに用いるべきことについて。
- 第2章:検定力と検定力の足りない統計
- 検定力という概念を知り、これを計算することが重要であることについて。信頼区間を用いるべきことについて。
- 第3章:擬似反復:データを賢く選べ
- 擬似反復が引き起こす問題について。
- 第4章:p 値と基準率の誤り
- 偽陽性と多重検定の問題について。
- 第5章:有意性に関する間違った判断
- 有意であるとされたグループとそうでないとされたグループの間に有意差があるとは限らないことなどについて。エラーバーの解釈の誤りについて。
- 第6章:データの二度づけ
- データを都合良く使ってしまうことについて。探索的研究がもたらす問題、平均への回帰などについて。
- 第7章:連続性の誤り
- 連続型のデータを離散的に扱ってしまうことについて。
- 第8章:モデルの乱用
- 回帰分析における統計の誤用について。シンプソンのパラドックスについて。
- 第9章:研究者の自由:好ましい雰囲気?
- 研究者が気ままに統計処理を行うことによって引き起こされる問題について。
- 第10章:誰もが間違える
- 研究者が統計の処理を誤りやすいこと、どうすれば誤りを防げるかについて。
- 第11章:データを隠すこと
- データを適切に公開しないことによる問題について。
- 第12章:何ができるだろうか
- 科学研究において統計の誤用が多い状況を改善する方法について。具体的には、統計教育を充実させること、科学に関する出版を改革すること、そして読者がすべきことについて。
どんな人が読むべきか
この本は、以下の人たちに特におすすめしたいと考えている。
- 科学研究にたずさわっている人(研究者など)
- 科学研究にこころざそうとしている人(大学生など)
- 医療にたずさわっている人(医者など)
- 科学研究以外の業務で統計を使っている人(データ分析者など)
科学研究にたずさわっている人
今まで見てきたように、『ダメな統計学――悲惨なほど完全なる手引書』には、科学研究における統計のさまざまな誤用が説明されている。こうした誤用の説明は、第一義的には科学研究にたずさわっている人に役立つものだと私は考えている。
研究者の中には、もしかしたら、自分は適切に統計を用いているから、統計の誤用と関係ないと考える研究者もいるかもしれない。あるいは、統計の誤用というものは、ごく一部のうっかりした研究者だけが犯すもので、自分には関係ないことだと考える研究者もいるかもしれない。だが、実際のところ、この本で何度も触れられているように、多くの研究者が統計の誤用を犯している。例えば、この本の76ページでは、多くの心理学者や医学研究者が標準誤差・標準偏差・信頼区間という相異なる概念を混同していることが述べられている。
だから、誤用は無関係だと考えずに、科学研究にたずさわる人には、ぜひ自分のこととして読んでいただければと思う [4] 。
また、自分自身の研究においては統計を使わない研究者にもこの本は有益だと思う。と言うのも、自分自身が統計を使わなかったとしても、同じ分野の研究者が論文で統計を使っている場合、それを適切に読み取れるようにならなくてはならないからだ。
例えば、インタビューを使って定性的に部活動の指導を研究をしている教育社会学者がいたとしよう。この研究者がインタビューをする際にはあまり統計が必要とされない。しかし、教育社会学者の中には、統計的手法を多用する人もいて、そういう人が部活動の指導について統計的に調べて論文をまとめるということもあるかもしれない。そうした論文を読み解くには、統計の知識が必要になる。自分が統計を使わなくても、同じテーマを扱う他の人の論文を読むときには、統計を理解していないといけないのだ。
科学研究にこころざそうとしている人
これから科学研究に関わろうとしている人、具体的には大学生や大学院生などにも、この本をおすすめしたい。実際に科学研究にたずさわる前に、どのようなところに統計の落とし穴があるかを知っておくのは有益だと思われるからだ。
英語の原著では、実際に科学研究にたずさわった経験がないと分かりにくいところがいくつかあった。そのため、これから科学研究に関わろうとしている人にとっては、想像しにくいところがあった。
日本語訳するときには、訳注を適宜加えることによって、科学研究にたずさわった経験がとぼしい人でも理解しやすくなるように努めた。
例えば、「査読」という言葉に訳注を加えた。査読というのは、学術誌に論文を載せて良いか専門家が確認するプロセスのことで、現に研究にたずさわっている人ならばみな知っているようなことである。しかし、大学に入ったばかりの学生で、学術誌に論文を投稿経験がない人にとっては、この査読というものは説明がなければ分からないだろう。だから、こうした人でも読めるように訳注で「査読」がどういうものか説明するようにした。
医療にたずさわる人
この本にはさまざまな分野における統計の誤用が載せられているのだが、中でも医療に関する例が比較的豊富である。例えば、乳ガンのスクリーニングの事例(4.1.2節)、細菌性髄膜炎においてペニシリンを投与する事例(8.3節)などが載っている。
医者などの医療関係者が、統計を誤って解釈すれば、適切でない治療をしてしまうおそれがある。例えば、本当は効果がある治療法なのに、医療関係者が統計の解釈を誤って効果がないと考えてしまったら、助かるはずの患者が助からなくなるかもしれない。これは社会にとって大きな損失だ。
例えば、この本の11.2.2節では、しっかりとした統計分析が行われなかったために、ある種のステロイド薬が早産になろうとしている女性を救うということが分からなかったということが書かれている。もっと早く適切な統計分析が行われれば、助かる人がもっといたかもしれない。もし、医療にたずさわる人で、この話に感じるところがあれば、ぜひ『ダメな統計学――悲惨なほど完全なる手引書』を読んでいただきたい。
科学研究以外の業務で統計を使っている人
この本は、基本的には科学研究における統計の誤用について扱うものであるが、ここで書かれている誤用は科学研究以外の業務で統計を使う場合でも起こりうることである。
マーケティングデータを分析する人であっても、この本で説明されているような誤用を犯すことはありうる。例えば、この本では、十分な数のデータがないために科学研究がうまくいかない例が書かれている。同様に、十分な数のマーケティングデータがないために、うまくいかないということもありうるのだ。
だから、科学研究以外の業務で統計を使っている人も、他山の石として読むことができると思う。
どう読むと良いか
本の読み方は、もとより読者の自由である。
ただ、訳者としては、この本は前から順に読んでいくことをおすすめする。この本は、各章が独立しているようで、あまり独立していない。つまり、前の章の内容を受けて、後ろの章が書かれている。このため、途中から読むことはせず、前から順に読んでいくのが良いと思う。
また、原著者も「序言」において「最初の章を飛ばしてしまう読者もいるだろうが、私の説明スタイルに慣れてもらうためにも、拾い読みだけでもしてほしい」と記している(p. viii)ことを付記しておきたい。
翻訳にはどのような特徴があるか
最後に、翻訳したときに、私が注意した点を記しておきたい。
基本的には、訳文がなるべく簡単になるように努めた。先にも少し触れたが、原著は科学研究にたずさわった経験がある程度ないと想像しにくいところがあるのだが、訳注を加えることによって、大学に入りたての学生でも理解できるようにした。
また、原著が出版された後に起きた変化についても訳注で触れ、読者がなるべく最新の状況に近づけるようにした。
というわけで、私の翻訳した『ダメな統計学――悲惨なほど完全なる手引書』が2017年1月27日ごろから発売されるので、興味がある方はぜひお読みいただきたい。
- この文、2016年1月26日追記。 [↩]
- 別に、このウェブ版をPDFにまとめたものが「『ダメな統計学』冊子PDFの公開」というページに載せてある。このPDFはウェブ版をまとめたもので、今回新たに出版されたものとは異なる。 [↩]
- この文、2017年1月26日追記。 [↩]
- なお、ここでいう「科学」は自然科学にかぎったものではない。社会科学や人文科学も含まれている。実際、この本には、米国での銃使用に関する統計の誤用といった社会調査に関する話題も載っている(4.1.4節)し、心理学におけるデータ共有の不全に関する話題も載っている(p.132)。 [↩]