2016年に読んで勉強になった統計書五選

概要
2016年に私が読んだ統計書のうち、勉強になったと思った統計書を5冊、つれづれなるままに紹介。

数学ガールの秘密ノート/やさしい統計

1冊目は、2016年に出た初心者向けの統計読み物について。

この本は、統計についてほとんど知らない人に向けて、中・高レベルの簡単な統計を説明した読み物である。この本については、以前このブログで紹介文を書いたことがある。

この本を読んで感心したのは、最後の章に向かって、うまく一歩一歩進む仕組みになっていることだ。この本の最後の章で扱われることになる仮説検定というものは、そもそも理解することが難しい概念なのだが、この本はうまく説明している。普通の統計の入門書が仮説検定に一気に進みがちなのに対し、この本はその前の助走区間をかなり長く取って、着実に最後までたどり着くようにしているのだと思う。

この本に書いてある内容自体は、自分にとっては前から知っているものであった。しかし、この本の説明の仕方が非常に勉強になった。自分が将来的に他の人に統計を説明するときに参考になるだろうと感じられた。

岩波データサイエンス Vol. 3

2冊目は、データサイエンスに関する情報を提供するためのムックの3巻目について。

この巻は「因果推論――実世界のデータから因果を読む」を特集している。この本についても、以前このブログで紹介文を書いたことがある。

この本は、因果推論についての基本的な考え方を見直す際に役に立った。短い記事で端的にまとめてあるのが良かったのだと思う。

個人的な感覚で言えば、最近はさまざまな分野で科学的証拠エビデンスを求める動きが出てきているような気がする。そして、因果推論の手法が科学的証拠エビデンスを出すのに役立つことを踏まえると、そろそろ因果推論が一般にもはやり出すのではないかと考えている。そんなとき、この本が役に立つことを期待している [1]

R言語徹底解説

次に、統計分析プログラムを書くときに役に立った参考書について。

統計分析で広く使われているプログラミング言語として、Rがある。『R言語徹底解説』は、Rでしっかりとした分析プログラムを書くときに非常に役立つ参考書である。

この本は、Rの言語仕様について詳しく説明しているだけでなく、Rで効率的な分析プログラムを書くための方法について記されている。Rの中級者が上級者になりたいという場合、この本はぜひ読むと良いと思う。ただ、Rの初心者には向かない。ある程度Rを使ったことがある人が、さらにRを使いこなしたい場合に読むべき本だ。

Rのプログラムはいいかげんに書いたとしても、意外とうまく動くものなのだが、それでは効率があまり上がらない。いいかげんに書くと、統計処理のパフォーマンスが悪くなったり、分析が自動化しにくくなったりするのだ。しかし、この本に書いてあることを踏まえてプログラムを書くと、そういったことが少なくなるはずだ。

この本が出てから、Rでプログラムを書くとき、私はかなりの頻度でこの本を参考にした。そして、そのことによって前に比べて効率的なプログラムを書けるようになったと思う。

実践としての統計学

新しく出たばかりの本でなく、やや古い本も1冊紹介しておきたい。

タイトルからすると統計分析の実践的手法を教えてくれる本のように見えるが、そうではない。むしろ、統計についての考え方や心構えについて語ってくれる本だ。

では、なぜ「実践」という言葉が付いているのだろうか。それは、統計学の教科書に載っている理論的なものでなく、実際に統計分析を行うときに必要な心構えについて語っているからだと思う。

例えば、回帰分析を実際の統計データに適用するときに、うまく適用できない事例などを挙げている。こうした教科書で習うことからこぼれおちたものを説明して本はあまりないので、読んで良かったと思う。

Statistics Done Wrong: The Woefully Complete Guide

最後に洋書を1冊紹介したいと思う。

この本は、科学研究において統計が適切に使われていないことについて説明した上で、適切な統計分析のためにはどのような点に注意すべきかを記したものである。この本については、以前このブログで紹介文を書いたことがある。

統計は、適切に使うことができれば、科学研究を大いに発展させることができる。しかし、現代の科学研究で統計分析が適切に使われていないことはあまりにも多い。統計に関する問題により、ほとんどすべての科学上の発見が誤っているかもしれないと考えている人すらいるのだ。

この本は、こうした統計と科学研究の間の不幸な状況について触れ、具体的にどのような点に注意すべきかについて論じている。今、科学研究にたずさわる人ならば、ぜひ読んでおくべき本だと思う。

ただし、この本は英語で書かれている上、口語的な表現やちょっとしたジョークも混じっているため、日本の読者には言語的な意味で理解しにくいところがあるかもしれない。そうした理解しにくいところを分かりやすくした和訳があれば、日本の読者にとっても有益であると思う。

というわけで、この Statistics Done Wrong: The Woefully Complete Guide を私の手で日本語に訳し、出版するはこびとなった。順調にいけば、2017年1月後半に和訳が出版される予定である。

原著の理解しにくい部分に訳注を付けるなど、なるべく読みやすいように仕上げたので、興味がある方は、ぜひ読んでほしい。発売が近づいたら、また詳しい告知記事を上げる予定。

脚注
  1. なお、この本は深いところまでは説明していないので、この本を読んだ知識だけで何か分析しようとするのは危険だと思う。 []