オンラインで無料で読める統計書22冊

概要
オンラインで無料で読める統計書を紹介。入門書の他、より高度な内容の書籍も。

はじめに

今回は、ウェブを通じて無料で読むことができる統計に関する書籍を紹介したい。英語で書かれた本が多いが、日本語で書かれた本も若干ある。

2016年8月15日追記:ここに紹介している22冊とは別に、オンラインで無料で読める統計書を追加で32冊紹介する記事を書いたので、そちらも参照されたい。

入門書

まず、統計の初学者のために書かれた入門書を紹介したいと思う。

  1. 福井正康 (2002). 『基礎からの統計学』
    • 基礎から扱っている統計の入門書である。
    • 統計を扱う際に必要となる場合の数、確率などについて詳しく説明している。
    • 理解を助けるための演習問題とその解答がついている。
    • 統計処理用のソフトとしてはExcelを使っている。
    • 同じサイトに社会科学系の学生向けの数学の教科書もある。
  2. 小波秀雄 (2013). 『統計学入門』
    • 基礎から扱っている統計の入門書。内容としては、記述統計、確率、確率分布、簡単な推定・検定、相関と線形回帰などがある。
    • 確率や確率分布などの理論的な話が占める分量が多いので、分量のわりには、具体的な統計手法はあんまり載っていない。もちろん理論を把握するのも大事なので、それがダメというわけではない。
    • 理解を助けるための問題が若干載っている。
  3. Illowsky, B., and Dean, S. (2012). Collaborative Statistics.
    • 統計の入門書。
    • かなり易しく書かれている。英語としても平易なので、初学者にはおすすめ。
    • 入門で扱うべき内容はすべて載っていると言っても過言ではない。分量は多いが、その分、内容も豊富だ。
    • 練習問題も豊富で、しっかりやればかなりの力がつくと思う。
  4. Diez, D., Barr, C., and Çetinkaya-Rundel, M. (2012). OpenIntro Statistics (2nd Edition).
    • 入門から始まり、かなり高度な話題まで載っている。
    • 易しくはない。他の入門書に比べると、かなり難しい部類に入るだろう。
  5. Downey, A. B. (2011). Think Stats: Probability and Statistics for Programmers.
    • 統計の入門書。
    • 基本的にPythonを使って統計処理を行う。「プログラマーのための」と銘打たれているだけあってプログラミングの思考ができる人が読むと分かりやすいと思う。
    • 扱われている内容としては、統計的考え方、分布、確率、仮説検定、推定、相関の分析などがある。他の教科書に比べると、分布について記述がやや細かい。
    • 小咄的な事例が面白い。
  6. Butler, C. (1985). Statistics in Linguistics. Oxford: Basil Blackwell.
    • 言語学者向けの統計の入門書。基礎から扱っている。
    • 掲載されている言語学の話はそんなにややこしいことは書いていないので、言語学を知らない人が統計の勉強に使うのにも使えなくはない。
    • 記述統計についてはあまり書かれていない。どちらかと言えば、基礎的な仮説検定の話が多い。とは言っても、ANOVA(分散分析)のような複雑なことは扱っていない。あとは、推定と相関についても少しだけだが述べてある。
  7. Yakir, B. (2011). Introduction to Statistical Thinking.
    • 統計の入門書で、Rという統計処理ソフトを使って説明している。
    • 記述統計から、初歩的な仮説検定、線形回帰までを扱う。
    • 説明の中で数式は皆無というわけではないが、比較的少ない。あくまでもRを動かして統計の雰囲気を感じることを重視しているようだ。
  8. Shafer, D., and Zhang, Z. (2013). Introductory Statistics.
    • 記述統計から、確率分布の話に進み、簡単な推定・検定を扱うというオーソドックスな入門書。
  9. Navarro, D. (2013). Learning Statistics with R.
    • 心理学を学ぶ人向けに書かれた統計書。

(やや)高度な教科書

上に掲げたような入門書の内容を理解した後に、さらに統計について勉強したいという人向けの教科書を紹介する。

  1. Lavine, M. (2013). Introduction to Statistical Thought.
    • Rを使って(数理)統計学の考え方を学ぶことができる教科書。
    • 確率や統計モデルなどに関して、普通の入門書では感覚的に説明されているようなことが、より抽象的で厳密に説明されている。
    • 数式が多いため、数式が苦手な人にとっては読みづらいかもしれない。とは言え、数式だけでなく、Rを使ったシミュレーションなどの例もあるので、数式の苦手な人はRを実際に動かしながら内容を理解していくと良いだろう。
  2. Faraway, J. J. (2002). Practical Regression and Anova using R.
    • Rを用いた線形モデルの入門書。
    • 分散分析や回帰などが扱われている。
    • 仮説検定の基礎など、統計学の入門で習うようなことはあらかじめ知っておく必要がある。
  3. Hyndman, R. J. and Athanasopoulos, G. Forecasting: Principles and Practice.
    • 統計を用いた予測についての教科書。回帰などの話が書かれている。
    • 統計的な計算はRを用いて行っている。
  4. Grinstead, C., and Snell, J. L. (1997). Introduction to Probability. American Mathematical Society.
    • 統計の教科書ではなく、確率の教科書。統計を学ぶ際には、どこかで確率を勉強する必要が出てくるので、必要ならば読んでみても良いかもしれない。
    • 内容としては、離散型確率分布、連続型確率分布、組み合わせ、条件付き確率、大数の法則、中心極限定理、マルコフ連鎖、ランダムウォークなどが扱われている。
    • 分厚い。練習問題も多数。
    • 数学がちゃんと分かっていないと、読んでいてつらくなると思われる。
  5. Downey, A. B. (2012). Think Bayes: Bayesian Statistics Made Simple. Needham, MA: Green Tea Press.
    • ベイズ統計に関する書籍。

機械学習・データマイニングに関する書籍

以下に掲げる教科書はいずれもかなり難しい。「近頃はやりの『ビッグデータ』について勉強してみたいな」と軽く思っている人には向かないだろう。

  1. Hastie, T., Tibshirani, R., and Friedman, J. (2008). Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd Edition). New York: Springer.
    • 統計的学習、データマイニングに関する書籍。
  2. Barber, D. (2012). Bayesian Reasoning and Machine Learning. Cambridge: Cambridge University Press.
    • 確率モデル、ベイズ推論、機械学習の本。
  3. MacKay, D. (2003). Information Theory, Pattern Recognition and Neural Networks. Cambridge: Cambridge University Press.
    • 情報理論、パターン認識、ニューラルネットワークに関する本。
  4. Big Data.
    • その名のとおり、ビッグデータに関する専門誌。

Rに関する書籍

統計処理の分野で広く使われているRというプログラミング言語がある。Rの総本山とも言うべき、CRANにはThe R Manualsというページがあり、Rのマニュアルや入門書が置かれている。Rに興味のある人はこのThe R Manualsというページも見てみると良いだろう。

  1. Burns, P. (2011). The R Inferno.
    • Rのプログラミング言語としての特質について色々書いてある。
    • どちらかと言えば、Rについて詳しく知っている人向けの本である。

その他

以下に紹介する本の他に、「統計科学のための電子図書システム」というウェブサイトに様々な統計書がある。このサイトでは絶版となった日本語の統計書が無料でオンラインで提供されている。ただし、ほとんどがかなり古い本である。

  1. 国友直人・山本拓監修 (2012). 『21世紀の統計科学 増補HP版』(全3巻)
    • 『社会・経済の統計科学』『自然・生物・健康の統計科学』『数理・計算の統計科学』の3冊を配付。
    • 様々な学問分野で統計がどのように活かされているかが書かれている。
    • 難易度は高め。
    • 第I巻の『社会・経済の統計科学』には人口統計の話や、政府がどう統計をとっているのかという政策的な話、金融における統計の話が載っている。生命表やMCMCの話題もある。
    • 第II巻の『自然・生物・健康の統計科学』は、生命科学における統計の利用についての記述が多い。工学の話も載っている。生存時間、極値統計、時空間統計解析などの具体的な手法の紹介もある。
    • 第III巻の『数理・計算の統計科学』には具体的な分析事例の紹介は少なく、様々な統計手法の紹介が多い。EMアルゴリズム、ブートストラップ、確率微分方程式の母数推定などが掲載されている。
  2. 『統計数理』
    • 統計数理研究所が年に2回出している雑誌。
    • 各号には特集テーマが設定されており、そのテーマに関する既存手法や新知見の紹介が行われている。
    • 例えば、2010年に出た58巻では第1号が「日本人の国民性調査研究―平成期の20年―」、第2号が「統計的機械学習」という特集になっている。
    • 自分の好きなテーマを見つけて読んでみると面白いかもしれない。
  3. Vallentin, M. (2012). Probability and Statistics Cookbook.
    • 確率・統計に関する公式集
オンラインで提供されている電子書籍は印刷しなくても読むことができる。
オンラインで提供されている電子書籍は印刷しなくても読むことができる [1]
脚注
  1. Pixabay より haderer17 氏のパブリックドメインの画像を使用。なおこの画像は2016年8月14日に追加されたものである。 []