統計を勉強するときに数学に悩まされる人のための一冊

概要
統計の勉強を始めるときに数学でつまづくことがある。そういったときに『統計学のための数学教室』という本が役に立つ。

統計の前に数学を

統計を勉強しはじめたものの、統計が結局よく理解できなかったという人は少なくない。統計の勉強がうまくいかない理由にはさまざまなものがあるが、1つの大きな理由として、統計の教科書に載っている数式が分からないというものがある。数学についてよく知らないと、統計の教科書の数式に悩まされ、統計をしっかり理解できない。統計の考え方の多くの部分は、数学の言葉で書かれているので、数学が分からなければ、統計を理解することができないのだ。

私が前に統計を教えたときは、まず数学をしっかり勉強してもらうところから始めた。統計の入門書に書いてある数式を読むのに必要な数学の知識を身につけてもらったのである。実際そうすることで、統計についてしっかり理解してもらうことができたと思う。そのときは自作の小冊子をつかったのだが、何か統計の入門書を読むために必要な数学をまとめて勉強できる教科書があればそれを使いたいと考えていた。

今年(2015年)の秋に、統計の入門書を読むための数学の知識を身につけるためのちょうどよい数学の教科書が出た。それが『統計学のための数学教室』という本である。これは、初歩的な統計学の理解に必要な部分の数学をコンパクトにまとめた本である。

この本は、初歩的な統計学——平均を求めたり、相関係数を求めたり——を学ぶに当たって必要な数学の知識をまとめてある。高度な数学を扱っているわけではなく、中学校や高校の数学で習うような内容の数学だ。この本に書いてある内容をおさえれば、統計の入門書に書かれている数式を理解するのが難しくなくなるだろう。

統計で数学を避けるべきではない

統計学のための数学教室』の内容について紹介する前に、統計と数学の関係について簡単に紹介しておきたい。

数学についてよく分からない人は、数学を使わないで統計を勉強できないかと考えるかもしれない。実際、統計の入門書で、数式を使わないことをうりにしているものもある。統計に関するごく簡単な考え方なら、数式を使わずに言葉で長々と説明することもできるし、図などを使って直感的に理解することも不可能ではない。だから、統計について表面的に、浅く知りたいだけならそれでよいかもしれない。

だが、それでは、入門以上に進むのがかなりきつい。少し難しい内容の統計を学ぶ場合は、数式を使わずに説明するのがほとんどできなくなる。今日紹介する『統計学のための数学教室』でも、以下のように書かれている。

数学は、そして統計はやり方を知っているだけではやがて必ずわからなくなります。

『統計学のための数学教室』p.186(強調原著者)

また、統計ソフトが計算してくれるから、統計の数学的な背景を知らなくても統計ソフトの使い方だけ学べばよいと考える人がいるかもしれない。なるほど、これも1つの考え方ではある。だが、ソフト任せにしてまうと、結局自分が何をやっているか分からなくなってしまう。ソフトがやっていることが適切かどうかも判断できなくなってしまう。だから、本格的に統計を使いたいという人は、しっかりと背景を知るべきなのだ。『統計学のための数学教室』でも、以下のように書かれている。

統計は道具として便利なのでその使い方だけを覚えてしまおうという人が多いようですが、いろいろな統計量に対しての『理解』がないと、自分が何をやっているかがわからなくなって勉強が先に進まなくなります。

『統計学のための数学教室』p.158(強調原著者)

『統計学のための数学教室』

統計学のための数学教室』は、5つの章から成り立っている。章を追うごとに高度な内容のものになっていくので、内容を1章ごとに確実におさえていく必要がある

なお、この本は数学に関する説明が中心になっているが、その合間に統計ではこのように使うということも説明されている。数学と統計の間の橋渡しがしっかりなされていると言えよう。

各章の内容

第1章では、平均・割合・グラフが扱われる。この章の内容は、小学校でも習うような内容がほとんどだ。だが、小学校で習う内容だからといってあなどらないほうがよい。割合は、小学校の算数の中でもつまづきやすい分野だ。小学生のころに理解できず、そのまま大人になっても割合が分からないという人は少なくない。統計が理解できない人が、実は小学校で習うようなことでつまづいていたということも十分ありうるのだ。少しでも自分の知識があやしいと感じている人は、ここでしっかり学んでおくとよいだろう。

第2章では、統計を学ぶ際に避けては通れない「分散」という概念を理解するために必要な数学が扱われる。具体的には、平方根文字式の計算が扱われる。

第3章では、「相関係数」(あるデータと別のデータの関連の強さを示す値)という統計学上の概念の意味を知るために、二次関数二次方程式が扱われる。この章の内容は、それより前の章に比べて、かなり難しくなる。一歩一歩着実に把握していくようにしよう。

第4章では、確率数列総和(Σ記号)が扱われる。さまざまな内容があって章自体も長いが、順を追って見ていくことが大事だ。迷子になりそうになったら、一度戻って再度進むようにするとよいのではないだろうか。

第5章では、無限・極限積分が扱われる [1] 。これらは、統計で連続データを扱うときに必要な概念になる。ただ、この章ではこれらの概念についてそれほど詳しく説明しているわけではない。極限や積分は、本格的に教えようとするとものすごく長くなってしまうので、あえて簡単に済ませたのだと思う。統計の入門書を理解する分には、第5章で書いている程度の簡単な説明で何とかなるだろう。ただ、この本と統計の入門書を読み終わったあとに、さらに統計についての知識を深めたい人は、何か別の数学の本を読んで極限や積分について勉強しておいた方がよいだろう。

説明の厳密さ

なお、この本の数学に関する説明は必ずしも厳密でない部分もある。ただ、それは数学がよく分からない人に対する説明という点でしかたがないものだ。あまり厳密に議論しすぎると、数学に不慣れな人にとって、理解しにくいものになってしまう。このため、厳密さをある程度あきらめて、理解しやすくすることを優先したのだと思う。そして、統計の入門書を読む場合には、数学に関してさほど厳密さは求められない。だから、この本の数学に関する説明が厳密でないところは、問題にならない。

練習問題

この本に載っている練習問題は必ずやっておこう [2] 。自分で手を動かさずに、本を読むだけでいると、数学は身につかない。自分の手で練習問題を解いて、しっかりと知識を定着させよう。

数学を学んだ後に

統計学のための数学教室』を読み終わった後は、さっそく統計の入門書にとりかかろう。個人的には「統計学の初心者が入門として最初に読むべき一冊」という記事で書いたように『マンガでわかる統計学』という本がおすすめだが、別の入門書でもかまわない。自分が読みやすいものでよいのではないだろうか。

また、もっと本格的に統計を勉強したければ、『統計学のための数学教室』に書かれているものよりも高度な内容の数学についても勉強しておく必要がある。具体的には、微積分と線形代数を勉強しよう。そうすれば、難しい内容の統計の教科書も理解できるようになるだろう。

脚注
  1. 微分は扱われない。 []
  2. 本当はこの本に載っている練習問題だけでは足らず、もっと練習問題を解いた方がよいぐらいだ。 []