数学好きから統計好きに――『数学ガールの秘密ノート/やさしい統計』

概要
『数学ガールの秘密ノート/やさしい統計』という本の紹介。この本は中・高レベルの簡単な統計を中心に扱ったもので、数学好きの人に向いている。

はじめに

結城浩氏から『数学ガールの秘密ノート/やさしい統計』という御著書を御恵贈いただいたので、この本がどういう本なのか紹介したいと思う。

この本は、数学に関して読み物の形で語る『数学ガールの秘密ノート』というシリーズの1冊だ。今回紹介する『数学ガールの秘密ノート/やさしい統計』は、数学の中でも、中学や高校の数学の授業で習うような簡単な統計について扱っている。

どんな人に向いているか

この本は、数学が好きで、統計についてあまり知らないような人に向いていると思う。この本では、統計のことを説明しつつ、数式と数式の間の面白い関係を示すなど、数学が好きな人にとって相性の良い内容が書かれているからだ。

ありふれた統計の入門書では、世の中に数学が苦手な人が多いことを踏まえて、数式のことをあまり扱わないようにしていることも少なくない。こうした配慮は、数学が苦手である人にとっては有効なのかもしれないが、数学が好きな人にとっては逆に興味を失うことにつながるかもしれない。数学の言葉に親しみを覚えている人ならば、数式で書いてくれた方が分かりやすいのだ。そういう意味で、数式なども丁寧に説明しているこの『数学ガールの秘密ノート/やさしい統計』は数学が好きな人には向いていると思う。

なお、数学が好きであれば、すごく得意である必要はない。この本で扱われている内容はそんなに高度なものではない。高校生ならば、学校の授業の数学がそこそこ分かっている [1] のならば、おそらくこの本の議論を追うことができるはずだ。中学生では少し厳しいかもしれないが、特に意欲があれば読めるといったところだろうか。

内容

この本が扱うのは、タイトルにあるとおり、統計だ。統計と言っても初歩的なものからかなり高度なものまであるが、この本が扱っているのは、比較的初歩的なものだ。多くの部分は、中学校や高校の数学の授業で扱われることになっている内容と重複する。

中学校や高校で教えるべき内容を定めた学習指導要領に基づいて考えれば、この本の各章の内容が相当する学年はおおむね以下のようになる [2]

ちなみに、中学校や高校の数学の授業で統計に関することが充実するようになったのは最近のことなので、今の大人でこの辺のことをしっかり勉強した人はあまりいない。だから、大人も、若い世代に負けないようにこの本を読むことがあっても良いと思う。

以下、この本の内容を章ごとに紹介していきたい。

第1章「グラフのトリック」

第1章「グラフのトリック」はグラフの描き方について扱っている。特に、グラフの描き方によっては、受ける印象がかなり変わってしまうということが書かれている。

例えば、折れ線グラフの描く範囲を変えることで、同じデータなのに、上昇しているようにも下降しているようにも見せることができるといったことが書かれている。

第2章「平らに均す平均」

第2章「平らに均す平均」は、そのタイトルにある平均を含め、最頻値中央値といったデータを代表するような値について紹介している。このほか、データの分布を図示する方法の1つであるヒストグラムも扱っている。そして、最後に、分散などのデータの散らばりを示す値について触れている。

この章の良いところは、データの代表値には様々なものがあり、状況によって適宜使い分ける必要があるということをしっかり説明していることだ。普通の統計の入門書にもこういったことは書かれているけれども、この本の方が丁寧に書かれている。例えば、2.2節では、代表値の1種として最大値も挙げられることが述べられている。最大値をもって代表値とする状況はなかなか思いつかないかもしれないが、この本では試験やスポーツ大会の例が挙げられている。例えば、走り幅跳びならば一番遠くまで飛んだ距離をその人の記録とするので、これは最大値をもって代表値としていることになる。こういった形の代表値の説明がこの本の良いところの1つだ。

第3章「偏差値の驚き」

第3章「偏差値の驚き」は、データの散らばりを示す量である分散についてさらに詳しく扱っている。そして、平均と分散から求められる偏差値を扱う。さらに、そこから平均からどれだけ外れているかという問題に至っている。この平均からどれだけ外れているか、そして外れていることによる驚きという問題が、第5章で扱われることになる仮説検定への伏線になっている。

この章からは、それまでの章に比べて、出てくる数式が増えてくる。ただ、この本は数式の意味や数式の変形方法についてかなり丁寧に説明しているので、あわてずに追っていけば、理解はそれほど難しくないと思う。

第4章「コインを10回投げたとき」

第4章「コインを10回投げたとき」は、コインを10回投げたときに表が出る回数の期待値や標準偏差がどうなるかという問題を扱っている。数学的なことを考えなくても、「コインを10回投げたら、表はおおよそ5回出るだろう」と何となく想像できるかもしれない。この素朴な想像について、じっくりと数式を追って見ていくというのがこの章の流れになる。

例によって、色々と数式が出てくるが、かなりゆっくりと丁寧に説明しているので、一つ一つ追っていけば理解はそれほど難しくないだろう。

第5章「投げたコインの正体は」

第5章「投げたコインの正体は」は、第4章で扱った期待値についてさらに詳しく扱った後、仮説検定という手法について紹介することになる。さらに、チェビシェフの不等式・大数の弱法則についても扱っている。

この章で扱われる内容は、今までのものと質的に変化している。第1章や第2章では、手元にあるデータをどう記述するのかという問題について論じた。これに対して、第5章で扱われる仮説検定では、手元にあるデータから何が推測できるかという問題を扱うことになる。

この質的な変化は意外と付いていくのが難しいので、注意が必要だ。そもそも仮説検定の論理は、誤解を招きやすく、難しい。この本でも、よくある誤解について登場人物に説明させているので、しっかりと見ていくことが重要だろう。

数学好きから統計好きになるために

先に、この本は数学好きの人に向いていると書いたが、第5章にある仮説検定の話は、数学好きの人がかえってつまずきやすい場所かもしれない。数学が好きな人ほど、逆説的に困難を感じるかもしれないのだ。

中学や高校で習う数学では、はっきりした答えが求められるものが少なくない。例えば、3x – 6 = 0 という方程式が与えられれば、そこから x = 2というはっきりした解が求められる。こういったことに魅力を感じて、数学好きになっている人も少なくないだろう。

だが、仮説検定はそこまではっきりした形で答えが出てくるわけではない。「こういう設定のもとでは仮説が棄却されるが、こういう設定のもとでは何とも言えない」といった曖昧な形の答えが出てくるのだ。これは、x = 2 といったはっきりした解とはかなり違ったおもむきのものになるので、困惑を覚える人もいるかもしれない。

第5章において、ヒロインの1人であるテトラちゃんが、仮説検定の解釈に関して以下のように述べている。

それは……おかしくありませんか。コインがフェアかどうかというのは二つに一つで、事実はどちらかですよね。それなのに、棄却されたりされなかったりするというのは、何だか変な感じがします

数学ガールの秘密ノート/やさしい統計』p.211

このテトラちゃんの発言は、数学好きの人の困惑を反映しているように思われる。しかし、この「変な感じ」だとされたことが、まさしく統計の論理なのだ。3x – 6 = 0 の解を求めるという問題と、仮説検定の問題とは違ったところがある。そして、違ったところに応じて違った方法で考えていくことが必要になるのだ。

やや大げさな言い方かもしれないが、どんな問題でも解決できる魔法の杖のような考え方は存在しないのだ。古代ギリシャの哲学者アリストテレスは、自分の倫理学の議論を始めるに当たって、次のように述べている。

われわれの対象の素材に相応した程度の明確な論述がなされるならば、それでもって充分としなければならないであろう。というのは、いかなるものを素材とする論述ロゴスにおいても同じような仕方で厳密を求めるということの不可であるのは、もろもろの工作品の場合におけると同様だからである。

『ニコマコス倫理学』第1巻第3章――岩波文庫『アリストテレス ニコマコス倫理学(上)』(高田三郎訳)p.21 による。

このアリストテレスの言葉にもあるように、いつも同じような考え方でやるのは難しいのだ。素材に応じて、考え方を変えることがあっても別にかまわない。むしろ、そこを割り切れるかが重要になる。

確かに困惑はあるかもしれない。だが、頑張ってそれを乗り越えてみよう。そうすれば、単なる数学好きから統計好きになることもできるだろう。

脚注
  1. もっとも、学校の授業がそこそこ分かるレベルの人が、高校生に占める割合はそんなに高くないのかもしれないが。 []
  2. 第1章の内容については、学習指導要領に相当する部分が載っていない。一応、この章で扱われるグラフについては、小学校の算数の授業で学ぶことになっているのだが、小学校の授業ではこの章の説明ほど詳しく扱われることはないだろう。 []
  3. ただし、分散については、普通は高校1年生で習うことになる数学Iの「データの分析」で勉強することになる。 []