『文系でもわかる統計分析』の説明で気になったところ

概要
『文系でもわかる統計分析』という書籍を読んだところ、「有意水準」や「質的変数」など、統計に関する説明で気になったところがあった。

はじめに

文系でもわかる統計分析』という本を読んだところ、統計に関する説明で気になるところが見られたので、備忘として記しておきたいと思う。

この本の書誌情報は以下の通りである。3人の著者はいずれも社会学者を称している。

この本は、基本的に須藤氏と古市氏との間の対話という形で、統計分析の手法が説明されていく。須藤氏が教師役、古市氏が生徒役である [1] 。また、分析にはSPSSを使っており、その使い方の説明もある。なお、もう1人の著者である本田氏は、コラムを書いて、この本に載せている。

有意確率

統計的仮説検定を行うとき、「有意確率」というものが求められる [2] 。『文系でもわかる統計分析』では、校内成績と自己有能感の間に関連はあるかということを検定する例の中で、「有意確率」に関する説明をしている。この説明を引用しよう。

何の確率かというと『校内成績と自己有能感の間に本当は関連がないのに、今回の分析結果が得られる確率』です

『文系でもわかる統計分析』 p.35

この説明はあまり望ましいものとは言えない。厳密に言うと、「校内成績と自己有能感の間に本当は関連がないと仮定したときに、今回の分析結果と同じか、それよりも極端な結果が得られる確率」になる。

量的変数・質的変数

量的変数・質的変数について、以下の説明があった。

人によっては量的変数を連続変数、質的変数を離散変数と呼ぶこともあります

『文系でもわかる統計分析』 p.88

この説明は望ましいものではない。離散変数である量的変数は普通に存在する。例えば、クラスの人数は量的変数であり、なおかつ離散変数である。人数は、1人、2人、3人……と離散的に増えていくもので、2.32人とか28.003人といったものはない。

ただ、引用部分は「人によっては……と呼ぶこともあります」(強調引用者)と書いてある。だから、そう呼んでいる人がいるだけで、著者らがそう見なしているとはかぎらない、と強弁できなくはない。とはいえ、そのように強弁するようなことがあったら、読者に対してあまりにも不親切だろう。

標準偏差

この本では、標準偏差について、以下のような説明がなされている。

個々の値が平均値から平均的にどれぐらい離れているかを表します

『文系でもわかる統計分析』 p.112

この説明はあながち間違いではないと思うが、この説明から想像されるのは標準偏差より、むしろ平均偏差の方だろう。

OLS

回帰分析を行うときに用いられる手法として最小二乗法というものがある。この最小二乗法は、英語で ordinary least squares というので、その頭文字をとって OLS ということがある。

ここで気を付けたいのが、OLS は回帰分析を行うときに用いられる手法の1つにすぎないということだ。OLS を用いない回帰分析も当然存在する。

しかしながら、『文系でもわかる統計分析』 では、「回帰分析=OLS」と読める説明があった。

回帰分析は、一般的な最小2乗法を使っているので、英語の頭文字をとって OLS ともいいます

『文系でもわかる統計分析』 pp.132-133

さらに、この説明のあとには、「回帰分析の別名が OLS ですね」――「そうです」という問答がなされている。なので、これらを見れば、読者は回帰分析とOLSはまったく同じものだと思ってしまうだろう。

先ほど示したように、OLS は回帰分析を行うときに用いられる手法の1つにすぎないので、上記の引用部分は適切な書き方であるとは言えない。

脚注
  1. この本の対話の中で、古市氏は統計のことをほとんどわからないように描かれている。氏の経歴を見ると、この本が出た2012年には大学院にもう5年もいることになるはずである。自身が計量的な分析を行わないにしても、それほど長く大学院にいるのに統計がわからないというのは、いかがなものかと思われる。もちろん、対話形式を採用した以上、誰かが統計がわからない素人の役を務めないかぎり、話が回らないという側面もあるだろう。古市氏はあえてわからないふりをしているのだろうか。 []
  2. いわゆるp 値と同じことである。 []