統計分析に知識が必要であることを逆説的に示した記事

概要
統計分析に知識は必要ないと書いてある記事がひどいために、かえって統計分析に知識が必要であることを示しているように見える。

はじめに

専門知識は必要ない!現場担当者が扱えるクラウド型統計分析!」と豪語する記事がある。この記事は、専門知識がない人でも統計分析ができるということを伝えようとしているのだろう。

しかし、この記事に書かれている統計分析についての説明は相当めちゃくちゃなものである。おそらく、この記事を書いた人は統計分析がどういうものか分かっていないのだろう。この記事のずさんさを見ると、逆説的に統計分析に知識が必要であることが示されているようにしか思えない。

統計分析とは相関関係を明らかにする手法?

専門知識は必要ない!現場担当者が扱えるクラウド型統計分析!」という記事では、「統計分析とは」という主題に対して、「データ間の相関関係を数字で明らかにする分析手法」と記述している。

つまり、統計分析とは相関関係を明らかにする手法だと言いたいのだろう。しかし、これは大きな誤りだ。統計分析は、相関関係を明らかにする手法に限られたものではない。統計分析が扱う範囲はもっと広い。データを抽出する方法、データを分類する方法、データから予測する方法など、さまざまなものが統計分析で扱われる。

「統計分析とは」に「データ間の相関関係を数字で明らかにする分析手法」と答えるのは、「野球とは何か」という質問に「バットを振ること」と答えるようなものだ。確かに、野球にはバットを振ることが含まれているが、それだけでは野球の全体像を示しているとは言えないだろう。

統計分析でわかること?

さらに、くだんの記事では「統計分析でわかること」として、以下の3つのことを挙げている。

  1. データ同士の関係が必然かどうかがわかる
  2. 影響力を数値化できるためデータに重みが出る
  3. 同じ場所で処理できないデータ間の関連を明らかにできる

これらは、どれも「統計分析でわかること」と言えなくはないが、何だかピントがずれている感がある。

最初の「データ同士の関係が必然かどうかがわかる」というのは、あまり妥当でない。特に「必然」という言葉が「必ずそうなる」という意味だったら、これは大きな間違えだ。統計的な推測でできるのは、「そうなる可能性が高い」と結論づけることだけで、「必ずそうなる」とは言えないのだ。

ところで、この記事で紹介されている adelie という統計分析ツールの公式ウェブサイトの「統計分析が必要な理由」には、これと似たようなことが記されている。公式ウェブサイトでは、「成果と要素の関係が“たまたま”なのか“必然”なのかを判断することができる」 [1] と少し違った表現で書いてある。この表現もかなりきわどい表現だ。統計的な推測でわかるのは、「たまたまである可能性が高い」か「たまたまである可能性が低い」かである。これを丸めて「たまたま」と「必然」というのは勇み足の感がぬぐえない。

とは言え、adelie の公式ウェブサイトの記述は、「たまたま」と「必然」が対比されているので、まだ何を言いたいか分からなくもない。しかし、「専門知識は必要ない!現場担当者が扱えるクラウド型統計分析!」という記事では、この対比をさらに丸めてしまって、「必然かどうかがわかる」と言ってしまっているため、実際の統計分析のあり方とかなり異なったものになってしまっている。

2番目の「影響力を数値化できるためデータに重みが出る」というのは意味が通らない表現だ。「重みが出る」だと、データの重要さが増すという意味になるだろう。しかし、これでは前半の「影響力を数値化できるため」とつながらない。実際、adelie の公式ウェブサイトでは、「各要素の影響力を数値化できるため、重みづけができる」 [2] と書いてある。この記述のように「重みづけができる」というのならば意味は通る。

くだんの記事の著者は、adelie の制作者による説明をよく理解できないまま、記事を書いてしまったのではないかと思われる。説明を理解できなかったのは、著者の読解力に難点があるか、著者の統計に対する知識に難点があるか、その両方の難点を抱えているせいだろう。

まとめ

しっかりとした統計分析をしたければ、しっかりと勉強しよう。
しっかりとした統計分析をしたければ、しっかりと勉強しよう [3]

ここまで批判してきた記事は、野球でたとえるなら、「野球に練習は必要ない! しろうとでもできる野球!」と言っているようなものだ。あげくのはてに「野球とは?」と聞かれて「バットを振ること!」と答えているというありさまだ。バットを振ることしか考えていない野球チームがあるとしたら、そのチームは負け続けるだけだろう。これで野球ができるとはとうてい思えない。

結局のところ、くだんの記事は、統計の知識なしに統計を語ろうとしても失敗するだけということを示したようなものだ。逆説的に統計の知識の必要性を説いている反面教師のような記事であると言えよう。

実際の統計分析も、そんなに単純なものではない。統計分析を助けてくれるツールを使うことは重要だが、やはり分析に当たってはしっかりと知識を身につけてからでないと厳しいのだ。

学問に王道なし。しっかりとした統計分析をしたければ、しっかりと勉強しよう。

脚注
  1. 株式会社サイカ.(n.d.). 「統計分析が必要な理由」 []
  2. 株式会社サイカ.(n.d.). 「統計分析が必要な理由」 []
  3. Pixabayより、annazuc氏によるパブリックドメイン画像を使用。 []