文書の性質
『統計を始める前に』という教科書的文書を公開したいと思う。これは、以前、勉強会のために私が作成した文書の一部を切り貼りして作ったものである。以下から、PDFファイルとしてダウンロードが可能なので、必要な方はどうぞ。なお、強制ではないが、リンクを貼るときは、PDFに直接リンクするのではなく、このページにリンクしていただければ幸いである。何か追加情報があったときには、このページに書くつもりなので。
これは何を目的にした文書かと言うと、タイトルの通り、「統計を始める前に」一通り知っておきたい数学的知識などをまとめたものである。この文書を一通り読んだ上で、統計の勉強を始めるとはかどるはずである。
統計を始める前に、数学の勉強をしないといけないなんて面倒だと思う人もいるかもしれない。だが、私の経験から言うと、統計を始めようと思い立っていきなり統計の教科書を読もうとすると、かなりの人がすぐに挫折する。その理由は、統計の教科書を読む前の基礎知識(特に数学に関する)がぬけているからである。普段から全然運動していないのに、いきなりマラソンを走ろうと思って、いきなり初日から20kmぐらい走ろうとするのと同じである。言語研究者は、「文系」と言う人が多いので、数学の知識が中高レベルですらあやしい人が結構いる。その状態で、統計の教科書を読み始めるのはあまり意味がない。そこで、ちょっと数学の勉強をしておくと、後々役に立つ。
言語研究者向けの統計の勉強法は、前にこのブログでも簡単に書いたことがあるので、参照していただければ幸いである。
文書の内容
主な内容を以下に列挙する。
- 統計とは何か
- 言語研究と統計の関係
- 統計で良く用いられる数学記号
- 対数
- 総和
- 組み合わせ・確率
- 丸め(四捨五入など)
計算機で処理する必要があるところについては、Rの例を挙げた。なお、勉強会の時に作った文書の名残で、いくつか練習問題が入っているが、残念ながら解答例は作っていない。ご容赦願いたい。
注意
この文書は、これから統計を始めようかなと考えている言語研究者向けに書いたつもりだが、他の分野の人も全く役に立たないわけではないと思う。言語研究者向けの注意が色々とあるが、「そんなものなのか」と無視しながら読んでも多分話は通じるはずである。
また、私は数学の専門家でも統計の専門家でもないので、書いたことの正確さは保証できない。もし、ここがおかしいとか、ここがよく分からないということがあれば、この記事のコメント欄でコメントしていただければこちらとしても助かるので、よろしくお願いしたい。