統計に関する記事

このカテゴリについて
統計について。

2017年

データのクリーニングや組織化について深めたい人のために――『データリテラシー』

『データリテラシー』という書籍は、データ分析の経験がある程度ある人が、データのクリーニングや組織化について見直す際に有用である。

米国のトランプ大統領の謎の covfefe ツイートをRで再現する

統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。

「この春から統計を学びはじめたい!」という人のための書籍7冊(2017年4月版)

統計をあまりよく知らない人が、統計の勉強をはじめるときに役立つ書籍について。おすすめの書籍を7冊紹介。

CRAN にある R パッケージへのリンクとして選ぶべきURL

CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。

『文系でもわかる統計分析』の説明で気になったところ

『文系でもわかる統計分析』という書籍を読んだところ、「有意水準」や「質的変数」など、統計に関する説明で気になったところがあった。

統計の初心者のつまずきやすい点が分かる『統計的方法のしくみ』

『統計的方法のしくみ』という本は、統計の初心者のつまずきやすい点をうまく説明してくれる。統計の教科書と併用する副読本として利用すると効果的であろう。

都道府県名を1文字で表す試み

神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

DeNA に対する第三者委員会の調査報告書での信頼区間の説明

DeNA に対する第三者委員会の調査報告書でなされていた信頼区間に関する説明がすこしあやういように思われたので、それについて簡単にコメントを記す。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

『Rで学ぶ日本語テキストマイニング』の紹介

R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。

『Rによるやさしいテキストマイニング』の紹介

Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。

英語・フランス語・ドイツ語で「擬似乱数生成器」は何と言うか

「擬似乱数生成器」に対応する訳語を英語・フランス語・ドイツ語のそれぞれについて紹介する。

主要な統計解析ソフトの擬似乱数生成アルゴリズム

SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。

日本で統計やデータサイエンスを学びたい場合、どんな大学に進学すれば良いか

日本には統計やデータサイエンスを中核にした学部・学科はほとんどないので、それ以外の学部・学科で統計やデータサイエンスを専門とする教員がいるところを探すのが無難だと思われる。

「うわっ…私の検定力、低すぎ…?」

統計的仮説検定における検定力の低さの問題を論じたネタ画像。

ダメな統計学を防ぐための書籍11冊

科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良い本について紹介する。

『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版

科学における統計の誤用について説明した『ダメな統計学――悲惨なほど完全なる手引書』という本の日本語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

なぜ“tidy data”を「整然データ」と訳したのか

“tidy data”に対する日本語訳として「整然データ」を当てて、「きちんとしたデータ」などの他の訳語を当てなかった理由についての説明。
古い記事へ→