統計に関する記事

このカテゴリについて
統計について。

2017年

日本で統計やデータサイエンスを学びたい場合、どんな大学に進学すれば良いか

日本には統計やデータサイエンスを中核にした学部・学科はほとんどないので、それ以外の学部・学科で統計やデータサイエンスを専門とする教員がいるところを探すのが無難だと思われる。

「うわっ…私の検定力、低すぎ…?」

統計的仮説検定における検定力の低さの問題を論じたネタ画像。

ダメな統計学を防ぐための書籍11冊

科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良い本について紹介する。

『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版

科学における統計の誤用について説明した『ダメな統計学――悲惨なほど完全なる手引書』という本の日本語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

なぜ“tidy data”を「整然データ」と訳したのか

“tidy data”に対する日本語訳として「整然データ」を当てて、「きちんとしたデータ」などの他の訳語を当てなかった理由についての説明。

整然データとは何か

整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。

2016年

2016年に読んで勉強になった統計書五選

2016年に私が読んだ統計書のうち、勉強になったと思った統計書を5冊、つれづれなるままに紹介。

2016年の統計関係のアドベントカレンダー

2016年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、統計、R、機械学習に関わるものを紹介する。

Rを使って素数な日付を探す

「2017年12月19日」を20171219にするなど、年月日をまとめて1つの整数にしたときに、その整数が素数となるような日付を探す方法について、プログラミング言語のRを使った事例を通じて説明する。

大規模社会調査JGSSが回収率を上げるために取った方法

大規模社会調査のJGSSでは、謝礼の半分を前渡ししたり、依頼状の宛名を手書きにしたりするなどの方法で回収率を上げようとした。

統計の力で因果を見つけ出す:『岩波データサイエンス Vol. 3』のレビュー

「因果推論」を特集している『岩波データサイエンス Vol. 3』の紹介。データから因果関係を見つけ出したいときに役立つ内容が載っている。

言葉にだってナンプレにだってデータの科学がある:『岩波データサイエンス Vol. 2』のレビュー

「統計的自然言語処理」と「ナンプレと魔方陣」を特集している『岩波データサイエンス Vol. 2』の紹介。

数学好きから統計好きに――『数学ガールの秘密ノート/やさしい統計』

『数学ガールの秘密ノート/やさしい統計』という本の紹介。この本は中・高レベルの簡単な統計を中心に扱ったもので、数学好きの人に向いている。

ggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える

統計解析ソフトRにおけるグラフ作成用ライブラリ ggplot2 で作った複数のグラフを格子状に並べて1枚にするには、gridExtra ライブラリの grid.arrange という函数が使える。

RにおけるNAが関わる演算

Rにおいて、NAが関わる演算は基本的にNAを返すが、FALSEとNAの論理積がFALSEとなるなどの事例においてはNA以外のものが返ることがある。

オンラインで無料で読める統計書プラス32冊

オンラインで無料で読める統計書を紹介。入門書から、高度な内容の書籍まで。

何語の文字列かを判定するためのRパッケージ

統計処理ソフト R の franc パッケージを使うと、どんな言葉の文字列かを判定することができる。

統計検定準1級を取るための勉強法

統計検定準1級を取るための勉強法として、対策に使える参考書などを紹介する。

R の ave 函数

Rにおける ave 函数の使用法についての説明。この函数は、グループ分けした上で、何か計算をするときに有用である。ただし dplyr パッケージの方が同様のことができる上、分かりやすく書ける。
古い記事へ→