『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版 科学における統計の誤用について説明した『ダメな統計学――悲惨なほど完全なる手引書』という本の日本語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。
整然データとは何か 整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。
Rを使って素数な日付を探す 「2017年12月19日」を20171219にするなど、年月日をまとめて1つの整数にしたときに、その整数が素数となるような日付を探す方法について、プログラミング言語のRを使った事例を通じて説明する。
統計の力で因果を見つけ出す:『岩波データサイエンス Vol. 3』のレビュー 「因果推論」を特集している『岩波データサイエンス Vol. 3』の紹介。データから因果関係を見つけ出したいときに役立つ内容が載っている。
言葉にだってナンプレにだってデータの科学がある:『岩波データサイエンス Vol. 2』のレビュー 「統計的自然言語処理」と「ナンプレと魔方陣」を特集している『岩波データサイエンス Vol. 2』の紹介。
数学好きから統計好きに――『数学ガールの秘密ノート/やさしい統計』 『数学ガールの秘密ノート/やさしい統計』という本の紹介。この本は中・高レベルの簡単な統計を中心に扱ったもので、数学好きの人に向いている。
ggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える 統計解析ソフトRにおけるグラフ作成用ライブラリ ggplot2 で作った複数のグラフを格子状に並べて1枚にするには、gridExtra ライブラリの grid.arrange という函数が使える。
R の ave 函数 Rにおける ave 函数の使用法についての説明。この函数は、グループ分けした上で、何か計算をするときに有用である。ただし dplyr パッケージの方が同様のことができる上、分かりやすく書ける。