統計に関する記事

このカテゴリについて
統計について。

2017年

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

DeNA に対する第三者委員会の調査報告書での信頼区間の説明

DeNA に対する第三者委員会の調査報告書でなされていた信頼区間に関する説明がすこしあやういように思われたので、それについて簡単にコメントを記す。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

『Rで学ぶ日本語テキストマイニング』の紹介

R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。

『Rによるやさしいテキストマイニング』の紹介

Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。

英語・フランス語・ドイツ語で「擬似乱数生成器」は何と言うか

「擬似乱数生成器」に対応する訳語を英語・フランス語・ドイツ語のそれぞれについて紹介する。

主要な統計解析ソフトの擬似乱数生成アルゴリズム

SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。

日本で統計やデータサイエンスを学びたい場合、どんな大学に進学すれば良いか

日本には統計やデータサイエンスを中核にした学部・学科はほとんどないので、それ以外の学部・学科で統計やデータサイエンスを専門とする教員がいるところを探すのが無難だと思われる。

「うわっ…私の検定力、低すぎ…?」

統計的仮説検定における検定力の低さの問題を論じたネタ画像。

ダメな統計学を防ぐための書籍11冊

科学における統計の誤用を扱った『ダメな統計学――悲惨なほど完全なる手引書』を読んだ後に、実際に統計の誤用を防ぐために読むと良い本について紹介する。

『ダメな統計学――悲惨なほど完全なる手引書』の翻訳出版

科学における統計の誤用について説明した『ダメな統計学――悲惨なほど完全なる手引書』という本の日本語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

なぜ“tidy data”を「整然データ」と訳したのか

“tidy data”に対する日本語訳として「整然データ」を当てて、「きちんとしたデータ」などの他の訳語を当てなかった理由についての説明。

整然データとは何か

整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。

2016年

2016年に読んで勉強になった統計書五選

2016年に私が読んだ統計書のうち、勉強になったと思った統計書を5冊、つれづれなるままに紹介。

2016年の統計関係のアドベントカレンダー

2016年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、統計、R、機械学習に関わるものを紹介する。

Rを使って素数な日付を探す

「2017年12月19日」を20171219にするなど、年月日をまとめて1つの整数にしたときに、その整数が素数となるような日付を探す方法について、プログラミング言語のRを使った事例を通じて説明する。

大規模社会調査JGSSが回収率を上げるために取った方法

大規模社会調査のJGSSでは、謝礼の半分を前渡ししたり、依頼状の宛名を手書きにしたりするなどの方法で回収率を上げようとした。

統計の力で因果を見つけ出す:『岩波データサイエンス Vol. 3』のレビュー

「因果推論」を特集している『岩波データサイエンス Vol. 3』の紹介。データから因果関係を見つけ出したいときに役立つ内容が載っている。

言葉にだってナンプレにだってデータの科学がある:『岩波データサイエンス Vol. 2』のレビュー

「統計的自然言語処理」と「ナンプレと魔方陣」を特集している『岩波データサイエンス Vol. 2』の紹介。
←新しい記事へ古い記事へ→