Colorless Green Ideas

統計に関する記事

このカテゴリについて

統計について。

2024年

竜・龍・辰が使われている地名地図

「竜」・「龍」・「辰」という漢字が使われている地名を日本地図上に表したものを紹介。この地図をR言語で作成する方法も紹介。

2023年

ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法

ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。

R言語のことを「統計のリンガフランカ」と表現する例

R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。

R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする

1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。

2022年

R における加算代入演算子など

R言語には、加算代入演算子・減算代入演算子・乗算代入演算子・除算代入演算子が用意されていない。しかし、roperator パッケージや inplace パッケージを使うことでこれらの演算子を使うことができる。

2020年

Rによるツイート分析(1)：指定したTwitterアカウントのツイートをリツイート数が多い順に並べる

rtweet パッケージを用いてTwitter のツイートを取得した上で、リツイート数が多い順にツイートを並べ替える方法についての説明。いいねが多い順に並べ替える方法についても。

統計検定の受験体験記へのリンク集——どんな参考書で統計を勉強しているか

統計検定1級・準1級・2級のウェブ上の受験体験記へのリンク集。合わせて、1級・準1級・2級の対策にどのような参考書等がよく使われているかを紹介。

2019年

テスト理論における正答率と通過率

正答率と通過率は同義語として用いられるのが普通である。ただし、通過率に正答率とは別の意味を持たせる場合もある。

Rのバージョン3.6.0がリリース

統計処理言語の R のバージョン3.6.0が、2019年4月26日に公開された。この新リリースでは、離散一様分布に従う乱数の生成手法が変更されたり、文字列を表現式 (expression) に変換する新しい関数が導入されたりした。

2018年

高校学習指導要領解説の数学編の箱ひげ図付きの散布図

2018年7月に出された『高等学校学習指導要領解説数学編理数編』には、散布図の脇に箱ひげ図が組み合わされた図が載っている。この図は、おそらくアヤメのデータセットをもとに作ったものであり、R言語で簡単に再現できる。

とりあえずビール、とりあえず分散分析

調べたい内容に適した分析手法について深く考えず、「とりあえず分散分析」のように分析手法をあらかじめしぼりこむことはよろしくない。もっと適した分析手法がある可能性があるためである。

Rの geosphere パッケージ(3)：ある地点から一定の方位・距離にある地点を求める

Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。

Rの geosphere パッケージ(2)：大圏航路を描く

Rの geosphere パッケージを用いて大圏航路を求める方法の説明、および大圏航路の図示。

Rの geosphere パッケージ(1)：2点間の距離と方位角を計算する

Rの geosphere パッケージの導入方法、地球上の2点間の距離・方位角の求め方の説明。

Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする

Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。

Rで重複している箇所を取り出す方法

R言語において、1つのIDに対して2つ以上のレコードが存在している場合、その重複している箇所をすべて取り出す方法を2つ説明する。

Rによるデータクリーニング実践――政府統計からのグラフ作成を例として

データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。

R言語の上級者になりたければ『R言語徹底解説』を読もう

『R言語徹底解説』にはプログラミング言語としてのR言語の仕組みが詳しく書かれており、効率的なプログラムを作る方法など、上級者になるために必要なことを学ぶ助けになる。

2017年

2017年の統計関係のアドベントカレンダー

2017年のアドベントカレンダー（クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画）で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。

fortunes パッケージでRに関する名言を楽しもう

Rの fortunes パッケージには、Rに関するさまざまな名言が収録されている。Rを起動するたびに、こうした名言を表示することも可能である。