ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法 ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。
R言語のことを「統計のリンガフランカ」と表現する例 R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。
R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする 1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。
R における加算代入演算子など R言語には、加算代入演算子・減算代入演算子・乗算代入演算子・除算代入演算子が用意されていない。しかし、roperator パッケージや inplace パッケージを使うことでこれらの演算子を使うことができる。
Rによるツイート分析(1):指定したTwitterアカウントのツイートをリツイート数が多い順に並べる rtweet パッケージを用いてTwitter のツイートを取得した上で、リツイート数が多い順にツイートを並べ替える方法についての説明。いいねが多い順に並べ替える方法についても。
統計検定の受験体験記へのリンク集——どんな参考書で統計を勉強しているか 統計検定1級・準1級・2級のウェブ上の受験体験記へのリンク集。合わせて、1級・準1級・2級の対策にどのような参考書等がよく使われているかを紹介。
Rのバージョン3.6.0がリリース 統計処理言語の R のバージョン3.6.0が、2019年4月26日に公開された。この新リリースでは、離散一様分布に従う乱数の生成手法が変更されたり、文字列を表現式 (expression) に変換する新しい関数が導入されたりした。
高校学習指導要領解説の数学編の箱ひげ図付きの散布図 2018年7月に出された『高等学校学習指導要領解説 数学編 理数編』には、散布図の脇に箱ひげ図が組み合わされた図が載っている。この図は、おそらくアヤメのデータセットをもとに作ったものであり、R言語で簡単に再現できる。
とりあえずビール、とりあえず分散分析 調べたい内容に適した分析手法について深く考えず、「とりあえず分散分析」のように分析手法をあらかじめしぼりこむことはよろしくない。もっと適した分析手法がある可能性があるためである。
Rの geosphere パッケージ(3):ある地点から一定の方位・距離にある地点を求める Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。
Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。
Rによるデータクリーニング実践――政府統計からのグラフ作成を例として データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。
R言語の上級者になりたければ『R言語徹底解説』を読もう 『R言語徹底解説』にはプログラミング言語としてのR言語の仕組みが詳しく書かれており、効率的なプログラムを作る方法など、上級者になるために必要なことを学ぶ助けになる。
2017年の統計関係のアドベントカレンダー 2017年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。