ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法 ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。
R言語のことを「統計のリンガフランカ」と表現する例 R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。
R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする 1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。
R における加算代入演算子など R言語には、加算代入演算子・減算代入演算子・乗算代入演算子・除算代入演算子が用意されていない。しかし、roperator パッケージや inplace パッケージを使うことでこれらの演算子を使うことができる。
Rによるツイート分析(1):指定したTwitterアカウントのツイートをリツイート数が多い順に並べる rtweet パッケージを用いてTwitter のツイートを取得した上で、リツイート数が多い順にツイートを並べ替える方法についての説明。いいねが多い順に並べ替える方法についても。
Rのバージョン3.6.0がリリース 統計処理言語の R のバージョン3.6.0が、2019年4月26日に公開された。この新リリースでは、離散一様分布に従う乱数の生成手法が変更されたり、文字列を表現式 (expression) に変換する新しい関数が導入されたりした。
Rの geosphere パッケージ(3):ある地点から一定の方位・距離にある地点を求める Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。
Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。
Rによるデータクリーニング実践――政府統計からのグラフ作成を例として データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。
R言語の上級者になりたければ『R言語徹底解説』を読もう 『R言語徹底解説』にはプログラミング言語としてのR言語の仕組みが詳しく書かれており、効率的なプログラムを作る方法など、上級者になるために必要なことを学ぶ助けになる。
2017年の統計関係のアドベントカレンダー 2017年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。
Rで文字列の先頭や末尾から決まった文字数だけ削る方法 R言語において、文字列の先頭2文字分だけ削ったり、末尾3文字分だけ削ったりしたい場合にどうすればよいかについて説明する。基本的には、部分文字列を取得する函数を使えばよい。
米国のトランプ大統領の謎の covfefe ツイートをRで再現する 統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。