Colorless Green Ideas

Rに関する記事

このカテゴリについて

統計処理用ソフトRについての解説

2024年

竜・龍・辰が使われている地名地図

「竜」・「龍」・「辰」という漢字が使われている地名を日本地図上に表したものを紹介。この地図をR言語で作成する方法も紹介。

2023年

ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法

ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。

R言語のことを「統計のリンガフランカ」と表現する例

R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。

R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする

1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。

2022年

R における加算代入演算子など

R言語には、加算代入演算子・減算代入演算子・乗算代入演算子・除算代入演算子が用意されていない。しかし、roperator パッケージや inplace パッケージを使うことでこれらの演算子を使うことができる。

2020年

Rによるツイート分析(1)：指定したTwitterアカウントのツイートをリツイート数が多い順に並べる

rtweet パッケージを用いてTwitter のツイートを取得した上で、リツイート数が多い順にツイートを並べ替える方法についての説明。いいねが多い順に並べ替える方法についても。

2019年

Rのバージョン3.6.0がリリース

統計処理言語の R のバージョン3.6.0が、2019年4月26日に公開された。この新リリースでは、離散一様分布に従う乱数の生成手法が変更されたり、文字列を表現式 (expression) に変換する新しい関数が導入されたりした。

2018年

Rの geosphere パッケージ(3)：ある地点から一定の方位・距離にある地点を求める

Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。

Rの geosphere パッケージ(2)：大圏航路を描く

Rの geosphere パッケージを用いて大圏航路を求める方法の説明、および大圏航路の図示。

Rの geosphere パッケージ(1)：2点間の距離と方位角を計算する

Rの geosphere パッケージの導入方法、地球上の2点間の距離・方位角の求め方の説明。

Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする

Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。

Rで重複している箇所を取り出す方法

R言語において、1つのIDに対して2つ以上のレコードが存在している場合、その重複している箇所をすべて取り出す方法を2つ説明する。

Rによるデータクリーニング実践――政府統計からのグラフ作成を例として

データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。

R言語の上級者になりたければ『R言語徹底解説』を読もう

『R言語徹底解説』にはプログラミング言語としてのR言語の仕組みが詳しく書かれており、効率的なプログラムを作る方法など、上級者になるために必要なことを学ぶ助けになる。

2017年

2017年の統計関係のアドベントカレンダー

2017年のアドベントカレンダー（クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画）で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。

fortunes パッケージでRに関する名言を楽しもう

Rの fortunes パッケージには、Rに関するさまざまな名言が収録されている。Rを起動するたびに、こうした名言を表示することも可能である。

R言語で連続する日付のベクトルを作る

Rの seq() 函数を用いて連続する日付のベクトルを作る方法について紹介する。

Rで文字列の先頭や末尾から決まった文字数だけ削る方法

R言語において、文字列の先頭2文字分だけ削ったり、末尾3文字分だけ削ったりしたい場合にどうすればよいかについて説明する。基本的には、部分文字列を取得する函数を使えばよい。

米国のトランプ大統領の謎の covfefe ツイートをRで再現する

統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。

CRAN にある R パッケージへのリンクとして選ぶべきURL

CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。