Rに関する記事

このカテゴリについて
統計処理用ソフトRについての解説

2018年

Rの geosphere パッケージ(3):ある地点から一定の方位・距離にある地点を求める

Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。

Rの geosphere パッケージ(2):大圏航路を描く

Rの geosphere パッケージを用いて大圏航路を求める方法の説明、および大圏航路の図示。

Rの geosphere パッケージ(1):2点間の距離と方位角を計算する

Rの geosphere パッケージの導入方法、地球上の2点間の距離・方位角の求め方の説明。

Rで複数のオブジェクトからリストを作るときに、オブジェクト名をリストの要素の名前にする

Hmisc パッケージの llist() 函数を使うことで、リストを作るときに使ったオブジェクト名からリストの要素の名前をつけることができる。

Rで重複している箇所を取り出す方法

R言語において、1つのIDに対して2つ以上のレコードが存在している場合、その重複している箇所をすべて取り出す方法を2つ説明する。

Rによるデータクリーニング実践――政府統計からのグラフ作成を例として

データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。

R言語の上級者になりたければ『R言語徹底解説』を読もう

『R言語徹底解説』にはプログラミング言語としてのR言語の仕組みが詳しく書かれており、効率的なプログラムを作る方法など、上級者になるために必要なことを学ぶ助けになる。

2017年

2017年の統計関係のアドベントカレンダー

2017年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。

fortunes パッケージでRに関する名言を楽しもう

Rの fortunes パッケージには、Rに関するさまざまな名言が収録されている。Rを起動するたびに、こうした名言を表示することも可能である。

R言語で連続する日付のベクトルを作る

Rの seq() 函数を用いて連続する日付のベクトルを作る方法について紹介する。

Rで文字列の先頭や末尾から決まった文字数だけ削る方法

R言語において、文字列の先頭2文字分だけ削ったり、末尾3文字分だけ削ったりしたい場合にどうすればよいかについて説明する。基本的には、部分文字列を取得する函数を使えばよい。

米国のトランプ大統領の謎の covfefe ツイートをRで再現する

統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。

CRAN にある R パッケージへのリンクとして選ぶべきURL

CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。

都道府県名を1文字で表す試み

神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

『Rで学ぶ日本語テキストマイニング』の紹介

R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。

『Rによるやさしいテキストマイニング』の紹介

Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。

主要な統計解析ソフトの擬似乱数生成アルゴリズム

SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。
古い記事へ→