Rに関する記事

このカテゴリについて
統計処理用ソフトRについての解説

2017年

2017年の統計関係のアドベントカレンダー

2017年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、R言語をはじめとする統計処理ソフトウェアや機械学習などに関わるものを紹介する。

fortunes パッケージでRに関する名言を楽しもう

Rの fortunes パッケージには、Rに関するさまざまな名言が収録されている。Rを起動するたびに、こうした名言を表示することも可能である。

R言語で連続する日付のベクトルを作る

Rの seq() 函数を用いて連続する日付のベクトルを作る方法について紹介する。

Rで文字列の先頭や末尾から決まった文字数だけ削る方法

R言語において、文字列の先頭2文字分だけ削ったり、末尾3文字分だけ削ったりしたい場合にどうすればよいかについて説明する。基本的には、部分文字列を取得する函数を使えばよい。

米国のトランプ大統領の謎の covfefe ツイートをRで再現する

統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。

CRAN にある R パッケージへのリンクとして選ぶべきURL

CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。

都道府県名を1文字で表す試み

神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

『Rで学ぶ日本語テキストマイニング』の紹介

R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。

『Rによるやさしいテキストマイニング』の紹介

Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。

主要な統計解析ソフトの擬似乱数生成アルゴリズム

SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

整然データとは何か

整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。

2016年

古い記事へ→