Rに関する記事

このカテゴリについて
統計処理用ソフトRについての解説

2017年

米国のトランプ大統領の謎の covfefe ツイートをRで再現する

統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。

CRAN にある R パッケージへのリンクとして選ぶべきURL

CRAN 上の R パッケージへのリンクをするときには、“Linking”という節に挙げられているURLを使えばよい。

都道府県名を1文字で表す試み

神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

『Rで学ぶ日本語テキストマイニング』の紹介

R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。

『Rによるやさしいテキストマイニング』の紹介

Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。

主要な統計解析ソフトの擬似乱数生成アルゴリズム

SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

整然データとは何か

整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。

2016年

2016年に読んで勉強になった統計書五選

2016年に私が読んだ統計書のうち、勉強になったと思った統計書を5冊、つれづれなるままに紹介。

2016年の統計関係のアドベントカレンダー

2016年のアドベントカレンダー(クリスマスまでに同じテーマで記事を1日1つずつ書いていく企画)で、統計、R、機械学習に関わるものを紹介する。

Rを使って素数な日付を探す

「2017年12月19日」を20171219にするなど、年月日をまとめて1つの整数にしたときに、その整数が素数となるような日付を探す方法について、プログラミング言語のRを使った事例を通じて説明する。

ggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える

統計解析ソフトRにおけるグラフ作成用ライブラリ ggplot2 で作った複数のグラフを格子状に並べて1枚にするには、gridExtra ライブラリの grid.arrange という函数が使える。

RにおけるNAが関わる演算

Rにおいて、NAが関わる演算は基本的にNAを返すが、FALSEとNAの論理積がFALSEとなるなどの事例においてはNA以外のものが返ることがある。

何語の文字列かを判定するためのRパッケージ

統計処理ソフト R の franc パッケージを使うと、どんな言葉の文字列かを判定することができる。

R の ave 函数

Rにおける ave 函数の使用法についての説明。この函数は、グループ分けした上で、何か計算をするときに有用である。ただし dplyr パッケージの方が同様のことができる上、分かりやすく書ける。

Rのプログラミング言語的側面を学びたい人のための『みんなのR』

『みんなのR』という本は、Rのプログラミング言語的側面を勉強したいという初心者には有用である。

Rのバージョン3.3.0がリリース

統計処理言語の R のバージョン3.3.0が、2016年5月3日に公開された。この新リリースでの主な変更点について解説する。

2015年

古い記事へ→