都道府県名を1文字で表す試み 神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する
ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。
Rでグラフを描くときにY軸のタイトルを縦書きにする R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。
『Rで学ぶ日本語テキストマイニング』の紹介 R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。
『Rによるやさしいテキストマイニング』の紹介 Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。
主要な統計解析ソフトの擬似乱数生成アルゴリズム SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。
整然データとは何か 整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。
Rを使って素数な日付を探す 「2017年12月19日」を20171219にするなど、年月日をまとめて1つの整数にしたときに、その整数が素数となるような日付を探す方法について、プログラミング言語のRを使った事例を通じて説明する。
ggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える 統計解析ソフトRにおけるグラフ作成用ライブラリ ggplot2 で作った複数のグラフを格子状に並べて1枚にするには、gridExtra ライブラリの grid.arrange という函数が使える。
R の ave 函数 Rにおける ave 函数の使用法についての説明。この函数は、グループ分けした上で、何か計算をするときに有用である。ただし dplyr パッケージの方が同様のことができる上、分かりやすく書ける。
Rを日本語Windowsで使うときにアクセント付きのローマ字を扱う方法 日本語WindowsでRを使う場合、アクセント付きのローマ字がうまく扱えないことがある。この場合、ロケールを変更すると扱えるようになる。