Rで文字列の先頭や末尾から決まった文字数だけ削る方法 R言語において、文字列の先頭2文字分だけ削ったり、末尾3文字分だけ削ったりしたい場合にどうすればよいかについて説明する。基本的には、部分文字列を取得する函数を使えばよい。
データのクリーニングや組織化について深めたい人のために――『データリテラシー』 『データリテラシー』という書籍は、データ分析の経験がある程度ある人が、データのクリーニングや組織化について見直す際に有用である。
米国のトランプ大統領の謎の covfefe ツイートをRで再現する 統計処理用のプログラミング言語のRには、米国のトランプ大統領がツイートした covfefe という謎の単語のようなものを生成するためのパッケージがある。
統計の初心者のつまずきやすい点が分かる『統計的方法のしくみ』 『統計的方法のしくみ』という本は、統計の初心者のつまずきやすい点をうまく説明してくれる。統計の教科書と併用する副読本として利用すると効果的であろう。
都道府県名を1文字で表す試み 神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する
ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。
DeNA に対する第三者委員会の調査報告書での信頼区間の説明 DeNA に対する第三者委員会の調査報告書でなされていた信頼区間に関する説明がすこしあやういように思われたので、それについて簡単にコメントを記す。
Rでグラフを描くときにY軸のタイトルを縦書きにする R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。
『Rで学ぶ日本語テキストマイニング』の紹介 R言語によるさまざまなテキストマイニングの事例を挙げた『Rで学ぶ日本語テキストマイニング』の紹介。この本では、主に言語学の研究に役立つテキストマイニングの手法が挙げられている。
『Rによるやさしいテキストマイニング』の紹介 Rというプログラミング言語を使ってテキストマイニングを行う方法について教えてくれる入門書『Rによるやさしいテキストマイニング』の紹介。この分野に不慣れな人のために、1冊で収まるように説明してあることが特徴的である。
主要な統計解析ソフトの擬似乱数生成アルゴリズム SAS, SPSS, STATA, R といった現在の主要な統計解析ソフトでは、擬似乱数を生成するときに、メルセンヌ・ツイスターをアルゴリズムとして採用している。
日本で統計やデータサイエンスを学びたい場合、どんな大学に進学すれば良いか 日本には統計やデータサイエンスを中核にした学部・学科はほとんどないので、それ以外の学部・学科で統計やデータサイエンスを専門とする教員がいるところを探すのが無難だと思われる。