ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法 ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。
R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする 1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。
高校学習指導要領解説の数学編の箱ひげ図付きの散布図 2018年7月に出された『高等学校学習指導要領解説 数学編 理数編』には、散布図の脇に箱ひげ図が組み合わされた図が載っている。この図は、おそらくアヤメのデータセットをもとに作ったものであり、R言語で簡単に再現できる。
Rの geosphere パッケージ(3):ある地点から一定の方位・距離にある地点を求める Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。
Rによるデータクリーニング実践――政府統計からのグラフ作成を例として データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。
データのクリーニングや組織化について深めたい人のために――『データリテラシー』 『データリテラシー』という書籍は、データ分析の経験がある程度ある人が、データのクリーニングや組織化について見直す際に有用である。
都道府県名を1文字で表す試み 神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する
ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。
Rでグラフを描くときにY軸のタイトルを縦書きにする R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。
整然データとは何か 整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。
ggplot2 ライブラリで作った複数のグラフを1枚にまとめるには、gridExtra ライブラリが使える 統計解析ソフトRにおけるグラフ作成用ライブラリ ggplot2 で作った複数のグラフを格子状に並べて1枚にするには、gridExtra ライブラリの grid.arrange という函数が使える。