データの整理・図示に関する記事

このカテゴリについて
データの整理法や表やグラフの描き方などについて

2018年

高校学習指導要領解説の数学編の箱ひげ図付きの散布図

2018年7月に出された『高等学校学習指導要領解説 数学編 理数編』には、散布図の脇に箱ひげ図が組み合わされた図が載っている。この図は、おそらくアヤメのデータセットをもとに作ったものであり、R言語で簡単に再現できる。

Rの geosphere パッケージ(3):ある地点から一定の方位・距離にある地点を求める

Rの geosphere パッケージを用いてある地点から一定の方位・距離にある地点を求める方法の説明、および等距離線の図示など。

Rの geosphere パッケージ(2):大圏航路を描く

Rの geosphere パッケージを用いて大圏航路を求める方法の説明、および大圏航路の図示。

Rで重複している箇所を取り出す方法

R言語において、1つのIDに対して2つ以上のレコードが存在している場合、その重複している箇所をすべて取り出す方法を2つ説明する。

Rによるデータクリーニング実践――政府統計からのグラフ作成を例として

データクリーニングが繁雑な作業であることを示すために、政府の統計データから日本の男のみの高校と女のみの高校の数の推移をグラフ化する事例を紹介する。クリーニングの作業にはR言語を用い、複数のファイルを統合し、整然データに変え、グラフを作成する。

2017年

Rで空行・空列を除去する方法

R言語を用いて、表型のデータに含まれる空行・空列を取り除く方法について紹介する。

データのクリーニングや組織化について深めたい人のために――『データリテラシー』

『データリテラシー』という書籍は、データ分析の経験がある程度ある人が、データのクリーニングや組織化について見直す際に有用である。

都道府県名を1文字で表す試み

神奈川県を「神」にするなど、都道府県名を省略して1文字で表す試みを紹介する。これを使えば、スペースを節約できる可能性がある。また、統計処理ソフト R でのグラフ作成において、都道府県名を1文字で表して図示する例も紹介する

ggplot2 パッケージによる可視化の際のラベルの重なりを防ぐ

ggrepel パッケージを使うと、ggplot2 パッケージによる可視化の際に、ラベルとラベルが重なって見にくくなることを防ぐことができる。

Rでグラフを描くときにY軸のタイトルを縦書きにする

R で plot() や ggplot2 パッケージを使って日本語のグラフを描く際に、Y軸のタイトルを縦書きのように表示させる方法についての説明。1行に1文字しかない横書きを作ることで、縦書きのように見せることができる。

【翻訳】整然データ

効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。

なぜ“tidy data”を「整然データ」と訳したのか

“tidy data”に対する日本語訳として「整然データ」を当てて、「きちんとしたデータ」などの他の訳語を当てなかった理由についての説明。

整然データとは何か

整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。

2016年

2015年

2013年

2012年

古い記事へ→