整然データに関する記事
2017年

【翻訳】整然データ
効果的なデータ分析に関して、「整然データ」という概念を提唱した論文 “Tidy Data” の全訳。整然データは、Rなどでデータ分析を容易にする有用な概念である。
なぜ“tidy data”を「整然データ」と訳したのか
“tidy data”に対する日本語訳として「整然データ」を当てて、「きちんとしたデータ」などの他の訳語を当てなかった理由についての説明。

整然データとは何か
整然データとは、1) 個々の変数が1つの列をなす、2) 個々の観測が1つの行をなす、3) 個々の観測の構成単位の類型が1つの表をなす、4) 個々の値が1つのセルをなす、という4つの条件を満たした表型のデータのことであり、構造と意味が合致するという特徴を持つ。R言語などを用いたデータ分析の際には非常に有用な概念である。