アドベントカレンダーとは
本来、アドベントカレンダー (advent calendar) は、12月の初めからクリスマスまでの一日一日を数えるためのカレンダーのことを指す。これにちなんで、クリスマスに向けて何らかのテーマを設定して記事を1つずつ書いていくことがあり、これもまたアドベントカレンダーと呼ばれる。一般的には、12月1日から25日まで1日1つずつ記事を書いていく。日によって別の人が記事を書くことが多いが、1人が複数日分の記事を書くこともあるし、1人で25日分全部の記事を書くこともある。
この記事では、1つずつ記事を書いていくアドベントカレンダーについて、2017年に日本語で書かれた統計に関する内容のものを紹介していこうと思う。
統計処理ソフトウェア関係
R Advent Calendar 2017
まずは、統計分析で非常に良く使われる R言語 に関するアドベントカレンダーを紹介していこう。個人的に気になった記事としては、以下のものがある。
- 中級者向けggplot2でこんな図が描きたい – 地図編
- 8日目の記事
- 日本列島を描くときに、沖縄県を地図の左上の方に描画する方法が役に立つと思った。
- 極私的Rの使い方5選(2017年版)
- 21日目の記事
- 「データを渡すときは .xlsx のファイルで」という指摘は興味深いと思った。
- Excelファイルというプロプライエタリなものを分析に持ち込むのはどうなのかという話もあると思うが、OSをこえてデータを受け渡す場合、日本語の文字コードに悩まされないようにするには、Excelファイルを使うのが無難なのは事実。データを扱う人のITリテラシーが必ずしも高くないことを考えると、比較的多くの人が扱えるExcelファイルを使うのは悪くないと思う。
RStudio Advent Calendar 2017
R言語のために作られた統合開発環境 RStudio に関するアドベントカレンダーである。個人的に気になった記事としては、以下のものがある。
- アカデミアのためのRSTUDIO
- 5日目の記事
- RStudio を使って学術論文を書く方法。文献管理への対応があるのが良さそう。
- 「tidyな分析環境つくるのがたいぎぃ」からDocker使う
- 22日目の記事
R Shiny Advent Calendar 2017
Rを使って簡単にWebアプリを作れる Shiny に関するアドベントカレンダーである。Np-Ur (@Np_Ur_) さんがほとんどの記事を書いている。
24日目の「Shiny100本ノック!RユーザーのためのTips集」という記事が Shiny に関する良いまとめになっているので、興味がある人はこれから読んでみるのが良いと思う。
Excel VBA Advent Calendar 2017
Excel VBA はそもそも統計分析に使えるようなものではないという指摘もあるだろうが、実際に統計分析に使っている人もいるので、紹介しておこうと思う。個人的に気になった記事としては以下のものがあった。
- 行と列および交点で構成されるデータ表
- 16日目の記事
- 要するに整然データになっていない表を整然データにしている [2] 。
Jupyter Advent Calendar 2017
Jupyter は統計分析のためだけに作られたソフトウェアというわけではないのだが、最近は Python でのデータ分析ライブラリ pandas などと組み合わせて使うことが多いようだ。また、R言語と組み合わせて使う人も少なくないようだ。よって、ここで紹介しておきたいと思う。
Jupyter Advent Calendar 2017 にも、統計分析と関連する事例が色々と載っている。例えば、以下のような記事がある。
- Jupyterで1つのノートブック内にRとPythonを共存させる
- 11日目の記事
- 野球データ分析を支えるPythonなノウハウ〜Jupyter notebookとpandas,SQLを添えて
- 19日目の記事
- jupyter notebook上で金融データの描画・取得・操作
- 23日目の記事
その他の統計処理ソフトウェア
- ひとりでデータ分析ガチ勉 Advent Calendar 2017
- Python を使ったデータ分析の事例を色々と紹介している。
- 今年の統計関係のアドベントカレンダーで一番気合が入ったものだと思う。
- Stan Advent Calendar 2017
- EZRで医療統計+αでStanを使ってベイズ統計(一人) Advent Calendar 2017
- Julia Advent Calendar 2017
機械学習関係
機械学習に関するものは2016年以前よりかなり増えた気がする。まず、機械学習そのものをテーマにしたアドベントカレンダーを紹介しよう。
- ディープラーニングのエンジニアリング Advent Calendar 2017
- Deep Learning フレームワークざっくり紹介 Advent Calendar 2017
- Deep Learningやっていき Advent Calendar 2017
- DeepLearning論文紹介 Advent Calendar 2017
- クラスメソッド機械学習 Advent Calendar 2017
- Machine Learning Advent Calendar 2017
- TensorFlow Advent Calendar 2017
- 強化学習ひとり Advent Calendar 2017
このほか、機械学習を主要なテーマとしていないアドベントカレンダーでも、機械学習について扱った記事が多く見られた。例えば、以下のような記事がある。
- 10分でわかる深層学習のニューラルネットワーク
- Akatsuki Advent Calendar 2017 の25日目の記事
- 深層学習の最適化アルゴリズム集
- 明治大学総合数理 Advent Calendar 2017 の17日目の記事
- ブラウザで動作する機械学習ライブラリdeeplearn.js
- ランサーズ Advent Calendar 2017 の8日目の記事
- JDLAのディープラーニング G検定を受けてみた
- メルカリの今年1年間の機械学習の取り組みとこれから
- Mercari Advent Calendar 2017 の2日目の記事
数学関係
「数学とコンピュータ」と題する Advent Calendar 2017 が2つあり、統計に関係しそうな記事がいくつか載っている。
統計に関係しそうな記事を以下に挙げる。
- 類似度のお話
- 数学とコンピュータ Advent Calendar 2017 の6日目の記事
- 数学系向けDeepLearning/Tensorflow入門
- 数学とコンピュータ Advent Calendar 2017 の18日目の記事
- EMアルゴリズム徹底解説
- 数学とコンピュータ Advent Calendar 2017 の24日目の記事
- 各言語での四捨五入 round メソッドを見る
- 数学とコンピュータⅡ Advent Calendar 2017 の6日目の記事
- 最小2乗法をブラケットで書いてみよう
- 数学とコンピュータⅡ Advent Calendar 2017 の7日目の記事
- メルセンヌツイスタの周期の最長性
- 数学とコンピュータⅡ Advent Calendar 2017 の9日目の記事
- 擬似乱数を作るときにお世話になるメルセンヌツイスタについての解説
- ベイズ統計初学者が学んだ「ベイズ推論」の実装
- 数学とコンピュータⅡ Advent Calendar 2017 の22日目の記事
機械学習と数学
このほか、あまりうまっていないが、機械学習と数学 Advent Calendar 2017 というアドベントカレンダーがある。
また、機械学習初心者向け数学チュートリアル by Team AI Advent Calendar 2017 というアドベントカレンダーもあり、『Pythonからはじめる数学入門』という本の読書記録や『ゼロから作るDeep Learning』という本の解説が載っている。ただ、これもあまりうまっていない。
その他
- まだ CSV の文字化けで消耗してるの?(Excel で直接開いても文字化けしない CSVファイルを Python3 で作成するスマートな方法)
- Python Advent Calendar 2017 の9日目の記事
- PostgreSQL での CSV からのインポート、平均、メディアン、相関係数の計算
- PostgreSQL Advent Calendar 2017 の11日目の記事
- 「PostgreSQL ではデータサイエンスに適用できるような機能を次々とリリースしています」とのこと。
- 3種類の平均を使い分ける with PostgreSQL
- Ateam Lifestyle Advent Calendar 2017 の4日目の記事
- 相加平均・相乗平均・調和平均の説明と、PostgreSQL でこれらの平均を求める方法
- 統計量の意味
- 東北大学 計算機科学研究会 Advent Calendar 2017 の13日目の記事
- 平均・分散・相関係数といった記述統計量についての紹介
- 距離空間入門~単語と単語の距離をはかる~
- ulgeek Advent Calendar 2017 の18日目の記事
- 線形な手法からカーネル法へ(1. 回帰分析)
- Pythonでお手軽・異常検知[ホテリング理論編]
- Akatsuki Advent Calendar 2017 の5日目の記事
- ベイズの定理とナイーブベイズ分類
- PRML Lab Advent Calendar 2017 の3日目の記事
- データエンジニアとデータの民主化 〜脱・神 Excel 〜
- 一休.com Advent Calendar 2017 の13日目の記事
- BigqueryとColaboratoryで売上を統計分析する基盤を試作した話
- NTTコミュニケーションズ Advent Calendar 2017 の17日目の記事
- メルカリの分析チームとは?その全ての疑問にひとつひとつ答えます
- Mercari Advent Calendar 2017 の6日目の記事