Appendix A — 統計データの整形

公開される統計データの大多数は、Rなどのプログラムが扱いやすい形式にはなっていません。 入力や閲覧しやすい状態のデータのまま公開されるものが多いためです。

このようなデータをRで扱うためにはデータ整形の作業が必要になります。 特にtidy dataと呼ばれる形式にデータ整形を行うことで、R上で扱いやすいデータとなります。

ここでは実際に公開されている統計データを例に、データ整形の方法を学びます。

A.1 データの読み込み

日本語

readr::locale(encoding = "cp932")

A.2 dplyrによるデータ操作

A.2.1 データの結合

A.3 tidyrを使ったデータ整形