niszetの日記

アナログCMOS系雑用エンジニアが頑張る備忘録系日記

(R) Rでe-Statのデータを触っていきたい

e-Statの使い方、Japan.R 2020の動画が一番わかりやすいのでは?

さて、先日のJapan.Rでは私もLTを行いましたが、前半の方でスペシャルゲストとして独立行政法人統計センターの西村さんが「政府統計の総合窓口(e-Stat)の概要」というタイトルでe-Statの使い方について説明をしてくださいました。 japanr.connpass.com

Japan.Rの動画は公開されており、下記URLはこの発表から始まるようにしています。

www.youtube.com

e-StatをRから使うパッケージとして、estatapiパッケージがあるので、上記のe-Statのサイト上で操作しなくても(APIが整備されているデータであれば)こちらからデータの取得が出来て便利です。APIを使用するための登録は必要ですが(私は登録はしてるけどまだこのパッケージを使っていない)

yutannihilation.github.io

RDFやLODとはなんぞや?ということで調べるなら、同じく発表者の西村さんの2015年のこちらの記事を読むのが良さそうだなと思いました(私は読みました)

cran.r-project.org

Rにもrdf形式を扱うパッケージ、rdflibがあるのですが、果たして個人レベルでこれを使うことがあるのだろうか…?という気持ちです(e-Statからもrdf形式ではデータを入手するわけではないはずなので)

www.jstage.jst.go.jp

動画でも触れられていますが、整備されているデータはどうしても人手が必要なのでまだごく一部(といっても量だけ見れば結構な量ですが…)となっており、すべてのデータが快適に使えるまでには時間がかかりそうです。

ただ、統計法が2019年5月1日に改正されて、利用者の範囲が拡大されるなどしてデータをより広く使われるようにしていくという方向性は続きそうなので(詳細は調べてみてくだしあ…)、うまく利活用していきたいですね。

まぁそれはそれとして、未だpdfだけとかxlsだけとかのはやめていただきたいですわねぇ…(あと特定期間にしかデータがなさそうとか、移管されていそうなやつね…。結局、データそのものの存在とかに対するドメイン知識的なモノが必要なので、そのまま突っ込んでいったら迷子になるやつだなーという気持ち…)