niszetの日記

細かい情報を載せていくブログ

(R) precisの代わりにskimrを使うのだろうか?

入れ替わり激しくないですか…

rstudio::conf 2018の発表資料を眺めていて、skimrというパッケージを知ったのです。

skimrパッケージはCRANにあります。
CRAN - Package skimr

昨年末に1.0.0で登録されて年明けに1.0.1になっていますね。

なおGitHub版はこちら
github.com

で、活発に開発していそうです。

使ってみる

やってみる系です。何も考えずに実行するとこんな感じ。

> skimr::skim(iris)
Skim summary statistics
 n obs: 150 
 n variables: 5 

Variable type: factor 
 variable missing complete   n n_unique                       top_counts ordered
  Species       0      150 150        3 set: 50, ver: 50, vir: 50, NA: 0   FALSE

Variable type: numeric 
     variable missing complete   n mean   sd  p0 p25 median p75 p100     hist
 Petal.Length       0      150 150 3.76 1.77 1   1.6   4.35 5.1  6.9 ▇▁▁▂▅▅▃▁
  Petal.Width       0      150 150 1.2  0.76 0.1 0.3   1.3  1.8  2.5 ▇▁▁▅▃▃▂▂
 Sepal.Length       0      150 150 5.84 0.83 4.3 5.1   5.8  6.4  7.9 ▂▇▅▇▆▅▂▂
  Sepal.Width       0      150 150 3.06 0.44 2   2.8   3    3.3  4.4 ▁▂▅▇▃▂▁▁

それぞれの説明は…大体見てわかりますよね。summaryの凄い版です。

あれ?これどこかで…

このヒストグラム、どこかで見ましたよね。そう、こちら。u_riboさんのこの記事です。

uribo.hatenablog.com

これいいなぁ…と思っていたのですが、ココを見ると

github.com

開発は止まっているようなのですよね…

skimrが明確にprecisの後継であるなどの記述は見つからなかったのですが、役割としては同じような感じで、summaryの凄い版(言い方…)です。

コンソール上でデータが確認できるのはとても便利なので今後積極的に使っていこうと思います。
ちなみに、どの項目を表示させるのかも設定できるようです。

まだこのパッケージを見つけたばかりなので、いずれもう少し掘り下げていく予定です

Enjoy!!