一人でAdvent Calendar ビジュアライズ道場(12/1)

はじめに

論文とかで図を描くとき、まあExcelが手っ取り早いんだけど、再現性とか見やすさとかいじりやすさとか考えるとpythonなりRなりで描くほうがよくて、その備忘録です。
今回はRのggplot2を使ってどこまでできるのか試していきます。

投稿予定

得てして予定通りにはいかないものですが、散布図、棒グラフ、バイオリンプロット、ヒートマップあたりを取り上げていくつもりです。また、軸の文字の大きさやタイトル、凡例などはパラメータが多すぎてどれがどれだかわからなくなってしまいがちなので、何回かに分けて取り上げるつもりです。ggplotだけですべての作図を完了できる形にするのが目標です。

データの準備

さしあたりまずirisデータセットを使います。irisはR付属のデモデータセットで、アヤメ属の三種(setosa, versicolor, virginica)についてがく片長/幅、花弁長/幅の計4種のデータを150個体分記録したものです。(引用: https://tsutatsutatsuta.hatenadiary.org/entry/20121206/1354737461)

ではデータを読み込んでいきます。ちなみにdplyrパッケージの”%>%”はシェルで言うところのパイプとして使える演算子で、シェルになれてる人にはめちゃくちゃ快適です。

library(dplyr)
data.iris <- iris
data.iris %>% head

  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa

こんな感じのデータになっています。この数字の可視化を次回からやっていきたいと思います。

コメントする