はじめに
論文とかで図を描くとき、まあExcelが手っ取り早いんだけど、再現性とか見やすさとかいじりやすさとか考えるとpythonなりRなりで描くほうがよくて、その備忘録です。
今回はRのggplot2を使ってどこまでできるのか試していきます。
投稿予定
得てして予定通りにはいかないものですが、散布図、棒グラフ、バイオリンプロット、ヒートマップあたりを取り上げていくつもりです。また、軸の文字の大きさやタイトル、凡例などはパラメータが多すぎてどれがどれだかわからなくなってしまいがちなので、何回かに分けて取り上げるつもりです。ggplotだけですべての作図を完了できる形にするのが目標です。
データの準備
さしあたりまずirisデータセットを使います。irisはR付属のデモデータセットで、アヤメ属の三種(setosa, versicolor, virginica)についてがく片長/幅、花弁長/幅の計4種のデータを150個体分記録したものです。(引用: https://tsutatsutatsuta.hatenadiary.org/entry/20121206/1354737461)
ではデータを読み込んでいきます。ちなみにdplyrパッケージの”%>%”はシェルで言うところのパイプとして使える演算子で、シェルになれてる人にはめちゃくちゃ快適です。
library(dplyr)
data.iris <- iris
data.iris %>% head
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
こんな感じのデータになっています。この数字の可視化を次回からやっていきたいと思います。