理系夫婦のうたたねブログ

理系夫婦が好きなことを書いていきます。たまに医学っぽいことを書いていますが、あくまで私見です。

ggpubrで散布図

はじめに

何回か続いているggpubrのシリーズです。 今回は散布図について書きます。2つの連続変数の関係性を見る際の最も基本的なプロットですね。

データの紹介

今回はcarsというデータを用います。こちらは車の速度と制動距離 (止まるまでに必要な距離) のデータです。

処理と結果

data(cars)
ggscatter(cars, x = "speed", y = "dist",
          color = "black")

基本の散布図
こんな感じです。

例によって、ggparで見た目を変えることができて

p<-ggscatter(cars, x = "speed", y = "dist",
             color = "darkgray", size = 2)
ggpar(p,
      xlab = "Speed", 
      ylab = "Distance",
      font.main = c(18),
      font.x = c(18, "bold"),
      font.y = c(18, "bold"),
      font.tickslab = c(14,"bold"))

少し見た目を変えたグラフ

また、回帰直線を簡単に示すこともできます。

p<-ggscatter(cars, x = "speed", y = "dist",
             color = "black", size = 2,
             add = "reg.line", 
             add.params = list(color = "skyblue", fill = "lightgray"),
             conf.int = TRUE,
             cor.coef = TRUE)
ggpar(p,
      xlab = "Speed", 
      ylab = "Distance",
      font.main = c(18),
      font.x = c(18, "bold"),
      font.y = c(18, "bold"),
      font.tickslab = c(14,"bold"))

回帰直線と回帰係数

ここでは95%信頼区間 (conf.int)と回帰係数 (cor.coef) も出してみています。

感想

やはり簡単ですね。 もう少し複雑なデータもやってみたいです。