はじめに
何回か続いているggpubrのシリーズです。 今回は散布図について書きます。2つの連続変数の関係性を見る際の最も基本的なプロットですね。
データの紹介
今回はcarsというデータを用います。こちらは車の速度と制動距離 (止まるまでに必要な距離) のデータです。
処理と結果
data(cars) ggscatter(cars, x = "speed", y = "dist", color = "black")
こんな感じです。
例によって、ggparで見た目を変えることができて
p<-ggscatter(cars, x = "speed", y = "dist", color = "darkgray", size = 2) ggpar(p, xlab = "Speed", ylab = "Distance", font.main = c(18), font.x = c(18, "bold"), font.y = c(18, "bold"), font.tickslab = c(14,"bold"))
また、回帰直線を簡単に示すこともできます。
p<-ggscatter(cars, x = "speed", y = "dist", color = "black", size = 2, add = "reg.line", add.params = list(color = "skyblue", fill = "lightgray"), conf.int = TRUE, cor.coef = TRUE) ggpar(p, xlab = "Speed", ylab = "Distance", font.main = c(18), font.x = c(18, "bold"), font.y = c(18, "bold"), font.tickslab = c(14,"bold"))
ここでは95%信頼区間 (conf.int)と回帰係数 (cor.coef) も出してみています。
感想
やはり簡単ですね。 もう少し複雑なデータもやってみたいです。