相关主题:Jitter Plot ### Jitter Plot 这个图还是表示两个变量的相关性程度
#准备工作(加载R包)
library(ggplot2)
#如果我们去掉后面的package参数,就是会变成单纯的调动mpg内置数据集,并且是以数据框的形式,但是加上这个参数后,我们调动内置数据集就会以tibble形式展现(就是以最适合ggplot2的形式展现)
data(mpg, package="ggplot2") # alternate source: "<http://goo.gl/uEeRGu>")
#背景设置:theme_bw(): 是theme_grey()的变体,白色背景和灰色网格线
# theme_linedraw(): 白色背景黑色线条
theme_set(theme_bw()) # pre-set the bw theme.
#画出一个底图
g <- ggplot(mpg, aes(cty, hwy))
- *晨曦解读:**这里说一下绘图的逻辑,如果这里我们只给出你最后的那张成品可视化,我们需要考虑什么?
首先考虑横纵坐标,然后优先画出一个底板,也就是第一个图层 然后分解这个图,因为是点图,所以第二个图层是点图 因为有一条拟合曲线,所以第三个图层是一条拟合曲线 然后就是图外,也就是标题 首先有一个主标题和副标题 还有一个右小角的小标 最后别忘了横纵坐标的变量名称 完成出图:先创建底图→图内→图外
# Scatterplot
g + geom_point() +
geom_smooth(method="lm", se=F) +
labs(subtitle="mpg: city vs highway mileage",
y="hwy",
x="cty",
title="Scatterplot with overlapping points",
caption="Source: midwest")
#探索数据
dim(mpg)
#原始数据的点明显要比图内的点多,这是因为有些点重合了,所以我们需要设置抖动
#重新构建绘图函数
# load package and data
library(ggplot2)
data(mpg, package="ggplot2")
# mpg <- read.csv("<http://goo.gl/uEeRGu>")
# Scatterplot
theme_set(theme_bw()) # pre-set the bw theme.
g <- ggplot(mpg, aes(cty, hwy))
g + geom_jitter(width = .5, size=1) +#用jitter代替point,表示抖动的点
labs(subtitle="mpg: city vs highway mileage",
y="hwy",
x="cty",
title="Jittered Points")
#当然抖动的点也可以添加拟合曲线,直接添加geom_smooth(method="lm", se=F)
#se=T则会添加置信区间