首页 > 解决方案 > ggplot2:叠加两层时出错

问题描述

下面以简化的方式描述了一个我经常遇到但从未让它工作的问题。它与叠加具有不同信息的层有关。

任何帮助表示赞赏。

library(dplyr)
library(ggplot2)

df = data.frame(id = c(1,1,1,1,2,2,2,3,3,3), 
            year = c(2000,2001,2002,2003,2000,2001,2002,2001,2002,2003),
            meas = c(1.1,1.2,NA,1.4,2.1,1.9,1.8,3.1,3.0,3.3))

df$id   = as.factor(df$id)
df$year = as.factor(df$year)

tib = as.tbl(df)

产生小标题:

# A tibble: 10 x 3
       id   year  meas
   <fctr> <fctr> <dbl>
 1      1   2000   1.1
 2      1   2001   1.2
 3      1   2002    NA
 4      1   2003   1.4
 5      2   2000   2.1
 6      2   2001   1.9
 7      2   2002   1.8
 8      3   2001   3.1
 9      3   2002   3.0
10      3   2003   3.3

目前,我计算横截面中每年测量值的中位数。

tib2 = tib %>% group_by(year) %>%       
    summarise(medi=median(meas,na.rm=T))
tib2

正如预期的那样

# A tibble: 4 x 2
    year  medi
  <fctr> <dbl>
1   2000  1.60
2   2001  1.90
3   2002  2.40
4   2003  2.35

到目前为止,一切都很好。现在,我创建了我的第一个情节

p = ggplot(tib, aes(x = year, y = meas, group = id, color = id)) p = p + geom_line() p 产生

在此处输入图像描述

另一方面,以下会产生一组胖点,因为它应该

p1=ggplot(tib2, aes(x = year, y = medi)) + geom_point(colour = 'red', size = 3)
p1

红点

但是,我尝试将红点放在第一个图中,如下所示:

p = p + geom_point(data = tib2, aes(x = year, y = medi), colour = 'red', size = 3)
p

这是我得到错误的地方:

不知道如何为函数类型的对象自动选择比例。默认为连续。错误(函数(...,row.names = NULL,check.rows = FALSE,check.names = TRUE,参数暗示不同的行数:4、0

备注:我注意到缺失值会导致我希望插值的红线出现切口。当我用某个值替换 NA 时,错误仍然存​​在。

标签: rggplot2dplyr

解决方案


你可以试试

ggplot(tib, aes(x = year, y = meas, group = id, color = id)) +
   geom_line() +
   stat_summary(fun.y = median, geom="point", aes(group=year), colour = 'red', size = 3)

在此处输入图像描述

或使用 Dash2 推荐

ggplot() +
   geom_line(data=tib, aes(x = year, y = meas, group = id, color = id)) +
   geom_point(data = tib2, aes(x = year, y = medi), colour = 'red', size = 3) 

推荐阅读