首页 > 解决方案 > R - 如何在 Dplyr Summarize 函数中删除缺失值和 Nan?

问题描述

我正在尝试查找具有计算列“calCTRLPV”(登陆页面浏览量/展示次数)的数据集的四分位数信息。对于某些行,它将为 NA,因为分子可能为 0 或不可用。在尝试在 dplyr 中运行汇总时,我遇到了错误。如何更正数据集以使汇总正常工作?谢谢。

错误:summarise()输入有问题calCTRLPV。如果 'na.rm' 为 FALSE,则 x 缺失值和 NaN 不允许 i 输入calCTRLPVquantile(calCTRLPV, c(0.25, 0.5, 0.75)).

trafficdata %>% 
group_by(Platform) %>%  
summarise(quantile = scales::percent(c(0.25, 0.5, 0.75)),
calCTRLPV = quantile(calCTRLPV, c(0.25, 0.5, 0.75)))

标签: rdplyr

解决方案


尝试设置na.rmTRUE

trafficdata %>% 
  group_by(Platform) %>%  
  summarise(quantile = scales::percent(c(0.25, 0.5, 0.75)),
            calCTRLPV = quantile(calCTRLPV, c(0.25, 0.5, 0.75), na.rm = TRUE))

推荐阅读