r - R中的组中位数
问题描述
我有以下数据框,如果值高于组的中位数,我想引入一个虚拟对象。
df<-data.frame(group=rep(c("A","B","c"),3), value1=c(1:9))
m<-aggregate(. ~ group, data=df, FUN=median)
names(m)[2]<-"median"
df<-merge(df,m, by="group", all.x = T)
df$median_0_1<-ifelse(df$median<df$value1,1,0)
有没有更优雅的方法来做到这一点?
而且,我可以调整它以将假人设置为高于或低于第三四分位数吗?
而且,这是一种可靠的可靠方式吗?
非常感谢。
解决方案
当您想保持数据框中的行数相同时ave
df$median_0_1 <- with(df, as.integer(value1 > ave(value1, group, FUN = median)))
这也可以用dplyr
library(dplyr)
df %>% group_by(group) %>% mutate(median_0_1 = as.integer(value1 > median(value1)))
或者data.table
library(data.table)
setDT(df)[, median_0_1 := as.integer(value1 > median(value1)), group]
推荐阅读
- javascript - 转换值 - 问题
- sql - Oracle Regex 从字符串中的键值对中获取值
- php - curl 或 wget 获取无效的 jpg 图像,但浏览器获取有效图像
- python-3.x - 尝试使用 python 写入文件的编码错误
- android - 应用关闭后在 Android Studio 中添加调试器?
- android - JSON 有额外的引号和斜杠
- javascript - Angular 模块没有导出成员“fromEvent”
- r - 全局环境变量内存使用表
- javascript - 如何设置 Angular 2 本地存储超时
- javascript - 具有动态生成内容的闭包