r - 在缩写为 Million & Billion 的 Dataset 列中提及如何删除和计算该列的平均值
问题描述
IN 数据集列“收入”数值以 $sign 和缩写为 Million 和 Billion 的形式提及。如何计算“收入”的平均值
enter code here
B_l$revenue<-split(B_l$revenue, split="M", Split="B")/1000
解决方案
一个选项是使用sub
删除“B|M”sub
并计算mean
列的
mean(as.numeric(sub("B|M", "", B_l$revenue)), na.rm = TRUE)
或parse_number
用于提取数字部分,然后得到mean
library(readr)
mean(parse_number(B_l$revenue), na.rm = TRUE)
分工不清楚。如果“B”元素应除以 1000
i1 <- grepl("B", B_l$revenue)
v1 <- parse_number(B_l$revenue)
v1[i1] <- v1[i1]/1000
mean(v1)