首页 > 解决方案 > 在缩写为 Million & Billion 的 Dataset 列中提及如何删除和计算该列的平均值

问题描述

IN 数据集列“收入”数值以 $sign 和缩写为 Million 和 Billion 的形式提及。如何计算“收入”的平均值

enter code here
 B_l$revenue<-split(B_l$revenue, split="M", Split="B")/1000

标签: r

解决方案


一个选项是使用sub删除“B|M”sub并计算mean列的

mean(as.numeric(sub("B|M", "", B_l$revenue)), na.rm = TRUE)

parse_number用于提取数字部分,然后得到mean

library(readr)
mean(parse_number(B_l$revenue), na.rm = TRUE)

分工不清楚。如果“B”元素应除以 1000

i1 <- grepl("B", B_l$revenue)
v1 <- parse_number(B_l$revenue)
v1[i1] <- v1[i1]/1000
mean(v1)

推荐阅读