r - dplyr:使用 mutate() 创建具有复杂操作的新列
问题描述
我想new.df
使用原始的 ( ) 创建一个新的数据框 ( ),但使用包含函数的复杂操作创建df
一个新列 ( ) 。我的步骤是:Age
mutate
dplyr
# Artificial dataframe
IDtest<-c(1,1,1,1,1,1,2,2,2,3,3,3,3)
Class<-c(1,1,2,2,2,3,1,1,2,1,2,2,3)
Day<-c(0,47,76,100,150,173,0,47,76,0,47,76,100)
Area<-c(0.45,0.85,1.50,1.53,1.98,5.2,
0.36,0.58,1.2,
0.85,1.36,2.26,3.59)
df<-data.frame(cbind(IDtest, Class, Day, Area))
str(df)
#Split each IDtest
df[df[,1]==1,]
# IDtest Class Day Area
#1 1 1 0 0.45
#2 1 1 47 0.85
#3 1 2 76 1.50
#4 1 2 100 1.53
#5 1 2 150 1.98
#6 1 3 173 5.20
每个里面IDtest
:
- 最后
Area
里面每个Class
减去一个因子(如果面积 < 1 = 0; < 2.9 = 1; < 8.9 = 3; < 24.9 = 9; > 25 = 25);和 - 比 1) 除以 last 和 first 之间的减法
Area
并除以Day
每个内部Class
- 比 1) 和 2)
Day
在每个Class
减号 last中求和Day
。最后总和除以 365 并创建一个新列Age
#For Class 1
(0.85-0)/((0.85-0.45)/47) + (47 - 0)
#For Class 2
(1.98-1)/((1.98-0.85)/150) + (157 - 47)
#For Class 3
(5.20-3)/((5.2-1.98)/173) + (173 - 150)
#Final
Age<-((0.85-0)/((0.85-0.45)/47) + (47 - 0) +
(1.98-1)/((1.98-0.85)/150) + (157 - 47) +
(5.20-3)/((5.2-1.98)/173) + (173 - 150))/365
Age
#[1] 1.44702
# Desirable output
new.df
# IDtest Class Day Area Age
#1 1 1 0 0.45 1.44702
#2 1 1 47 0.85 1.44702
#3 1 2 76 1.50 1.44702
#4 1 2 100 1.53 1.44702
#5 1 2 150 1.98 1.44702
#6 1 3 173 5.20 1.44702
请问有什么想法吗?
解决方案
这很棘手,因此我将所有步骤分开进行,以便您更轻松地发现任何可能的误解。您的这一行是否可能存在错误?
(1.98-1)/((1.98-0.85)/150) + (157 - 47) # 157? wouldn't it be 150?
也就是说,我第 1 课的结果和你的一样,但是请注意第 2 课和第 3 课,因为我不确定是否正确理解了第二步和第三步,我不确定你使用 " last”(即类中的“last”或“previous”类)。
在第二步中,我在 Class 中使用“last”,在第三步中,我使用 for 循环来使用“the previous”。我想你可以添加这个想法
df2 <- df %>%
group_by(IDtest, Class) %>%
mutate(
DayOrder = row_number()
)
df2 <- df2 %>%
mutate(step1a = Area[max(DayOrder)], # I divide step1 in several steps to make it clearer
minus = # what you want to substract
case_when(
step1a < 1 ~ 0,
step1a < 2.9 ~ 1,
step1a < 8.9 ~ 3,
step1a < 24.9 ~ 9,
step1a > 25 ~ 25
),
step1done = step1a - minus,
step2a = Area[max(DayOrder)] - Area[min(DayOrder)], # "Last" inside the same Class (as it is inside mutate, which is under group_by)
step2b = Day[max(DayOrder)],
step2done = step2a / step2b,
step1by2 = step1done / step2done
)
df2$step3 <- NA
for (i in 1:max(df2$Class)){
if(i == 1){
df2$step3[Class == i] <- max(df2$Day[df2$Class == i]) - 0 # quite silly
}else{
df2$step3[Class == i] <- max(df2$Day[df2$Class == i]) - max(df2$Day[df2$Class == i - 1]) # "Last" as the "previous" Class, not inside the same Class
}}
df2 %>%
mutate(
step3done = step1by2 + step3,
Age = step3done / 365 # Do you want "age" as a unique value?? not a value for each person? This case I would do this outside mutate and add as a new column
)
如果我误解了你,我希望你至少可以提出一些想法!
推荐阅读
- javascript - 重复数组对象值创建为多维数组
- ios - 显示来自 CoreData 的数据
- oracle-apex - 如何使用/解析 Apex 表单刚刚提交的数据?
- c - 无法在 C 中打印 float64 值
- guptateamdeveloper - 将 Gupta 应用程序从 5.2 版升级到 7.0
- unit-testing - fakexrmeasy 单元测试中的 Dynamics 365 货币字段基础货币重新计算
- javascript - 记录 X 数量不在循环中
- javascript - 从 ahref 按钮返回正确的 DataTable 行 ID
- swift - 在 UITextField 中调用 viewDidLoad
- javascript - 如何从其他两个函数中获得“如果为真”结果并在第三个函数中使用它?