r - 如何将列中的重复值加在一起?
问题描述
我有三列;贷款ID,金额,日期。我有 1,048,575 个条目,我需要将loan_id 列中的所有重复项加在一起(同一个loan_id 上有不同的付款),并且在第二个表中,金额值应该与loan_id 匹配。
我的数据看起来像这样的示例
解决方案
所以你想要每个loan_id的总金额而不考虑日期?
在 R 中执行此类聚合函数的一种方法是使用 data.table 包。
library(data.table)
# assuming you start with a data.frame
mydata = data.table(mydata)
mydata[,sum(amount), by=loan_id]