首页 > 解决方案 > 如何将列中的重复值加在一起?

问题描述

我有三列;贷款ID,金额,日期。我有 1,048,575 个条目,我需要将loan_id 列中的所有重复项加在一起(同一个loan_id 上有不同的付款),并且在第二个表中,金额值应该与loan_id 匹配。

我的数据看起来像这样的示例

在此处输入图像描述

标签: rmathstatistics

解决方案


所以你想要每个loan_id的总金额而不考虑日期?

在 R 中执行此类聚合函数的一种方法是使用 data.table 包。

library(data.table)

# assuming you start with a data.frame

mydata = data.table(mydata)

mydata[,sum(amount), by=loan_id]

推荐阅读