首页 > 解决方案 > 计算 r 中的求和数据集

问题描述

我有以下问题:我的 R 数据集包含两列(软件的匿名使用数据)。

data.frame(cmid=c(925390,925390,935392,935393,935392), userid=c(14686,14686,14686,96350,44451))

从这个数据集中,我想创建一个新的数据集,其中列出了行中的用户 ID 和列中的总和 cmid,以便每个用户 ID 或 cmid 只出现一次。因此,数据集应如下所示:

用户身份 925390 935392 935393
14686 2 1 0
44481 0 1 0
96350 0 0 1

由于数据集由 40717 行组成,因此 userid/cmid 数量非常大,我正在寻找一个自动化的解决方案。我目前缺乏任何方法。我已经尝试过使用 ```summarise or count`` 函数更进一步,但不幸的是没有任何成功......

有没有人有提示?

标签: rdplyr

解决方案


推荐阅读