r - 计算 r 中的求和数据集
问题描述
我有以下问题:我的 R 数据集包含两列(软件的匿名使用数据)。
data.frame(cmid=c(925390,925390,935392,935393,935392), userid=c(14686,14686,14686,96350,44451))
从这个数据集中,我想创建一个新的数据集,其中列出了行中的用户 ID 和列中的总和 cmid,以便每个用户 ID 或 cmid 只出现一次。因此,数据集应如下所示:
用户身份 | 925390 | 935392 | 935393 |
---|---|---|---|
14686 | 2 | 1 | 0 |
44481 | 0 | 1 | 0 |
96350 | 0 | 0 | 1 |
由于数据集由 40717 行组成,因此 userid/cmid 数量非常大,我正在寻找一个自动化的解决方案。我目前缺乏任何方法。我已经尝试过使用 ```summarise or
count`` 函数更进一步,但不幸的是没有任何成功......
有没有人有提示?
解决方案
推荐阅读
- nginx - HAProxy - run lua script based on remote agent-check
- python - 如何在 python nltk 聊天答案上使用反射
- docker - unbale to run nexus image on local
- c# - Saving the User Info in session in Microsoft Bot Framework
- php - Disable place order button if billing_address_2 contains value at WooCommerce checkout
- scripting - Liquibase- Creating index with descending ordering in column issue
- jmeter - 如何限制 JSON 提取器中选择的 id 数量?
- postgresql - 有没有办法通过 PostgreSQL 的时间戳过滤 pg_dump?
- django - 如何将 Django settings.py 中的 broker_url 传递给 Celery 服务
- python - 我怎样才能加快这种远程计算算法?