r - 多行相同的行,但行的数量不同
问题描述
我有这样的数据:
ID | 单词 |
---|---|
1 | 公共汽车 |
1 | 到达 |
1 | 停止 |
1 | 时间 |
1 | 胡须 |
1 | 大胡子 |
1 | 坐 |
2 | 同时 |
2 | 争论 |
2 | 座位 |
2 | 时间 |
2 | 警察 |
3 | 官 |
3 | 散步 |
3 | 干预 |
我想将其转换为如下数据集:
ID | 单词 |
---|---|
1 | 到达 公共汽车站 时间 胡子 胡子 坐 |
2 | 同时开始争论座位时间 |
3 | 官员走干预 |
是否可以?
谢谢你。
解决方案
在我的评论中添加一些细节:
library(dplyr)
data <- tibble::tribble(
~id, ~word,
1L, "arrive",
1L, "bus",
1L, "stop",
1L, "time",
1L, "beard",
1L, "bearded",
1L, "sits",
2L, "whilst",
2L, "begin",
2L, "argue",
2L, "seat",
2L, "time",
2L, "police",
3L, "officer",
3L, "walks",
3L, "intervenes"
)
data %>%
group_by(id) %>%
mutate(word = paste0(word, collapse = " ")) %>%
slice(1) %>% # Take the first line from each group
ungroup()
或更好(所以你不需要切片):
data %>%
group_by(id) %>%
summarise(word = paste0(word, collapse = " "))
推荐阅读
- automation - 管理项目中源库的工具(没有子模块)?
- jenkins - 如何制作詹金斯 HA?
- php - 如何在 php codeigniter 3.1.9 中声明全局变量?
- vba - 如何在访问 vba 中为固定导入规范转换/重命名未知文件类型
- angular7 - 使用 @ngrx/Effect 效果不会被动作触发
- python - 初始化数据库后首次加载时无法在输入框中输入输入?
- pandas - 熊猫日期时间在图中显示为数字
- laravel - JWT laravel:检查身份验证。即使我设置了令牌,也无法检查用户是否已通过身份验证
- delphi - 变量“xxx”可能尚未初始化
- hyperledger-fabric - 获取链码代码 mycc 时出错:链码的路径不存在