r - 基于公共列组合数据集
问题描述
我想为每个用户名使用 twitterID 为我的数据集创建一个新列。使用这个rtweet
包,我可以像这样推导出 ID:
usr_df <- lookup_users(df2$Username) %>%
select(user_id, screen_name)
所以我认为我的操作相当简单:我只想在一个数据框中将正确的 twitterID 添加到正确的用户名中。我一直在玩,inner_join
没有任何成功。此外,某些行包含用户名的 NA。
数据集 1:
# A tibble: 6 x 2
Name Username
<chr> <chr>
1 ZiadAboultaif ziad_aboultaif
2 ScottAitchison ScottAAitchison
3 DanAlbas DanAlbas
4 JohnAldag jwaldag
5 OmarAlghabra OmarAlghabra
6 ShafqatAli Shafqat_Ali_1
# For reproducibility:
structure(list(Name = c("ZiadAboultaif", "ScottAitchison", "DanAlbas",
"JohnAldag", "OmarAlghabra", "ShafqatAli"), Username = c("ziad_aboultaif",
"ScottAAitchison", "DanAlbas", "jwaldag", "OmarAlghabra", "Shafqat_Ali_1"
)), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"
))
数据集 2:
user_id screen_name
<chr> <chr>
1 4568748862 ziad_aboultaif
2 172004509 ScottAAitchison
3 16278177 DanAlbas
4 335769776 jwaldag
5 20199202 OmarAlghabra
6 578640179 Shafqat_Ali_1
# For reproducibility:
structure(list(user_id = c("4568748862", "172004509", "16278177",
"335769776", "20199202", "578640179"), screen_name = c("ziad_aboultaif",
"ScottAAitchison", "DanAlbas", "jwaldag", "OmarAlghabra", "Shafqat_Ali_1"
)), row.names = c(NA, -6L), class = c("tbl_df", "tbl", "data.frame"
))
解决方案
推荐阅读
- android - xxhdpi 文本到 textView textSize
- javascript - 从 DOM 片段中移除特定颜色
- postman - 无法将数组设置为环境变量 - 邮递员测试
- c# - 如何将连接的客户端列表从服务器发送到客户端,区分常规消息?
- javascript - 计算轮盘赌赢家的数学
- c# - 使用 C# 确定哪个鼠标在多个鼠标中触发 Click 事件?
- python-3.x - Cython 编译器指令 language_level 不受尊重
- vba - 在 vba 中使用 getElementsByTagName 返回运行时错误 91 对象变量或未设置块变量
- html - 在带有过渡的悬停更改动画上
- c# - 使用 MVVM 模式将列表传递给类