r - 如何比较来自不同数据集的变量并在 RStudio 中相应地改变变量?
问题描述
比较来自两个不同数据集的两个项目并相应地改变变量
概括
亲爱的 Stackoverflow-Community,我正在尝试将来自一个数据集 (data1) 的列/变量 (item1) 与来自不同数据集 (data2) 的列/变量 (item1) 进行比较。我想将mutate
dataset1 中的比较列/变量(item1)与数据集 data2 的第三个变量(字母)进行比较。
不幸的是,我收到错误消息“UseMethod(“mutate_”)中的错误:“mutate_”的不适用方法应用于“逻辑”类的对象。用我的代码。
我创建了两个数据示例集和一个数据集,显示了我尝试使用 R 生成的输出,您可以在下面的 Dropbox 链接中找到。
下载到示例数据集(+ 所需输出的可视化)
https://www.dropbox.com/sh/eido04eiocuw06l/AABiCr2EpRf4PPsb1HYLLGFna?dl=0
我的代码
data1 <- read.csv2("data 1.csv")
data2 <- read.csv2("data 2.csv")
attach(data1)
attach(data2)
data1 <- as.data.frame(data1)
data2 <- as.data.frame(data2)
if(data1$item.1 = data2$item.1) %>%
mutate(data1$item.1 == data2$letter)
背景
我从 moodle 下载了一个大数据集,我需要转换数据集才能进行分析。今天下午我和我的同事一起尝试这个方法太久了,现在我们希望得到一些建议(因为我们刚开始使用 R)。
提前致谢,祝您有美好的一天!
卡拉
解决方案
data1 <- read.csv2("stackoverflow/data_1.csv")
data2 <- read.csv2("stackoverflow/data_2.csv")
# Get data in format where there are only two columns
long_data1 <- tidyr::gather(data1, key = "key", value = "value", -person)
long_data2 <- tidyr::gather(data2, key = "key", value = "value", -letter)
# Merge on those two columns
merged_data <- merge(long_data1, long_data2, by = c("key", "value"))
# Tidy up the results
merged_data <- subset(merged_data, select = c(person, letter, key))
final_data <- tidyr::spread(merged_data, key = key, value = letter)
我能想出的最干净的解决方案是以长格式获取数据 - 每个观察都有自己的行 - 然后合并列。该软件包做得最好,如果您还没有安装它tidyr
,则需要安装它。install.packages(tidyr)
推荐阅读
- java - 使用一个类的多个限制器将数据存储在 firebase
- java - 如何从低安卓版本的安卓设备连接到Php服务器
- excel - 有没有办法从网络位置导入 Excel 模块 (VBA)?
- firebase - Firebase 规则:仅当用户包含在子节点中时才允许用户读取数据
- r - 如何在闪亮仪表板中更改侧边栏的字体大小
- python - 在 Selenium 中通过部分 Xpath 查找元素
- html - 在 Django 中获取请求
- asp.net-web-api - 具有复杂类型的 List 属性的 Url 语法
- css - SVG 掩码图像未在 Firefox 和 Edge 中显示
- python - 具有内部预测的自定义 Keras 损失函数