首页 > 解决方案 > 我可以使用主键从多个 CSV 文件中提取数据吗?

问题描述

提前为菜鸟问题道歉。我有 2 个不同的 csv 数据集,其中包含不同的信息,但共享相同的主键“员工姓名”。我试图通过提取 volume.csv 和 timecard.csv 来了解员工在工作时间内的工作效率。有没有办法覆盖数据以使用主键分析它们在给定日期的生产力?timecard.csv 文件包含按支付代码(个人假期、加班、定期)分类的数据,而 volume.csv 文件包含按唯一访问次数(访问次数)分类的数据。

R 脚本:myvoldata=read.csv("Rad Tech Productivity_May 2021 Volume.csv") mytimedata=read.csv("Kronos Employee_May 2021.csv")

标签: rprimary-keytibble

解决方案


假设您已经使用 读取了每个 csv read.csv(),您可以简单地将两者合并到一个数据框中进行分析。

使用 dplyr 库: full_join(volume, timesheet, by = "staff name")将保留两个表中的所有列,加入员工姓名列。


推荐阅读