首页 > 解决方案 > R 中的 left_join 返回和错误“错误:数据中必须存在连接列” colnames() 表示存在列名称

问题描述

我正在尝试使用 left_join 函数连接两个数据框。这是我的代码:

combined <- left_join(APRN_mailing, DOPL_List, by = "ID")

我不断收到错误:

“错误:连接列必须存在于数据中。”

当我colnames()在两个数据帧上运行时,我得到:

colnames(DOPL_List)
[1]"ID.LAST_NAME.FIRST_NAME.gender.ADDR_LINE_1.ADDR_LINE_2.CITY.STATE.zipcode.EMAIL.LicenseID.ProfessionGroup.Birth_Year"

colnames(APRN_mailing)

[1]“ID.LAST_NAME.FIRST_NAME.gender.ADDR_LINE_1.ADDR_LINE_2.CITY.STATE.zipcode.EMAIL.ProfessionGroup.Birth_Year”

在我看来,我在两个数据框中都有一个名为“ID”的列。我试过重写代码:

combined <- left_join(APRN_mailing, DOPL_List, by = c("ID" = "ID")

但我得到了同样的结果。

任何想法可能是什么问题?

标签: rleft-join

解决方案


在我看来,您误读了数据,您的列没有分开。如果你查看 colnames() 的结果,它只返回一个变量的名称,它很长。


推荐阅读