首页 > 解决方案 > 使用包含在标题中的信息从 Excel 导入 R 中的数据

问题描述

正如标题所说,我正在尝试将数据从 Excel 导入到 R,其中部分信息包含在标题中。

我有一个非常简化的方法,我的 Excel 看起来像这样:

GROUP;1234
MONTH;"Jan"
PERSON;SEX;AGE;INCOME
John;m;26;20000
Michael;m;24;40000
Phillip;m;25;15000
Laura;f;27;72000
Total;;;147000

读入 R 后,它应该是一个看起来像这样的“干净”数据集。

GROUP;MONTH;PERSON;SEX;AGE;INCOME
1234;Jan;John;m;26;20000
1234;Jan;Michael;m;24;40000
1234;Jan;Phillip;m;25;15000
1234;Jan;Laura;f;27;72000

我有几个看起来像这样的文件。然而,每个文件的人数各不相同。最后一行包含应该跳过的摘要。列表和摘要行之间可能有空行。

非常感谢任何帮助。非常感谢。

标签: rexcelimport

解决方案


readxl::read_excel() 可以使用其中一个参数读取 Excel 文件skip,使用它可以跳过您定义的某些行数。

对于您的数据,您需要跳过包含 GROUP 和 MONTH 的前两行。

您将获得以下格式的数据。

PERSON;SEX;AGE;INCOME;

John;m;26;20000

Michael;m;24;40000

Phillip;m;25;15000

Laura;f;27;72000

在此之后,您可以手动添加 GROUP 和 MONTH 列


推荐阅读