r - 使用包含在标题中的信息从 Excel 导入 R 中的数据
问题描述
正如标题所说,我正在尝试将数据从 Excel 导入到 R,其中部分信息包含在标题中。
我有一个非常简化的方法,我的 Excel 看起来像这样:
GROUP;1234
MONTH;"Jan"
PERSON;SEX;AGE;INCOME
John;m;26;20000
Michael;m;24;40000
Phillip;m;25;15000
Laura;f;27;72000
Total;;;147000
读入 R 后,它应该是一个看起来像这样的“干净”数据集。
GROUP;MONTH;PERSON;SEX;AGE;INCOME
1234;Jan;John;m;26;20000
1234;Jan;Michael;m;24;40000
1234;Jan;Phillip;m;25;15000
1234;Jan;Laura;f;27;72000
我有几个看起来像这样的文件。然而,每个文件的人数各不相同。最后一行包含应该跳过的摘要。列表和摘要行之间可能有空行。
非常感谢任何帮助。非常感谢。
解决方案
readxl::read_excel()
可以使用其中一个参数读取 Excel 文件skip
,使用它可以跳过您定义的某些行数。
对于您的数据,您需要跳过包含 GROUP 和 MONTH 的前两行。
您将获得以下格式的数据。
PERSON;SEX;AGE;INCOME;
John;m;26;20000
Michael;m;24;40000
Phillip;m;25;15000
Laura;f;27;72000
在此之后,您可以手动添加 GROUP 和 MONTH 列
推荐阅读
- css - 使用 CSS 和 Bootstrap,如何设置屏幕大小为 1/3 的背景图片?
- python - 熊猫将函数列表应用于数据框
- java - 在 ASP 中加密字符串 在 Java 中解密
- javascript - Express + Passport 不同的多个“本地”同时登录
- aws-lambda - 单个 AWS Lambda 函数来响应 Alexa 技能请求,并返回一个 JSON 对象,具体取决于它的调用方式
- r - 使用 ggplot 在 MDS 上绘制向量
- c - 将表达式转换为后缀的程序
- sabre - 调用 Sabre CreatePassengerNameRecordRQ 时出错 - 使用的类别没有可组合票价
- oracle - 执行表三时出现此错误“指定的约束名称必须是唯一的。*操作:为约束指定唯一的约束名称
- node.js - Socket.io:控制台中的 GET 请求失败