r - 在r中导入没有一致模式的txt文件
问题描述
我有一个看起来像这样的 txt 文件:
'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03'
Don't drop out of school.
'121002', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '14:04:13'
he should finish his degree!
在文件中,一个条目被分成两行。例如,第一个条目应如下所示:
'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03', 'Don't drop out of school.'
然后我想将文件导入到R中,每个引用的内容应该是一个单元格。例如,第一行应如下所示:
111001 1 C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp default.mlp 10/3/2017 12:14:03 Don't drop out of school
在上面的例子中,111001、1、C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp 等是分开的,每个占一列。
解决方案
如果每行恰好占据两行,那么您可以将文件拆分为 csv 部分和非 csv 部分。例如
lines <- readLines("2row.txt")
dd <- read.csv(text=lines[seq(1, length(lines), by=2)], header=F)
dd$comments = lines[seq(2, length(lines), by=2)]
在这里,我们将奇数行分组并将它们发送到read.csv
,然后我们将偶数行粘贴为一列。
推荐阅读
- string - 在 Matlab 中找到最相似的向量/字符串
- c# - C# 中的 Azure 函数在特定 VM 上调用 powershell 命令?
- rstudio - 在没有管理员权限的情况下安装 pandoc
- python - 在 Python 命令行上定义函数时出现语法错误
- .net - 如何在当前应用程序域中加载另一个程序集?
- npm - npm install optionalDependencies 但没有 devDependencies
- python - 如何在python上对产品和价格进行排名
- spring-boot - Spring Boot 配置 Jetty 初始化参数
- php - 如果数据库值在特定时期之前发生更改,如何停止代码
- java - 为什么@AutoValue 注解使用特定整数 1000003 来计算哈希码?