首页 > 解决方案 > 在r中导入没有一致模式的txt文件

问题描述

我有一个看起来像这样的 txt 文件:

'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03'
Don't drop out of school.
'121002', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '14:04:13'
he should finish his degree!

在文件中,一个条目被分成两行。例如,第一个条目应如下所示:

'111001', '1', 'C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp', 'default.mlp', '10/3/2017', '12:14:03', 'Don't drop out of school.'

然后我想将文件导入到R中,每个引用的内容应该是一个单元格。例如,第一行应如下所示:

 111001 1 C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp default.mlp 10/3/2017 12:14:03 Don't drop out of school

在上面的例子中,111001、1、C:\Users\dicelab\Desktop\mar\ExPart1_C1.exp 等是分开的,每个占一列。

标签: r

解决方案


如果每行恰好占据两行,那么您可以将文件拆分为 csv 部分和非 csv 部分。例如

lines <- readLines("2row.txt")
dd <- read.csv(text=lines[seq(1, length(lines), by=2)], header=F)
dd$comments = lines[seq(2, length(lines), by=2)]

在这里,我们将奇数行分组并将它们发送到read.csv,然后我们将偶数行粘贴为一列。


推荐阅读