r - 为什么在 R 字符串中的条目不会被读入 data.frame?
问题描述
我有一个data.tsv
文件(标签分隔条目)。完整的文件可以在这里找到。
文件中的条目如下所示:
">173D:C" "TVPGVXTVPGV" "CCSCCCCCCCC"
">173D:D" "TVPGVXTVPGV" "CCCCCCCCSCC"
">185D:A" "SAXVSAXV" "CCBCCCBC"
">1A0M:B" "GCCSDPRCNMNNPDYCX" "CCTTSHHHHHTCTTTCC"
">1A0M:A" "GCCSDPRCNMNNPDYCX" "CGGGSHHHHHHCTTTCC"
">1A0N:A" "PPRPLPVAPGSSKT" "CCCCCCCCSTTCCC"
我正在尝试将字符串条目读入数据框(读入包含 3 列的矩阵):
data = data.frame(read.csv(file = './data.tsv', header = FALSE, sep = '\t'))
但只读取第一列。所有其他列都是空的。
我还尝试了不同的命令,例如
data = read.csv(file = './data.tsv', header = FALSE, sep = '\t')
data = read.csv(file = './data.tsv', sep = '\t')
data = data.frame(read.csv(file = './data.tsv'))
但没有成功。有人能预见为什么输入没有被成功读取吗?
解决方案
使用最后在注释中可重复定义的文件,这有效:
DF <- read.table("myfile.dat", as.is = TRUE)
给出:
> DF
V1 V2 V3
1 >173D:C TVPGVXTVPGV CCSCCCCCCCC
2 >173D:D TVPGVXTVPGV CCCCCCCCSCC
3 >185D:A SAXVSAXV CCBCCCBC
4 >1A0M:B GCCSDPRCNMNNPDYCX CCTTSHHHHHTCTTTCC
5 >1A0M:A GCCSDPRCNMNNPDYCX CGGGSHHHHHHCTTTCC
6 >1A0N:A PPRPLPVAPGSSKT CCCCCCCCSTTCCC
笔记
Lines <- '">173D:C" "TVPGVXTVPGV" "CCSCCCCCCCC"
">173D:D" "TVPGVXTVPGV" "CCCCCCCCSCC"
">185D:A" "SAXVSAXV" "CCBCCCBC"
">1A0M:B" "GCCSDPRCNMNNPDYCX" "CCTTSHHHHHTCTTTCC"
">1A0M:A" "GCCSDPRCNMNNPDYCX" "CGGGSHHHHHHCTTTCC"
">1A0N:A" "PPRPLPVAPGSSKT" "CCCCCCCCSTTCCC"'
writeLines(Lines, "myfile.dat")
推荐阅读
- dpdk - 为什么大页面没有更新
- c - 无锁链表实现
- android - 我应该将 .idea/assetWizardSettings.xml 添加到 gitignore 吗?
- php - 如何更改子文件夹中的多个参数
- r - 使用 group_by 检查单元格值,如果存在,则将其添加到组中的所有列单元格
- sql-server - 快速更改语句填充事务日志文件但未完成
- java - 使用 httpclient 以同步方式执行 rest 调用
- c# - 如何在 Visual Studio 中运行作为 NuGet 包安装的 wkhtmltopdf(.exe)
- python - 在输入更改时更改散景数据源
- python - python中原始类型的多态调度?