r - 我尝试将 gz 文件读入 R,但收到一条错误消息:第 1 行没有 9 个元素
问题描述
这是我的代码:
imdb <- read.table(gzfile("/imdb_dataset/title.basics.tsv.gz"), sep = " ")
错误:
Error in scan(file = file, what = what, sep = sep, quote = quote, dec = dec, :
line 1 did not have 9 elements
该文件,您可以在其中查看列的分隔方式等。
事实上,第一行有 9 个元素,那可能是什么问题呢?
tt0000010 short Exiting the Factory La sortie de l'usine Lumière à Lyon 0 1895 \N 1 Documentary,Short
tt0000011 short Akrobatisches Potpourri Akrobatisches Potpourri 0 1895 \N 1 Documentary,Short
tt0000012 short The Arrival of a Train L'arrivée d'un train à La Ciotat 0 1896 \N 1 Action,Documentary,Short
解决方案
我发现您的导入存在 2 个潜在问题:
- 你给一个空格(
" "
)而不是一个制表符("\t"
)作为分隔符,但你说它是一个 tsv - 有一堆
\N
字符可以把它扔掉 - 尝试替换那些
推荐阅读
- mongodb - 使用nodejs在mongoDB中将字符串转换为int
- c# - 如何在 Web 表单中添加 2 个用户控件
- c# - AspNet Core WebAPI FromBody 无法解析 JSon 对象
- c# - 如何将自己的方法变成可链接的 LINQ 方法?
- adsense - 通过 adsense 标签发送变量以帮助过滤报表
- python - Google Style Guide 中的可选类型提示
- mongodb - 通过 ID 在嵌套数组中查找单个记录,并根据 MongoDB 中的另一个嵌套数组进行排序
- r - 是否可以在 Rstudio 中自动触发片段?
- android - 如何扩展 textView 并自动移动下一个字段?
- mysql - MySQL 服务器处于非活动状态?如何使其处于活动状态?错误 --> mysql.service: 失败,结果为 'exit-code'