dataset - Openrefine内存PB
问题描述
大家好,感谢您的帮助,
首先,我是数据库使用和它的初学者。请放纵我。此外,我是 Xfce 环境的 ubuntu 用户。
我正在尝试将 Openrefine 与大约 11 000 行和 8 列的数据集一起使用。当我试图治疗它时,我遇到了一个记忆pb。“内存使用:100% (1517/1517MB)”
像这样 :
我尝试通过编写以下命令为 openrefine 分配更多内存:./refine -m 1800m
我读过我不能分配超过一半的可用内存,即 3800 m。但即使有更多的内存,我也等了一个晚上,openrefine 并没有处理数据集。我不明白为什么,因为 openrefine 应该可以用几列处理大约 100 000 个原始数据。
我用的是火狐浏览器。我尝试了openrefine认为更方便openrefine的Opera,但我得到了相同的结果。
一些更习惯于数据集处理的人可以帮助我吗?
解决方案
对您的问题给出“官方”答案:ODS有时对解析器来说是一个相当大的负担。因此,您可以通过将数据导出/导入为更易于阅读的 CSV 格式来绕过一些限制。
如OpenRefine 文档中关于增加内存分配的描述,您也可以从关闭自动单元类型解析中受益。
推荐阅读
- java - 扩展压缩字符串
- android - RecyclerView 中只显示一项
- typescript-typings - 增加一个接口来移除索引器
- javascript - 为仪表板选择多行数据
- c# - 如何模拟发布请求?
- javascript - Recharts Line activeDot 函数会破坏工具提示?
- r - geom_bar & 多个变量
- python - AWS Lambda:使用 Python 从 s3 存储桶中读取 csv 文件尺寸,而不使用 Pandas 或 CSV 包
- c - 通过c中的函数添加和释放二维数组
- javascript - 在 React 中的数组中映射道具项目