首页 > 解决方案 > Openrefine内存PB

问题描述

大家好,感谢您的帮助,

首先,我是数据库使用和它的初学者。请放纵我。此外,我是 Xfce 环境的 ubuntu 用户。

我正在尝试将 Openrefine 与大约 11 000 行和 8 列的数据集一起使用。当我试图治疗它时,我遇到了一个记忆pb。“内存使用:100% (1517/1517MB)”

像这样 :

捕获内存 pb

我尝试通过编写以下命令为 openrefine 分配更多内存:./refine -m 1800m

我读过我不能分配超过一半的可用内存,即 3800 m。但即使有更多的内存,我也等了一个晚上,openrefine 并没有处理数据集。我不明白为什么,因为 openrefine 应该可以用几列处理大约 100 000 个原始数据。

我用的是火狐浏览器。我尝试了openrefine认为更方便openrefine的Opera,但我得到了相同的结果。

一些更习惯于数据集处理的人可以帮助我吗?

标签: datasetopenrefine

解决方案


对您的问题给出“官方”答案:ODS有时对解析器来说是一个相当大的负担。因此,您可以通过将数据导出/导入为更易于阅读的 CSV 格式来绕过一些限制。

OpenRefine 文档中关于增加内存分配的描述,您也可以从关闭自动单元类型解析中受益。


推荐阅读