首页 > 解决方案 > 使用 python 更改 ntriples 文件

问题描述

场景:我刚拿到一个巨大的 ntriples 文件(6.5gb 未压缩)。我正在尝试打开它并执行一些操作(例如清理它包含的一些数据)。

问题:我无法检查此文件的内容。Notepad++ 无法处理它,而在 RDFlib 中,我只能加载文件,但我似乎无法在不解析整个内容的情况下找到一种编辑方法。我也尝试使用 RDF 包(从如何使用 RDFLib 解析大数据集?),但我找不到在 Python 3 中安装它的方法。

问题:执行这种操作的最佳选择是什么?rdflib 中是否有任何命令允许这种编辑?

标签: pythonrdflibn-triples

解决方案


如果它是 ntriples 那么基本上它是一个逐行的三元组。因此,您可以按小块(文件中的一些 N 行)读取文件,并通过 rdflib 解析块,然后在图上执行您需要的任何清理操作。


推荐阅读