python - 使用 python 更改 ntriples 文件
问题描述
场景:我刚拿到一个巨大的 ntriples 文件(6.5gb 未压缩)。我正在尝试打开它并执行一些操作(例如清理它包含的一些数据)。
问题:我无法检查此文件的内容。Notepad++ 无法处理它,而在 RDFlib 中,我只能加载文件,但我似乎无法在不解析整个内容的情况下找到一种编辑方法。我也尝试使用 RDF 包(从如何使用 RDFLib 解析大数据集?),但我找不到在 Python 3 中安装它的方法。
问题:执行这种操作的最佳选择是什么?rdflib 中是否有任何命令允许这种编辑?
解决方案
如果它是 ntriples 那么基本上它是一个逐行的三元组。因此,您可以按小块(文件中的一些 N 行)读取文件,并通过 rdflib 解析块,然后在图上执行您需要的任何清理操作。
推荐阅读
- java - HikariCP:MariaDB 在空闲约 5 分钟后停止检索连接
- javascript - 如何使用“if 语句”过滤 ng-repeat?
- java - 如何使 JFrame 中的元素固定?
- java - 对象转换器的面向对象设计模式
- reactjs - Redux Thunk - 是否可以取消 setTimeout
- java - 为什么 Android 中的 java 源代码有三个目录/文件夹?
- python - 将json数据存储到熊猫中
- c# - HTML 5 - 做什么
做? - groovy - 在 jenkinsfile 的 shell 执行步骤中访问 groovy 变量
- angularjs - angular-gettext 不会从 .PO 文件中选择字符串