首页 > 解决方案 > 如何在 Wikidata 中对数据进行 JSON 或 RDF 批量导入?

问题描述

我目前正在使用 OntoWiki 知识库中结构良好的 RDF 数据。我有兴趣将这些数据导入本地 wikidata。这怎么可能?我没有找到合适的文档。

AFAIK,似乎 Wikidata 将 MariaDB 作为后端并从中生成三元组以使 SPARQL 服务受益。是否存在将 RDF 或 JSON 文件批量导入 wikidata 的工具?如果是,那么执行此操作的文档在哪里?数据量太大,无法手工完成,但优点是数据结构良好。

标签: jsonmariadbrdfwikidataontowiki

解决方案


WikiData原生基于Blazegraph,它是一个三元存储。(制作 blazegraph 的人被亚马逊聘请来创建亚马逊海王星)。

WikiData 的数据存储引擎以 WikiBase 的形式提供,并且一整套不同的工具可用于此环境。

因此,这在很大程度上取决于您的环境和技术堆栈,什么可能适合您。恕我直言,您的主要任务是将 OntoWiki 的世界观转换为 Wikidata 的世界观。您可以在http://wiki.bitplan.com/index.php/WikiData找到有关 WikiData 内部结构的概述(我是作者)

这是一个以多语言格式存储的示例 Triple:

示例 Wikidata 条目


推荐阅读