json - 如何在 Wikidata 中对数据进行 JSON 或 RDF 批量导入?
问题描述
我目前正在使用 OntoWiki 知识库中结构良好的 RDF 数据。我有兴趣将这些数据导入本地 wikidata。这怎么可能?我没有找到合适的文档。
AFAIK,似乎 Wikidata 将 MariaDB 作为后端并从中生成三元组以使 SPARQL 服务受益。是否存在将 RDF 或 JSON 文件批量导入 wikidata 的工具?如果是,那么执行此操作的文档在哪里?数据量太大,无法手工完成,但优点是数据结构良好。
解决方案
WikiData原生基于Blazegraph,它是一个三元存储。(制作 blazegraph 的人被亚马逊聘请来创建亚马逊海王星)。
WikiData 的数据存储引擎以 WikiBase 的形式提供,并且有一整套不同的工具可用于此环境。
因此,这在很大程度上取决于您的环境和技术堆栈,什么可能适合您。恕我直言,您的主要任务是将 OntoWiki 的世界观转换为 Wikidata 的世界观。您可以在http://wiki.bitplan.com/index.php/WikiData找到有关 WikiData 内部结构的概述(我是作者)
这是一个以多语言格式存储的示例 Triple:
- 主题:维多利亚女王
- 谓语:父亲
- 对象:爱德华·奥古斯都王子
推荐阅读
- jenkins - Groovy - 密码中的字符问题
- python - 如何在不使用 .replace() 方法的情况下替换字符串中的单词,因为我希望单词只被删除一次
- random - ansible - 读取文件,然后随机选择条目
- linux - 由于 tee 命令,jekins 作业中的 Maven 安装不会失败
- c++ - Windows.Media.Audio.AudioGraph 中的延迟输入
- html - 具有固定页眉、页脚和侧面板的响应式三列布局
- mysql - 如果关系不为空,Laravel 雄辩的 where 子句
- oracle - 从 oracle 数据库中检索和显示数据
- regex - Sed(OS X)用其他文本块替换包含给定字符串的文本块
- javascript - 如何在 Firestore 中查询集合并将文档聚合为“每天”、“每周”?