首页 > 解决方案 > 在 Apache Jena Fuseki 中压缩数据集

问题描述

你好,RDF 爱好者。

我已将 Jena Fuseki 服务器部署为端点,以收集来自云服务基础设施的大量事件数据,然后将数据集用作服务监控前端的最终知识来源。但是数据集增长得非常快。

我了解到有一种方法可以压缩 TDB2 数据集。我如何从 Fuseki 环境中做到这一点?

标签: datasetjenalarge-datafuseki

解决方案


显然没有办法在 Fuseki 环境中进行在线压缩。但我发现,这两个tdb.tdbcompact命令都没有充分压缩数据库,因为在我的情况下,差异大约是数据库大小的 2-4%。

我所做的是转储整个数据集,清除数据库并再次加载数据集。结果令人难以置信:从 50 GiB 的数据库降至 1 GiB。

我安排这与备份一起每天完成。


推荐阅读