dataset - 在 Apache Jena Fuseki 中压缩数据集
问题描述
你好,RDF 爱好者。
我已将 Jena Fuseki 服务器部署为端点,以收集来自云服务基础设施的大量事件数据,然后将数据集用作服务监控前端的最终知识来源。但是数据集增长得非常快。
我了解到有一种方法可以压缩 TDB2 数据集。我如何从 Fuseki 环境中做到这一点?
解决方案
显然没有办法在 Fuseki 环境中进行在线压缩。但我发现,这两个tdb.tdbcompact
命令都没有充分压缩数据库,因为在我的情况下,差异大约是数据库大小的 2-4%。
我所做的是转储整个数据集,清除数据库并再次加载数据集。结果令人难以置信:从 50 GiB 的数据库降至 1 GiB。
我安排这与备份一起每天完成。
推荐阅读
- javascript - 从“navigationStart”开始时,性能用户计时 API 测量无法正常工作
- java - JAVA:mouseDragged getX 和 getY 原始数据不稳定
- bash - 如何找到当天登录的用户并提及他们登录的时间?
- swift - Swift 使用 Scrollview 重新创建 iPhone App Switcher 页面
- php - PHP 输出 HTML,更好的方法?
- node.js - 如何在 Node JS 中截取整个屏幕的屏幕截图?
- javascript - 使用 React Hooks 隐藏点击按钮
- javascript - 反应按钮,使用tone.Js,在第一次按键后中断,错误:setValueAtTime 的参数无效:{},2.2188208616780045
- github - Github:如何列出创建了 Private Access Tokens 的组织成员?
- c# - 拆分字段字符串并将每个值与字符串 linq c# 进行比较