首页 > 解决方案 > 板条箱数据库快照大小

问题描述

我已经设置了一个 python 脚本,它每天中午创建一个 crate db 快照。我运行以设置回购的查询是:

CREATE REPOSITORY repo_name TYPE FS WITH (LOCATION='/path/to/folder', compress=true);

为了创建快照,我每天运行的查询是:

CREATE SNAPSHOT repo_name.{} ALL WITH (wait_for_completion=true, ignore_unavailable=true);

在初始运行时,快照目录大小与数据库大小 (30GB) 相同。

大约一个月后,数据库已增长到 40GB,而快照目录大小已增长到 ~120GB(几乎是数据库大小的三倍!)。

这是正常的吗?

如果是,是否有任何选项/优化我可以尝试减少快照的大小?

标签: cratedb

解决方案


根据 Crate数据未压缩。只有元数据被压缩。(我同意这令人困惑。)

快照是增量的,所以我不完全确定为什么它会增长这么多。(您是否可能摄取了大量数据,这些数据可能会在快照期间被删除但仍然存在?)可能值得直接在他们的 github 上向 Crate 提出查询并检查这是否是一个错误。


推荐阅读