首页 > 解决方案 > 我应该如何选择大小分层压缩策略的参数?

问题描述

我有这两个特定的用例:

  1. 流式作业,每 5 秒写入 30mb
  2. 批处理作业,每天早上写入 500 GB

我的桌子在 1.5 年内的 TTL。

这些写入可以包含许多更新,因此,根据此处的此表:

在此处输入图像描述

我应该使用 SizeTieredCompactionStrategy。但是,我该如何选择正确的参数呢?

它有几个参数:

bucket_high

bucket_low

min_sstable_size

min_threshold

最大阈值

标签: cassandrascylla

解决方案


作为一般建议,运营商很少需要配置按大小分层的压缩子属性。

除非您对 Cassandra 非常有经验,否则没有任何理由重新配置 STCS 的默认值。这就是为什么它是开箱即用的默认压缩策略并且适用于大多数工作负载。

例外情况是,将 TWCS 用于真正的时间序列用例,将 LCS 用于读取量很大且几乎没有任何写入的情况。干杯!


推荐阅读