cassandra - 我应该如何选择大小分层压缩策略的参数?
问题描述
我有这两个特定的用例:
- 流式作业,每 5 秒写入 30mb
- 批处理作业,每天早上写入 500 GB
我的桌子在 1.5 年内的 TTL。
这些写入可以包含许多更新,因此,根据此处的此表:
我应该使用 SizeTieredCompactionStrategy。但是,我该如何选择正确的参数呢?
它有几个参数:
bucket_high
bucket_low
min_sstable_size
min_threshold
最大阈值
解决方案
作为一般建议,运营商很少需要配置按大小分层的压缩子属性。
除非您对 Cassandra 非常有经验,否则没有任何理由重新配置 STCS 的默认值。这就是为什么它是开箱即用的默认压缩策略并且适用于大多数工作负载。
例外情况是,将 TWCS 用于真正的时间序列用例,将 LCS 用于读取量很大且几乎没有任何写入的情况。干杯!
推荐阅读
- laravel - 没有 URI 的子域基础,无法捕获基础 url
- java - netbeans vs eclipse 项目结构对比
- javascript - 如何使用javascript使菜单项出现在鼠标悬停上
- javascript - 根据输入值分配 PHP 值
- artifactory - 停止工件 api 分页
- c# - 如何使用 Web API 使 DbContext 保持连接状态
- kotlin - 如何解析在 ktor 中发布的原始 json 数据列表
- swift - 打印时如何将数组拆分为指定的行?
- node.js - Multer 不能在 http 对象之外工作
- c# - IEnumerable 自身的异常