首页 > 解决方案 > Cassandra default_time_to_live 和 gc_grace_seconds 属性没有从表中删除数据

问题描述

我为一个表设置了 default_time_to_live 1 分钟并且没有计数器字段,仍然没有从表中清除数据。这是一个 6 节点集群。

CREATE TABLE <DB>.<TABLE> (
unqid text PRIMARY KEY,
lastupdtdtm timestamp,
rltdid text,
tmtolive varint) WITH bloom_filter_fp_chance = 0.01
AND caching = {'keys': 'ALL', 'rows_per_partition': 'NONE'}
AND comment = ''
AND compaction = {'class': 'org.apache.cassandra.db.compaction.SizeTieredCompactionStrategy', 'max_threshold': '32', 'min_threshold': '4'}
AND compression = {'chunk_length_in_kb': '64', 'class': 'org.apache.cassandra.io.compress.LZ4Compressor'}
AND crc_check_chance = 1.0
AND dclocal_read_repair_chance = 0.1
AND default_time_to_live = 10
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99PERCENTILE';```

标签: cassandracassandra-3.0

解决方案


在表上设置默认 TTL 仅适用于新插入的数据。SSTables 在 Cassandra 中是不可变的——一旦它们被写入磁盘,它们就不会被更新/修改。这意味着磁盘上的任何现有数据都不会应用新的 TTL,因此它们不会自动过期。

您将需要最好在 Spark 中编写一个应用程序,该应用程序将遍历分区并(a)使用 TTL 更新每个分区,或(b)删除整个分区。否则,它们不会自行过期,也不会被删除。干杯!


推荐阅读