首页 > 解决方案 > 卡桑德拉 | 如何将当前数据集与之前的数据集进行比较?

问题描述

我是 Cassandra DB 的新手,我需要定期(每 15 分钟)将一组数据存储在表中。这组数据可以有 1500 条记录。现在,我必须在 Cassandra 表中插入这组数据,使所有这 1500 条记录都与相同的分区键绑定,这意味着所有这 1500 条记录必须存在于同一个节点中。

15 分钟后,一批 1500 条记录将再次以相同的方式存储,但分区键不同。

目标是比较最后两组数据并找到有差异的数据。所以 1500 条记录(现在)将与 1500 条记录(以前)进行比较,我需要找出哪些记录已更改,然后对更改的记录执行一些业务逻辑。

如果我使用 timeuuid 作为分区键,那么我所有的 1500 条记录都将具有不同的 timeuuid,因此不会出现在同一个节点中。

我正在寻找有关在 Cassandra 中维护增量计数器的信息,但似乎没有什么好的方法,此外,在单个节点中维护 COUNTER 表是分布式设计的反模式。

如何在 Cassandra 中创建自动增量 ID

你们能建议我解决这个问题的最佳方法吗?

简而言之,我的要求归结为:

如何将当前数据集与之前的数据集进行比较?

顺便说一句,我将使用 Springboot 连接并将数据写入 Cassandra。

提前致谢 !

标签: spring-bootcassandramicroservicesdatastaxspring-data-cassandra

解决方案


推荐阅读