spring-boot - 卡桑德拉 | 如何将当前数据集与之前的数据集进行比较?
问题描述
我是 Cassandra DB 的新手,我需要定期(每 15 分钟)将一组数据存储在表中。这组数据可以有 1500 条记录。现在,我必须在 Cassandra 表中插入这组数据,使所有这 1500 条记录都与相同的分区键绑定,这意味着所有这 1500 条记录必须存在于同一个节点中。
15 分钟后,一批 1500 条记录将再次以相同的方式存储,但分区键不同。
目标是比较最后两组数据并找到有差异的数据。所以 1500 条记录(现在)将与 1500 条记录(以前)进行比较,我需要找出哪些记录已更改,然后对更改的记录执行一些业务逻辑。
如果我使用 timeuuid 作为分区键,那么我所有的 1500 条记录都将具有不同的 timeuuid,因此不会出现在同一个节点中。
我正在寻找有关在 Cassandra 中维护增量计数器的信息,但似乎没有什么好的方法,此外,在单个节点中维护 COUNTER 表是分布式设计的反模式。
你们能建议我解决这个问题的最佳方法吗?
简而言之,我的要求归结为:
如何将当前数据集与之前的数据集进行比较?
顺便说一句,我将使用 Springboot 连接并将数据写入 Cassandra。
提前致谢 !
解决方案
推荐阅读
- excel - 预定脚本添加到 xlsx 中的新单元格
- python - 带有 Flask 的 Python 中的 Oauth2 从 API 获取 302
- loops - 跟踪算法
- python - 每次添加“ManyRelatedObject”时调用函数
- html - 不变的内容应该在 index.html 或顶级 app.vue 文件中
- python - Jupyter Notebook 图片标题
- php - 我试图在 php 中创建一个循环,吐出下面的内容
- networking - Kubernetes 设置中集群的 pod 中的 Tcpdump(在 Minikube 设置中)
- git - git 在合并冲突后立即说“没有文件需要合并”
- c++ - 在c ++中将对象设置为等于同一类的构造函数是否有效?