首页 > 解决方案 > 是否存在用于合并来自两个并行脚本的数据的标准算法?

问题描述

我有两个脚本,它们监听同一个 websocket,并将接收到的包写入数据库。原则上,这些脚本接收相同的包,但可能会有停机时间等等。我现在想将两个流合并为一个可靠的流,删除重复项。

但是,这些包没有时间戳或标识,因此仅通过查看包,无法确定哪个包先出现。不能排除某些包装是故意相同的。包裹到达服务器时会加上时间戳。

有没有标准的、有原则的方法来解决这个问题?

标签: algorithmcomputer-sciencereplicationdatabase-replicationredundancy

解决方案


我建议用 diff 算法解决这个问题。差异算法的答案?可以帮助您了解如何实现它。


推荐阅读