首页 > 解决方案 > 无抖动的永远在线模式匹配服务

问题描述

我正在考虑实施一个过滤数据的系统。这依赖于大型数据集的快速模式匹配(我在想 Aho-Corasick)。模式将是固定的字符串。这可能在 1000-100000 条记录的范围内——对于关系数据库来说不是很大,但对于内存中的图来说却很大。性能的关键(无论底层算法如何)是创建参考数据集的适当表示。数据集会随着时间而改变。

我的问题是如何最好地将其构建为解决方案,以便更新数据集不会中断服务的使用。更新不必立即反映给服务客户端。

是否有一种快速的字符串匹配算法,它支持对数据集进行临时更改而无需完全重新编译?

如果做不到这一点,大概我唯一的选择是将前端服务与后端匹配引擎分开/并在我想更改数据集时启动新的后端引擎/切换。

有没有更优雅的解决方案?

标签: stringalgorithmarchitecturestring-matching

解决方案


推荐阅读