string - 无抖动的永远在线模式匹配服务
问题描述
我正在考虑实施一个过滤数据的系统。这依赖于大型数据集的快速模式匹配(我在想 Aho-Corasick)。模式将是固定的字符串。这可能在 1000-100000 条记录的范围内——对于关系数据库来说不是很大,但对于内存中的图来说却很大。性能的关键(无论底层算法如何)是创建参考数据集的适当表示。数据集会随着时间而改变。
我的问题是如何最好地将其构建为解决方案,以便更新数据集不会中断服务的使用。更新不必立即反映给服务客户端。
是否有一种快速的字符串匹配算法,它支持对数据集进行临时更改而无需完全重新编译?
如果做不到这一点,大概我唯一的选择是将前端服务与后端匹配引擎分开/并在我想更改数据集时启动新的后端引擎/切换。
有没有更优雅的解决方案?
解决方案
推荐阅读
- javascript - 如何在 React 应用程序中从 Visual Studio 代码生成缩小的 js 文件
- html - 如何在一行中对齐三个图像
- html - 如果我们有 br 标签,则文本溢出省略号不会在 IE 和 Edge 浏览器中显示
- android - 应用程序使用时长和用户打开应用程序的次数
- python - 硒python中的日期时间抛出错误
- python - Python GCP 从任何区域获取所有实例
- java - App Engine FilterPredicate 在查询字符串时不返回任何内容
- c# - 如何读取带有图像的word文件
- javascript - Angular 6 只需要多个字段中的一个字段
- python - 使用逻辑回归时的内存错误