lucene - Lucene:TokenFilter 替换字符并生成新的标记作为同义词
问题描述
我想像这样映射字符:
private static final Map<String, String> MAP = Map.of("CH", "X",
"X", "CH",
"I", "Y",
"Y", "I",
"S", "Z",
"Z", "S",
"F", "PH",
"PH", "F");
因此,例如,XANTION 被标记为 CHANTION,PHYTOVEIN 被标记为 FITOVEIN,保留原始标记。
这些是药物名称,它会为它们生成“同义词”,在分析搜索词时使用。
我可以使用任何现有的令牌过滤器吗?
解决方案
推荐阅读
- windows - GDB 编译在 Windows 下使用 MSYS2 失败
- validation - 所需的 YII 验证规则 - 所需规则的工作原理
- vue.js - 组件中的 Vuejs 组件:class="active" [小时数天]
- javascript - 将父值替换为其子值
- linux - 如何从存档目录中删除文件
- python - TypeError: can only concatenate str (not "int") to str (我认为这不应该发生)
- python - Python socket 监听特定接口
- google-cloud-platform - 如何限制具有多个项目访问权限的人通过另一个项目的计费查询一个项目?
- python-3.x - numpy.fft.fft 中的 sygnal 是什么
- python - 尽管通过 InventoryManager 获取正确的库存,Ansible 在本地运行所有任务