首页 > 解决方案 > Lucene:TokenFilter 替换字符并生成新的标记作为同义词

问题描述

我想像这样映射字符:

private static final Map<String, String> MAP = Map.of("CH", "X",
                                                      "X", "CH",
                                                      "I", "Y",
                                                      "Y", "I",
                                                      "S", "Z",
                                                      "Z", "S",
                                                      "F", "PH",
                                                      "PH", "F");

因此,例如,XANTION 被标记为 CHANTION,PHYTOVEIN 被标记为 FITOVEIN,保留原始标记。

这些是药物名称,它会为它们生成“同义词”,在分析搜索词时使用。

我可以使用任何现有的令牌过滤器吗?

标签: lucene

解决方案


推荐阅读