首页 > 解决方案 > 如何从 Solr 的标准分词器中删除字符?

问题描述

我有一个新的 SOLR 索引,其中 Standard Tokenizer 工作得很好。

有一个新用例,我们希望它不被连字符分割,并且我们希望能够索引和搜索en-us,但它目前被连字符分割。

我们用

<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>

有没有办法:

A) 让标准标记器包含连字符,或

B) 使用不同的规则重新创建标准标记器?

标签: solrlucene

解决方案


推荐阅读