solr - 如何从 Solr 的标准分词器中删除字符?
问题描述
我有一个新的 SOLR 索引,其中 Standard Tokenizer 工作得很好。
有一个新用例,我们希望它不被连字符分割,并且我们希望能够索引和搜索en-us
,但它目前被连字符分割。
我们用
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>
有没有办法:
A) 让标准标记器包含连字符,或
B) 使用不同的规则重新创建标准标记器?
解决方案
推荐阅读
- r - 如何从 R extrafontdb 中注销已删除的字体
- c# - Winforms - LinkLabel 显示缩放?
- python - 列表索引必须是整数或切片,而不是 str 错误 Python
- c - 在 C 中使用按位运算的 2 位映射
- timer - 使用 sbcl schedule-timer 和 sly
- java - 在界面中正确使用默认关键字
- c++ - std::bind 不能与 lua_call 互操作
- apache-nifi - 使用 apache-nifi 进行日期转换失败
- php - 在 Laravel 6 上缓慢发送邮件
- flutter - 按下时如何更改图标还根据颤动中的图标更改屏幕?