solr - Solr 停用词没有被删除
问题描述
我使用如下模式和字段,但是一旦文档被索引,停用词就不会从文档中删除
<fieldType name="text_en" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
<filter class="solr.PorterStemFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="English"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.StandardTokenizerFactory"/>
<filter class="solr.SynonymGraphFilterFactory" expand="true" ignoreCase="true" synonyms="synonyms.txt"/>
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
<filter class="solr.PorterStemFilterFactory"/>
<filter class="solr.SnowballPorterFilterFactory" language="English"/>
</analyzer>
</fieldType>
场地
<field name="ad_title" type="text_en"/>
但仍然没有从标题中删除停用词
停用词表
# Standard english stop words taken from Lucene's StopAnalyzer
a
an
and
are
as
at
be
but
by
for
if
in
into
is
it
no
not
of
文档中可用的示例标题
"ad_title":"Aluminum Foil And Baking Paper Rewinding Machine",
解决方案
推荐阅读
- python - 无法在字符串上的 python 上执行 Mysql 查询,因为反引号/严重导致冲突
- css - 有没有办法取消在媒体查询中设置为某个元素的所有样式属性,而无需再次覆盖它们?
- python - 如何将多个值附加到 numPy 数组?
- excel - Excel-VBA:将文件夹资源管理器添加到工作表
- c# - ASP.NET Core 文件上传表单绑定问题
- javascript - 将 js 文件集成到 Anuglar
- android - Firebase 在 ConnectionTracker bindService 上抛出 NullPointerException
- vue.js - 在从本地存储恢复 Vuex Store 之前执行的中间件
- twig - 带有变量的 Twig 模板部分
- excel - 在vba中合并pdf文件