首页 > 解决方案 > Solr 停用词没有被删除

问题描述

我使用如下模式和字段,但是一旦文档被索引,停用词就不会从文档中删除

<fieldType name="text_en" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
      <tokenizer class="solr.StandardTokenizerFactory"/>
      <filter class="solr.LowerCaseFilterFactory"/>
      <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
      <filter class="solr.PorterStemFilterFactory"/>
      <filter class="solr.SnowballPorterFilterFactory" language="English"/>
    </analyzer>
    <analyzer type="query">
      <tokenizer class="solr.StandardTokenizerFactory"/>
      <filter class="solr.SynonymGraphFilterFactory" expand="true" ignoreCase="true" synonyms="synonyms.txt"/>
      <filter class="solr.LowerCaseFilterFactory"/>
      <filter class="solr.StopFilterFactory" words="stopwords.txt" ignoreCase="true"/>
      <filter class="solr.PorterStemFilterFactory"/>
      <filter class="solr.SnowballPorterFilterFactory" language="English"/>
    </analyzer>
  </fieldType>

场地

 <field name="ad_title" type="text_en"/>

但仍然没有从标题中删除停用词

停用词表

# Standard english stop words taken from Lucene's StopAnalyzer
a
an
and
are
as
at
be
but
by
for
if
in
into
is
it
no
not
of

文档中可用的示例标题

"ad_title":"Aluminum Foil And Baking Paper Rewinding Machine",

标签: solrstop-words

解决方案


如评论所述,您应该从 Solr 管理仪表板的 Analysis 选项中测试每个字段。用于查询和索引选项。示例片段如下

在此处输入图像描述

首先选择相应的字段,然后在搜索栏中编写示例查询。


推荐阅读