首页 > 技术文章 > Elastic search 字段指定自带分词器

teler 2020-08-12 15:32 原文

版本

ES

5.4.2

自带的几种分词器

分词器解释
standard标准标记器,标准过滤器,小写过滤器,停止过滤器
simple小写的分词器
stop小写标记器,停止过滤器
keyword不分词,内容整体作为一个值
whitespace以空格分词
language以语言分词
snowball标准标记器,标准过滤器,小写过滤器,停止过滤器,雪球过滤器
custom自定义分词。至少需要指定一个 Tokenizer, 零个或多个Token Filter, 零个或多个Char Filter
pattern正则分词

准备

  • 删除之前的索引,否则会报已存在错误

正文

  • fielddata是为了能使用aggs,不需要的可以不加
PUT index名
{
  "mappings":{
    "doc":{
      "properties":{
        "字段名": {
            "type": "指定字段类型,如text",
            "analyzer": "指定分词器,如whitespace",
            "fielddata": true
        },
         "其他字段名": {
           "type": "keyword"
         }
      }
    }
  }
}

推荐阅读