版本
ES
5.4.2
自带的几种分词器
分词器 | 解释 |
---|---|
standard | 标准标记器,标准过滤器,小写过滤器,停止过滤器 |
simple | 小写的分词器 |
stop | 小写标记器,停止过滤器 |
keyword | 不分词,内容整体作为一个值 |
whitespace | 以空格分词 |
language | 以语言分词 |
snowball | 标准标记器,标准过滤器,小写过滤器,停止过滤器,雪球过滤器 |
custom | 自定义分词。至少需要指定一个 Tokenizer, 零个或多个Token Filter, 零个或多个Char Filter |
pattern | 正则分词 |
准备
- 删除之前的索引,否则会报已存在错误
正文
- fielddata是为了能使用aggs,不需要的可以不加
PUT index名
{
"mappings":{
"doc":{
"properties":{
"字段名": {
"type": "指定字段类型,如text",
"analyzer": "指定分词器,如whitespace",
"fielddata": true
},
"其他字段名": {
"type": "keyword"
}
}
}
}
}