elasticsearch - Elasticsearch:自定义令牌过滤器
问题描述
由于没有关于该主题的文档,因此理解如何在 Java 中从头开始实现自定义令牌过滤器插件非常复杂。
我想要一个分析器过滤器,它只返回例如数字的标记。
任何想法?
解决方案
现有的过滤器可以做到这一点。例如,keep_types
令牌过滤器可以做到这一点。
如果您利用该<NUM>
类型,您的自定义标记过滤器将只允许数字标记通过并过滤掉所有其他标记。
GET _analyze
{
"tokenizer": "standard",
"filter": [
{
"type": "keep_types",
"types": [ "<NUM>" ]
}
],
"text": "1 quick fox 2 lazy dogs"
}
结果:
[1, 2]
pattern_capture
您也可以使用令牌过滤器获得类似的结果。
但是如果你真的想走 Java 的路,那么你最好是克隆一个现有的分析插件并自己动手。
推荐阅读
- javascript - Lodash 的“无”属性和输入数组
- angular - 在 Angular 中创建虚拟模型
- reactjs - 如何使用 jsdoc 记录 javascript 单元测试文件?
- javascript - 有没有办法用 Javascript 监听控制键(ASCII < 10)事件?
- git - 提取早于指定时间段的 GIT 分支列表
- php - 对于图像的每个像素,它将具有什么像素值?
- sql - Access 2013 - 使用每列的不同标准更新数据表
- mongodb - 如何使用 Mongodb 在 golang 中通过批量更新获取更新的文档 ID
- javascript - 将数组的值填充到复选框的布尔值
- graphics - VB6 支持哪些图像类型?