elasticsearch - 如何使用elasticsearch进行包含/喜欢查询?
问题描述
我想用 elelasticsearch 实现下面的 tsql 查询
declare @searchstring nvarchar (max)
set @searchstring = 'tn-241'
set @searchstring = replace(replace('%'+@searchstring+'%', '-', ''), ' ', '')
SELECT *
FROM [dbo].[Product]
where
replace(replace(shortdescription, '-', ''), ' ', '') like @searchstring or
replace(replace(name, '-', ''), ' ', '') like @searchstring or
replace(replace(number, '-', ''), ' ', '') like @searchstring
为此,我使用关键字标记器和分隔符过滤器和 catenate_all 创建了分析器,如下所示
"search_delimiter": {
"split_on_numerics": "false",
"generate_word_parts": "false",
"preserve_original": "false",
"generate_number_parts": "false",
"catenate_all": "true",
"split_on_case_change": "false",
"type": "word_delimiter",
"stem_english_possessive": "false"
}
"analyzer": {
"searchanalyzer": {
"filter": [
"lowercase"
,
"search_delimiter"
],
"type": "custom",
"tokenizer": "keyword"
},
"Name": {
"analyzer": "searchanalyzer",
"type": "string",
"fields": {
"raw": {
"analyzer": "searchanalyzer",
"type": "string"
}
}
},
"Number": {
"analyzer": "searchanalyzer",
"type": "string",
"fields": {
"raw": {
"analyzer": "searchanalyzer",
"type": "string"
}
}
}
"ShortDescription": {
"analyzer": "searchanalyzer",
"type": "string",
"fields": {
"raw": {
"analyzer": "searchanalyzer",
"type": "string"
}
}
},
结果为
curl -XGET "Index/_analyze?analyzer=searchanalyzer&pretty=true" -d "Original Brother TN-241C Toner Cyan"
{
"tokens" : [ {
"token" : "originalbrothertn241ctonercyan",
"start_offset" : 0,
"end_offset" : 35,
"type" : "word",
"position" : 0
} ]
}
}
所以我需要基本上应用相同的分析器并使用应该进行 instring 搜索的 query_string 或通配符搜索
所以如果我像下面这样搜索
"query": {
"query_string" : {
"fields" : ["Name", "Number", "ShortDescription"],
"query" : "*TonerCyan*"
}
}
它工作正常,但如果我搜索
"query": {
"query_string" : {
"fields" : ["Name", "Number", "ShortDescription"],
"query" : "*Toner Cyan*"
}
}
它不会返回任何结果,这意味着在执行 query_string 之前未应用 searchanalyzer,因为我希望它应该在第二个查询中搜索 TonerCyan,而不是分别搜索 Toner 和 Cyan?第一个问题是为什么这不起作用?第二个是实现上述 tsql 查询的最佳方法是什么?它应该搜索多个字段
解决方案
您可以尝试将搜索字符串放在这样的双引号内,并且应该可以:
{
"query": {
"query_string": {
"fields": [
"Name",
"Number",
"ShortDescription"
],
"query": "*\"Toner Cyan\"*"
}
}
}
此外,您应该知道搜索前缀通配符可能会产生灾难性的性能影响,具体取决于您拥有的数据量。我仍然相信您应该出于这个原因索引 ngram。
推荐阅读
- symfony - Symfony Messenger 监听甚至发送到失败的传输/队列
- reactjs - 在反应表中单独切换多个按钮
- java - 按下后如何保持 JMenuItem 可见?
- sql - 从两个表中选择两个查询
- azure - Azure :: Terraform 在 azure keyvault 机密上失败
- javascript - 为什么这些声明正则表达式的不同方式不会产生相同的结果?
- java - JavaFX WebView:禁用 Websocket
- javascript - JS。数据表中的条件
- python - 将多个属性作为破折号中的字典传递给 hover_data
- azure - 如何解决 azure cosmos 数据库数据获取问题