首页 > 解决方案 > C# 不转义 Lucene 查询中的搜索运算符

问题描述

根据https://docs.microsoft.com/en-us/azure/search/query-lucene-syntax特殊字符应该被转义:

需要转义的特殊字符包括: + - & | !( ) { } [ ] ^ " ~ * ? : \ /

问题是其中一些是搜索运算符:+ - | ”。

与引号 " 相同的问题。当它们是运算符时,我需要区分大小写:"banking account" 和banking account(不带引号)是2个不同的查询。

例如,报价可能是英寸:英寸(十英寸)。

要是有这样的就好了:

string searchPhrase = banking -account // no need to escape because "-" is a search operator

string searchPhrase = "banking :-\) sucks" // needed to escape because "-" is not a search operator

string searchPhrase = bank "account opening" // no needed to escape 

string searchPhrase = 100\" // inches not a search operator must be escaped

上面写的内容是用针对 Azure 搜索索引的搜索查询进行测试的:

“search=banking -account”“search=banking \-account”(带有转义的“-”)产生不同数量的结果。

有没有办法以编程方式决定特殊字符何时需要转义,或者我在这里遗漏了一些明显的东西?

标签: c#.netazurelucene.netazure-cognitive-search

解决方案


如果您使用的是standard.lucence,大多数特殊字符将充当分隔符。而且您的数据不会与特殊字符一起索引。您可以参考此链接并测试您的数据如何使用不同的分析器进行索引。

https://docs.microsoft.com/en-us/rest/api/searchservice/test-analyzer

您是否希望用户输入运算符?如果不是,您可以转义用户输入的所有特殊字符。


推荐阅读