首页 > 解决方案 > Azure 认知搜索突出显示修剪

问题描述

这是Azure 认知搜索团队的问题。

目前,我们经常面临 Azure 认知搜索中的 Hit-Highlighting 机制的问题。突出显示的最大大小限制为 1000 个字符,并且不能使用 API 参数增加。

问题是,我们经常看到一个亮点,其中根本没有突出显示任何关键字,而且这个“亮点”的长度是 1,000,很可能它们只是被裁剪以适应 1,000 个字符的限制。因此,如果点击实际上没有突出显示,我们的用户看到突出显示没有多大意义。

在没有任何逻辑的情况下修剪高光有什么意义?因为有时我们甚至会遇到高亮在匹配的中间被裁剪的情况,换句话说,高亮以文本结尾:' ... some highlight text [match]keyword[/ma'。如您所见,结束标签被裁剪,我们看到的是 '[/ma' 而不是 '[/match]'。

你希望有人如何使用它?...有什么解决方法吗?

标签: azureazure-cognitive-searchhit-highlighting

解决方案


我是 Azure 认知搜索团队的一名工程师。我们知道这些带有高光修剪的边缘案例,并为对您的用例造成的负面影响表示歉意。这是最近的一项更改,旨在作为一种权宜之计,以解决因突出显示超大片段而引起的服务稳定性问题。

我们正在努力全面升级热门高亮体验,并将于 2020 年 7 月 15 日起向客户提供。更多详情可在此处找到。但是,新体验仅适用于当天之后创建的服务。对于较旧的服务,目前唯一的解决方法是预处理字段文本,使每个句子的长度(突出显示边界)小于 1000。

请随时与 PG 联系,azuresearch_contact@microsoft.com详细了解您的方案,我们将尽最大努力缓解您的问题。


推荐阅读