Azure 认知搜索突出显示修剪

Azure Cognitive Search highlight trimming

这是 Azure 认知搜索 团队的问题。

目前,我们经常面临 Azure 认知搜索中的命中突出显示机制的问题。 突出显示的最大大小限制为 1000 个字符,并且不能使用 API 参数增加。

问题是,我们经常看到一个高亮显示,其中根本没有任何关键字高亮显示,而这个 'highlights' 的长度是 1,000,很可能它们只是被裁剪以适合 1,000字数限制。因此,如果点击实际上没有突出显示,那么我们的用户看到突出显示没有多大意义。

在没有任何逻辑的情况下修剪高光有什么意义?因为有时我们甚至会遇到这样的情况,即高亮显示在匹配的中间被裁剪掉,换句话说,高亮显示以文本结尾:' ... 一些高亮显示的文本 [match]keyword[/ma'。如您所见,结束标记被裁剪了,我们看到的是“[/ma”而不是“[/match]”。

你希望别人如何使用它? ... 有什么解决方法吗?

我是 Azure 认知搜索团队的一名工程师。我们知道这些带有高光修剪的边缘情况,对于对您的用例造成的负面影响,我们深表歉意。这是最近的一项更改,旨在作为解决因突出显示极大片段而引起的服务稳定性问题的权宜之计。

我们正在努力全面升级命中高亮体验,将于2020年7月15日面向客户开放。更多详情可查看here。但是,新体验仅适用于当天之后创建的服务。对于较旧的服务,目前唯一的解决方法是对字段文本进行预处理,使每个句子的长度(突出显示边界)小于 1000。

请随时通过 azuresearch_contact@microsoft.com 与 PG 联系,提供有关您的情况的更多详细信息,我们将尽力解决您的问题。