azure-cognitive-search - 文档大小调整 Search.Score - 几乎降低评分配置文件分数
问题描述
我们正在使用评分配置文件来驱动相关性并调整分数,即使用评分配置文件中的函数提高属性 isActive 的相关性为 1 x 50,同时通过传递 &searchFields=****** 在索引上搜索特定字段
然而 Search.Score 似乎受到文档大小的高度挤压,较小的大小高分可能是由于 TF-IDF ......
这违背了使用评分配置文件的目的,但是在我们的例子中,我们不希望由于文档大小而影响评分,因为我们正在传递 searchFields。
在 searchFields 未通过的情况下,我们希望根据大小调整分数,即在所有可搜索字段中进行自由格式搜索。
示例搜索查询 -
机构 temps&$count=true&$top=30&$skip=0&searchMode=All&$filter=(CompanyCode eq '13453' and VNumber eq '00023232312016') &scoringProfile=BusinessProfile1&searchFields=VCategory
解决方案
我想知道新的featuresMode 预览功能是否对您有帮助?使用它,您可以逐个字段从搜索查询中获取更多信息,例如 uniqueTokenMatches 和 termFrequency。使用它,您可以根据需要在客户端调整排序。
此外,您是正确的,默认是 TF-IDF 之类的评分,但是,您可能也有兴趣尝试BM25,它虽然不能解决您的要求,但可能更有效地帮助您获得所需的分数.
推荐阅读
- c++ - 理解二元搜索问题中的范围问题
- angular - Angular 10,带有 EventEmitter 的路由器出口输出到 SideNav 内容中的父级
- go - 用作 go 库时如何启用 krakenD 的灵活配置
- json - “未找到转换:类 io.ktor.utils.io.ByteChannelNative”错误使用 Ktor
- python - 如何打印列表项及其类型的先前文本?
- python - 如何在 python 中将 N 个显示的数组(每个数组在视觉上类似于 PNG)转换为 mp4?
- python - 如何在 Python 中删除重复打印?
- linux - 当 intel_iommu=on 时 Linux DMA 32 位 dma_alloc_coherent 错误行为
- java - 转换字符串时的 Java 代码效率
- javascript - 最小化浏览器重绘:javascript中最简单的交集代码不起作用