首页 > 解决方案 > 处理来自 Solr 副本的不同分数

问题描述

在 Solr 的默认评分实现中,在计算分数时仍会考虑已删除的文档。分片副本上的已删除文档数量不保证相同,因此不同的副本可能会给出略微不同的分数。

我们目前使用的设置有 8 个分片,每个分片有 2 个副本。对于分页搜索结果,排序顺序是确定性的,以避免在分页时丢失文档/跳过文档,这一点至关重要。

想到的可能的处理方法是使用不同的评分算法或尝试要求使用系统的工具将查询发送到为其第一个查询提供服务的相同副本(如果该副本稍后出现,这显然会出错下!)。由于问题是副本之间的评分不同,而不是分片之间的评分不同,我认为 Solr 的分布式 IDF 设置没有帮助。

标签: solrsolrcloudtf-idf

解决方案


推荐阅读