elasticsearch - 聚合桶的总 doc_count 是否可能大于总命中值?
问题描述
在我的一个弹性搜索查询中,我正在执行查询+聚合,我发现桶的 doc_count 总数大于命中总数。(在这个例子中,它的总点击量为2085697与3071915总桶 doc_counts。)这是正常的吗?以前我假设总命中数总是 = 总桶 doc_counts,或者如果在某些条目中找不到聚合中精确的字段名称,则总命中数会更大。
解决方案
如果您要聚合的字段包含一组值,那绝对是可能的。
例如,假设您有以下文档:
{
"result_type": [1, 2]
}
如果您在该result_type
字段上进行聚合,您将得到以下响应,即hits.total.value = 1
(即一个文档),但有两个带有doc_count = 1
.
{
"took" : 2,
"timed_out" : false,
"_shards" : {
"total" : 1,
"successful" : 1,
"skipped" : 0,
"failed" : 0
},
"hits" : {
"total" : {
"value" : 1,
"relation" : "eq"
},
"max_score" : null,
"hits" : [ ]
},
"aggregations" : {
"resultType" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [
{
"key" : 1,
"doc_count" : 1
},
{
"key" : 2,
"doc_count" : 1
}
]
}
}
}
推荐阅读
- c++ - VSCode C/C++ Intellisense 是否完整的类成员?
- kotlin - 我将如何为模块提供动态令牌?
- apache-kafka - Spring kafka 中的事务
- javascript - 如何确定Javascript中项目网格中选择范围之间的重叠
- javascript - node.js 生成响应时出错。TypeError:response.json 不是函数
- php - PHP分页活动页码未突出显示
- javascript - 获取有问题的反应组件方法
- multithreading - 没有大量内存分配的 cython 的 prange 中的线程局部数组
- python - Paho MQTT 不适用于 Flask(Google 应用引擎)
- neural-network - 使用 keras 绘制 Roc 曲线