mongodb - 执行聚合时有没有办法对来自多个文档的结果进行分组
问题描述
我是 mongo 的新手,并尝试执行聚合查询来计算给定文档的最小/最大时间戳。
样本文件如下 -
{
"_id" : ObjectId("5c9cd93adddca9ebb2b3fcba"),
"frequency" : 5,
"s_id" : "30081993",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),
"values" : {
"1547439900000" : {
"number_of_values" : 3,
"min_value" : 32.13,
"max_value" : 81.42
},
"1547440200000" : {
"number_of_values" : 3,
"min_value" : 48.08,
"max_value" : 84.52
},
"1547440500000" : {
"number_of_values" : 2,
"min_value" : 27.39,
"max_value" : 94.64
}
}
}
{
"_id" : ObjectId("5c9cd851dddca9ebb2b3f2ac"),
"frequency" : 5,
"s_id" : "27061995",
"timestamp" : NumberLong(1546300800000),
"date" : ISODate("2019-01-01T00:00:00.000Z"),
"values" : {
"1547539900000" : {
"number_of_values" : 31,
"min_value" : 322.13,
"max_value" : 831.42
},
"1547540200000" : {
"number_of_values" : 3,
"min_value" : 418.08,
"max_value" : 8114.52
},
"1547740500000" : {
"number_of_values" : 2,
"min_value" : 207.39,
"max_value" : 940.64
}
}
}
我提出了以下适用于单个文档的查询。
db.testdb.aggregate([
{
$match: {
"s_id": "30081993",
"frequency": 5,
}
},
{
$project: {
_id: 1,
valuesarray: {
$objectToArray: "$values"
}
}
},
{
$unwind: "$valuesarray"
},
{
$group: {
"_id": "",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
}
]);
输出如下
{
"_id" : "",
"min_timestamp" : "1547439900000",
"max_timestamp" : "1547440500000"
}
我想要一个聚合查询,它可以计算时间戳的最大值/最小值,但对于多个文档,即我想在$match阶段使用$in运算符并获取所有 s_id 的最小值/最大值。这可能吗?
预期的 :
{
"_id" : "30081993",
"min_timestamp" : "1547439900000",
"max_timestamp" : "1547440500000"
}
{
"_id" : "27061995",
"min_timestamp" : "1547539900000",
"max_timestamp" : "1547740500000"
}
解决方案
是的,只需进行少量更改即可使这项工作适用于多个文档。
在$match
阶段,指定您的$in
查询:
$match: {
"s_id": { $in : [ "30081993", "27061995" ] },
"frequency": 5,
}
在$project
阶段,重命名s_id
为_id
,以确保我们保持s_id
与每个文档的关联:
$project: {
_id: "$s_id",
valuesarray: {
$objectToArray: "$values"
}
}
在$group
阶段,按_id
(最初s_id
)分组,以确保我们在计算$min
/之前正确地将时间戳分组在一起$max
:
$group: {
"_id": "$_id",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
整个管道:
db.testdb.aggregate([
{
$match: {
"s_id": { $in : [ "30081993", "27061995" ] },
"frequency": 5,
}
},
{
$project: {
_id: "$s_id",
valuesarray: {
$objectToArray: "$values"
}
}
},
{
$unwind: "$valuesarray"
},
{
$group: {
"_id": "$_id",
"min_timestamp": {
$min: "$valuesarray.k"
},
"max_timestamp": {
$max: "$valuesarray.k"
}
}
}
]);
推荐阅读
- angular - 导航方法 RouterLink 在 Angular 10 中不起作用
- javascript - 在 React 脚本中,使用 '/'
- python - EOFError:使用 SSH 的子进程时读取行错误时出现 EOF
- android-studio - 这需要启用不可为空的语言功能 - Dart 不可为空的语法错误
- wordpress - 允许用户输入文本然后下载的 WP 插件
- java - 由于 jdbc 准备语句执行 WCS,WAS 挂起 WSVR0605W
- c++ - 如何通过哈希匹配boost multi_index_container中的nocase c-string
- javascript - 在 React 中使用索引渲染数组元素
- sql-server - 对象“aaa”、数据库“bbb”、模式“dbo”的 SELECT 权限被拒绝
- google-chrome - Office.context.ui.messageParent 在 Chrome 和 Firefox 中不起作用