python - PyMongo 查询给了我一个嵌套的 DataFrame
问题描述
我对一个非常大的数据集执行聚合。这是我的代码:
pipeline = [{"$match": {"Name_md_group": "ZEITUNGEN"}}, {"$group": {"_id": {"Name_freq": "$Name_freq"}, "total": {"$sum": "$Cost"}}}]
result = pd.DataFrame(list(collection.aggregate(pipeline)))
结果:
_id total
0 {'Name_freq': 'WOECHENTLICH FUENFMAL'} 2.074940e+07
1 {'Name_freq': 'SONSTIGE'} 2.284889e+07
2 {'Name_freq': 'WOECHENTLICH'} 8.522535e+07
3 {'Name_freq': 'TAEGLICH'} 3.700943e+07
4 {'Name_freq': 'WOECHENTLICH SECHSMAL'} 1.489394e+09
不知何故,我找回了一个嵌套对象?为什么会这样,有没有办法摆脱它?列名_id
应该是Name_freq
. 谁能帮我?
解决方案
将表达式直接放入_id
并添加一个额外的$project
阶段。
pipeline = [
{ $match: { Name_md_group: "ZEITUNGEN" } },
{ $group: { _id: "$Name_freq", total: { $sum: "$Cost" } } },
{ $project: { Name_freq: "$_id", _id: 0, total: 1 }}
]
推荐阅读
- c# - 如何使用输入(文本)控件将日期值从日期选择器存储到数据库中
- botframework - MS 机器人回复两次
- javascript - 如何根据输入的数字使进度条值增加
- django - django JSONField 正则表达式
- javascript - 如何在按钮中嵌入我的功能以在点击时进行操作?
- java - 提取模式中的动态值以将其放入另一个模式中
- excel - Excel依赖列表
- sharepoint - OneDrive for Business:使用 Microsoft 图形客户端搜索项目始终返回异常“Microsoft.SharePoint.Client.ResourceNotFoundException”
- javascript - Wordpress wp_list_pages 将“current_page_item”显示为第一个元素
- microsoft-graph-api - Onenote Graph API 删除表格替换时的样式和数据标签