首页 > 解决方案 > Mongodb/python 计算包含不同值的不同行

问题描述

这是我的问题:

我有一个包含 +100 万个条目的 mongodb 数据库,我必须计算不同的条目。

每个条目都有一个由通讯号和文档号组成的doc_id,这里是一个例子:EGNG9876543219876543219-000.pdf

由4个大写字母和19位数字组成的部分是通讯号码。

问题是每个通信号码都有多个文档(“-000.pdf”部分)。

我试着这样做:

docIds=list(collection.find({}, {"doc_id" : 1,"_id":0}))
comIds=[]
for i in range (docIds.count("doc_id")):
    comIds.append(docIds[i][:-8])
print(len(set(comIds)))

我想知道 mongodb 中是否有办法计算有多少不同的通信号码。

标签: pythonmongodbdistinct

解决方案


推荐阅读