首页 > 解决方案 > 如何在通过 withPipeline 功能使用 mongospark 连接器查询 mongo 时使用适当的索引?

问题描述

我正在尝试从 mongodb 加载大量数据。数据量以百万计。因此,使用适当的索引提取这些数据并并行查询 mongo 是有意义的。这就是为什么要进行批量读取,我使用的是 mongo spark。如何在通过 withPipeline 功能使用 mongospark 连接器查询 mongo 时使用适当的索引?

另外,我正在探索“com.mongodb.reactivestreams.client.MongoCollection”。如果可能的话,有人可以对此有所了解吗?

标签: mongodbapache-spark

解决方案


推荐阅读