首页 > 解决方案 > 我们如何将数据从 MongoDB 摄取到 H2o 集群?

问题描述

我的本地 MongoDB 数据库中有大约 2GB 的数据,数据库中有一个集合。我想将所有这些数据从 MongoDB 数据库提取到独立的 H2o 集群中,以构建机器学习模型。我正在使用 python 在 H2o 中进行数据分析。你能告诉我该怎么做吗?

标签: mongodbh2o

解决方案


一种可能的解决方案是使用 spark-mongodb 连接器和将 DataFrame 转换为 H2OFrame 将数据加载到 spark 集群中。详情请查看http://docs.h2o.ai/sparkling-water/2.2/latest-stable/doc/tutorials/spark_h2o_conversions.html#converting-a-dataframe-into-an-h2oframe

之后使用苏打水分析数据。


推荐阅读