mongodb - 我们如何将数据从 MongoDB 摄取到 H2o 集群?
问题描述
我的本地 MongoDB 数据库中有大约 2GB 的数据,数据库中有一个集合。我想将所有这些数据从 MongoDB 数据库提取到独立的 H2o 集群中,以构建机器学习模型。我正在使用 python 在 H2o 中进行数据分析。你能告诉我该怎么做吗?
解决方案
一种可能的解决方案是使用 spark-mongodb 连接器和将 DataFrame 转换为 H2OFrame 将数据加载到 spark 集群中。详情请查看http://docs.h2o.ai/sparkling-water/2.2/latest-stable/doc/tutorials/spark_h2o_conversions.html#converting-a-dataframe-into-an-h2oframe
之后使用苏打水分析数据。
推荐阅读
- macos - 将动态库链接到 Netbeans 平台项目
- python - 一起使用多个选项或根本不使用
- neural-network - CNTK 发送有关“sequence.gather”运算符的错误
- model-view-controller - ASP.NET MVC 网站路线图不起作用
- php - Laravel ModelNotFoundException:没有模型[]的查询结果
- flutter - 限制flutter中的整体缓存大小
- excel - 如何使用树视图将文件从 Outlook 拖放到 Excel 用户窗体?
- xamarin.forms - 使用 .HeightRequest 后如何检测 SizeChanged 事件
- reactjs - Jest Unexpected Identifier 需要
- c++ - 复制构造函数不是深度复制,返回错误,数组为空