首页 > 解决方案 > 从 Apache Spark 将数据上传到 HBase 的正确方法是什么?

问题描述

我正在编写一个 Spark 作业,该作业从 Hive 读取数据并存储在 HBase 中以进行实时访问。执行器与 HBase 建立连接,插入数据的正确方法是什么。我想过以下两种方法。

哪个更合适或有其他方法吗?

  1. 将数据直接从 Spark Job 写入 Hbase
  2. 将数据从 Spark 写入 HDFS,然后将其移动到 Hbase

标签: apache-sparkapache-spark-sqlhdfshbase

解决方案


推荐阅读