apache-spark - 从 Apache Spark 将数据上传到 HBase 的正确方法是什么?
问题描述
我正在编写一个 Spark 作业,该作业从 Hive 读取数据并存储在 HBase 中以进行实时访问。执行器与 HBase 建立连接,插入数据的正确方法是什么。我想过以下两种方法。
哪个更合适或有其他方法吗?
- 将数据直接从 Spark Job 写入 Hbase
- 将数据从 Spark 写入 HDFS,然后将其移动到 Hbase
解决方案
推荐阅读
- greenplum - gpssh-exkeys -f hostfile_exkeys ValueError: 不支持的哈希类型 sha512
- mysql - SQL AVG 按组应用于多个?
- c# - 无法更改其他场景中的游戏对象位置
- javascript - 为什么这个脚本有效?(和其他问题)[JavaScript]
- html - 如何使用 relevel div 高度设置引导图像高度
- sql-server - Kafka JDBC 接收器连接器 - 不支持 USE 语句在数据库之间切换
- android - 满足 if 语句时启动应用程序
- django - 在 Django 中存储聊天消息以获得更好性能的最佳方法是什么
- sql - 获取 SQL 中的空记录
- excel - 查找所选单元格上的最大值