apache-spark - Spark 集群中的 Hive 查询
问题描述
我需要了解如何在 Spark 集群中执行配置单元查询。它将作为在内存中运行的 Mapreduce 作业运行,或者将使用 spark 架构运行 hive 查询。请澄清。
解决方案
假设您有一个配置了 YARN 和 Spark 的 Hadoop 集群;
Hive 执行引擎由hive.execution.engine
属性控制。根据文档,它可以是mr
(默认)tez
或spark
.
推荐阅读
- hyperledger-fabric - MSP 错误:提供的身份无效:x509:证书由未知权威 Hyperledger Fabric 签名
- python - 更改表未添加列 (pymssql)
- javascript - 将数据从客户端javascript发送到节点js
- wordpress - 将短代码属性传递给 WordPress 远程发布 URL
- sql - 无法在派生表中绑定多个部件标识符
- typescript - 多种类型的接口
- powershell - 停止进程与 TaskKill
- nodatime - 有没有一种非分配方式来获得两个 LocalDateTime 点之间的差异?
- python - 相当于 tensorflow 2.0 中的 tf.contrib.image.transform?
- amazon-web-services - AWS GovCloud 上 docker alpine wildfly 中的 NSS/PKCS11 错误