首页 > 解决方案 > Python 连接到 EMR 上的 Hive

问题描述

有没有办法通过 Python 连接到 AWS EMR 集群上的 Hive 表?

我一直在尝试几个包,比如 pyhive、ibis 和 impyla 等等,但没有运气。我已经尝试使用我在 PuTTy 中使用的确切信息来 ssh,但仍然不断收到错误。

在腻子中:

主机名:(用户名)@(EMR 的主公共 DNS)

端口:22

验证:使用 .ppk 文件

电子病历信息

from pyhive import hive
conn = hive.Connection(host = "(Master public DNS of EMR)",
                       port = 22, username = '(username)', database = '(database)')

这是我得到的错误:

TTransportException: Could not start SASL: b'Error in sasl_client_start (-4) SASL(-4): no mechanism available: Unable to find a callback: 2'

我也应该使用 .ppk 文件吗?

标签: python-3.xhiveamazon-emr

解决方案


推荐阅读