apache-spark - 从 Azure Eventhub => StreamingQueryException 读取 Spark:输入字节数组有错误的 4 字节结束单元
问题描述
我正在尝试使用 Spark/Python 收集 Azure Eventhub 消息。每次,我都会收到异常“StreamingQueryException:输入字节数组有错误的 4 字节结束单元”
请问有什么想法吗?
conf = {}
conf["eventhubs.connectionString"] = "Endpoint=sb://XXXXXXXXX.servicebus.windows.net/;SharedAccessKeyName=RootManageSharedAccessKey;SharedAccessKey=XXXXXXXXXXXXX=;EntityPath=XXXXXX"
read_df = spark.readStream.format("eventhubs").options(**conf).load()
stream = read_df.writeStream.format("console").start()
stream.awaitTermination()
解决方案
请注意,对于 2.3.15 及以上版本,您需要对配置字典中的连接字符串进行加密:
ehConf['eventhubs.connectionString'] = sc._jvm.org.apache.spark.eventhubs.EventHubsUtils.encrypt(connectionString)
推荐阅读
- python - 从 Geotiff 二进制图像中删除单个像素
- c++ - 不同地区之间的问题
- python - 在 Python 中使用 for 循环删除图形标签
- r - 这种日期转换最聪明的方法是什么?
- delphi - 数据保存后清除TEdit中的所有数据
- javascript - 需要堆栈:\\我从未听说过的错误
- sql - 如何使用 2 WITH 子句在 Athena 中创建表?还是有替代方案?
- spring-boot - Hystrix 隔离策略 :: Semaphore 的替代方案
- rest - 如何在 Freeradius 访问请求中发送额外的 IETF AVPS?
- node.js - AWS Dynamodb 文档客户端 UpdateCommand