python - Apache Kafka(v2.4.0) - Python 中的 Spark (v2.4.4) 流式集成
问题描述
所以我在不同的 ubuntu 机器上安装了Apache Spark 2.4.4和 Kafka_2.12-2.4.0 。我想从 IOT 设备中获取所有数据,输入 kafka,然后使用 spark-streaming,输入 spark。我想在 python 中完成这一切。根据此链接:https ://spark.apache.org/docs/2.4.4/streaming-kafka-integration.html 由于我的 Kafka 版本超过 0.10,我不能使用 python,因为没有显示示例Python。是这样吗?或者是否有任何可能的方法来仅使用 python 进行集成?
解决方案
没有为python显示示例
这并不意味着它不可能。
spark.readStream().format("kafka").option(...)
仍然适用于 Python,您可以在其他地方搜索大量“结构化流 Python”示例
推荐阅读
- amazon-web-services - 使用 lambda 函数通过 spark 步骤创建 AWS EMR 集群失败,并显示“本地文件不存在”
- r - 如何在循环中粘贴对象的名称?
- sql - SQL Join Same Table 并创建单行结果以完成 NULL 值
- jquery - Bootstrap:切换扩展但无法关闭
- javascript - 仅在 shift-select 时保持 select2 打开
- javascript - React Native - 具有并行平移和缩放的动画
- netsuite - 已保存搜索以提取日期发票已全额支付
- r - 循环以识别 Dataframe 中的数据位置,并填充到新的 Dataframe (R)
- ruby - Ruby 套接字在第二次读取时不返回数据
- python - 在 conda/pip 中安装单个文件包需要多余的 import 语句