apache-spark - 如何使用 pykafka 消费者从主题中获取数据
问题描述
我不知道如何从 Pykafka 消费者那里获取数据。我什至有问题打印消费者的主题。问题是,无论我对消费者调用什么方法,这个过程都会永远挂起。如果我只是初始化消费者而不使用它,则该过程完成。感谢您提前提供任何帮助。
def getData(spark):
spark.sparkContext.setLogLevel("WARN")
scc = StreamingContext(spark, 1)
topic = "justtopic"
client = pykafka.KafkaClient("localhost:9092")
KAFKA_VERSION = (0, 10)
print("topics", client.topics) <-- this line is working
consumer = KafkaConsumer(
'justtopic', bootstrap_servers = 'localhost:9092',
api_version = KAFKA_VERSION
)
print(consumer.topics()) <-- if i call some function on consumer it hangs forever.
#rdd = kafkaStream.flatMap(lambda line: line.strip().split("\n")).map(lambda strelem: float(strelem))
# print("****** ", rdd.count())
解决方案
推荐阅读
- c# - 基于相同 ID 过滤数据
- php - Composer 更新:缺少请求的 PHP 扩展 ext-http
- reactjs - useEffect 中的 state 总是使用 React Hooks 引用初始状态
- c - 有没有办法在给定 /dev/input/eventX 文件描述符的情况下获取字符设备驱动程序的 struct input_dev ?
- ruby-on-rails - Rails 5 升级打破了延迟任务
- ruby-on-rails - Rails HTTParty 在 2 个不同的 API 中出现相同的 404 响应
- r - R:可以使用成像器加载多个图像以进行 lapply 操作吗?
- sql - 多个 CTE 查询,将单列值分配给局部变量
- neo4j - 使用 py2neo 进行图遍历
- python - Ubuntu 上的 Azure Cli 权限被拒绝错误