python - 从 Kafka 主题中提取特定数据
问题描述
我正在 Twitter 上进行实时流式传输,想知道有没有办法从 Kafka 主题中仅提取消息和某些值?
解决方案
您可以使用 ksqlDB 来执行此操作。例如:
ksql> CREATE STREAM TWEETS WITH (KAFKA_TOPIC='twitter_01', VALUE_FORMAT='Avro');
ksql> SELECT USER->SCREENNAME, TEXT FROM TWEETS WHERE TEXT LIKE '%cool%' EMIT CHANGES;
+-------------------+------------------------------------------------------------------------------------------+
|USER__SCREENNAME |TEXT |
+-------------------+------------------------------------------------------------------------------------------+
|MobileGist |This is super cool!! Great work @houchens_kim! |
如果需要,您还可以使用此结果构建一个新主题
ksql> CREATE STREAM COOL_TWEETS AS SELECT USER->SCREENNAME, TEXT FROM TWEETS WHERE TEXT LIKE '%cool%' EMIT CHANGES;
由于您标记了 Python,因此值得指出的是,您可以使用 Python 的 REST API 调用 ksqlDB。这是一个例子。
推荐阅读
- python - Pandas 如何将数据框中的所有值保存到 csv 中?
- php - 使用 Dom 查找脚本变量的值
- c++ - 在两个结构之间共享一个数组
- python - 带有许多空格的不和谐用户名 + 带有更多参数的命令
- python - 为什么 matplotlib.animation 大窗口比小窗口慢?
- typescript - 为什么这个箭头函数与签名相同的非箭头函数不一样?
- python - 将共享的“参数”模块合并到具有多个子模块的python程序中?
- react-native - 更改 react-native-elements 中的输入图标颜色
- node.js - AWS EC2 实例(生产)中的 PostGres 超时错误
- php - 此登录代码的 mysqli 等效项是什么?