首页 > 解决方案 > 在 Kafka Connect 中从一条消息写入多个条目

问题描述

如果在一个主题上我收到某种格式的消息,这些消息代表相同结构的列表(例如 JSON 列表或 protobuf 中的重复字段),我可以配置 Kafka Connect 以将列表中的每个条目写为单独的行(比如在镶木地板中) HDFS 或 SQL 数据库中的文件)?这是否可能仅使用捆绑的转换器/连接器?

即我可以使用每条 Kafka 消息来表示数千条记录,而不是发送数千条单独的消息吗?

使用 Kafka Connect 实现这一目标的简单方法是什么?

标签: hadoopapache-kafkahdfsapache-kafka-connect

解决方案


捆绑的消息转换只能进行一对一的消息操作。因此,如果您希望 Connect 将其作为单独的记录写出,则必须以某种方式(直接或通过流处理应用程序)显式生成这些扁平列表。

或者,如果适用,您也可以使用 Hive 或 Spark 来扩展该列表以供以后处理。


推荐阅读