apache-kafka - 组合来自不同 Flink 作业的结果
问题描述
我有 3 个从同一输入流中读取的作业。每个都给出不同的输出如何组合来自不同作业的结果并创建单个 JSON 字符串
示例:{"key":"input_msg", "result_1":"job1_result",...}
我希望避免查询数据库,就好像我将工作规模扩大到会产生负面影响的巨大数字一样。
解决方案
是的,这是可能的
available_topics = List("topic_1", "topic_2")
var streams = collection.mutable.Map[String, DataStream[String]]()
for(a <- 0 until available_topics.size){
streams += (available_topics(a) -> env.addSource(new FlinkKafkaConsumer09(available_topics(a), new SimpleStringSchema(), properties)).map(x => someFunctionThatS(x)))
}
推荐阅读
- python - 如何根据某些字符有效地拆分文本文件?
- java - MicroBatchExecution:查询因错误 UnsatisfiedLinkError 终止:org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z
- java - 使用 SAX 解析器解析大型 Excel 文件的第一列
- node.js - 服务器端安装中不存在 lib 文件夹中的 puppeteer 文件
- java - Spring计划任务运行单独的线程
- java - zip 文件未在 gradle build 中生成
- r - 如何按特征值过滤 mlr3 任务数据集
- python - 嘿,我如何为我在 python 中用 tkinter 编写的 Rock、Paper、Scissor 编写规则?
- arrays - 在 Swift 中获取解析的 JSON 数据的索引
- python-3.x - 仅批处理读取/保存文件夹中的最后一张图像