首页 > 解决方案 > 根据来自 Spark Stream 的输入运行 Spark Ba​​tch 任务

问题描述

我有下一个架构:我的 Web 应用程序将 JSON 消息推送到 Kafka 主题。一条消息代表一个 DSL 命令(一种截断的 SQL)。我有一个用于运行单个 DSL 命令的 Spark 任务 - 它从 JSON 读取命令,从 parquet 文件读取数据,根据命令应用聚合并将结果写入 parquet 文件。我想使用 Spark Streaming 来监听 Kafka 主题并在同一个集群上运行批处理任务。但我有几个担忧:

标签: apache-sparkapache-kafkaspark-streaming

解决方案


推荐阅读