首页 > 解决方案 > Flink Streaming 应用程序以 parquet 格式写入 s3

问题描述

我正在开发一个 Flink 流应用程序,它使用来自 kafaka/kinesis 的消息,在处理它们之后,它必须每隔 5 分钟以 parquet 格式将输出写入 S3。

请提出一种方法来实现这一点,因为我面临很多问题。

目前我正在使用 Flink 1.4.2,因为我正在考虑将它部署在 AWS EMR 5.15 集群上。

方法已经尝试过 - 我使用了模块“flink-s3-fs-hadoop”和 parquet api 和 flink“BucketingSink”

标签: amazon-s3streamingapache-flinkparquet

解决方案


推荐阅读