amazon-s3 - 我可以在交付到 S3 之前在 Kinesis Firehose 中自定义分区吗?
问题描述
我有一个 Firehose 流,旨在从不同来源和不同事件类型中摄取数百万个事件。流应将所有数据作为原始\未更改数据的存储交付到一个 S3 存储桶。
我正在考虑根据嵌入在事件消息中的元数据(如事件源、事件类型和事件日期)在 S3 中对这些数据进行分区。
但是,Firehose 遵循基于记录到达时间的默认分区。是否可以自定义此分区行为以满足我的需求?
更新:已接受的答案已更新为新答案表明该功能于 2021 年 9 月可用
解决方案
自 2021 年 9 月 1 日起,AWS Kinesis Firehose 支持此功能。在此处阅读公告博客文章。
从文档中:
您可以使用 Key 和 Value 字段来指定要用作动态分区键和 jq 查询的数据记录参数以生成动态分区键值。...
从 UI 看它是这样的:
推荐阅读
- sql - 如何从下面的sql表中获取数据?
- asp.net-mvc - 使用 RazorEngine 测试 cshtml 文件的编译
- swiftui - 导航标题问题
- powershell - 将值拆分为两列powershell csv文件
- python - 在python中循环日期时更改month_id
- python - 在 Pyspark 中更好地处理 f.when
- javascript - 如何触发被点击的html元素的动作?
- r - 从 R 中的 car::scatter3d() 中删除组标签
- android - 如何在 Android 中创建标签对象
- delphi - TStreamWriter 锁定文件以供读取