apache-flink - 当使用保存点取消 flink bucketingsink 作业时,文件保留为 .pending
问题描述
我们正在使用 BucketingSink 将压缩文件(由“\n”分隔)写入 hdfs。但是,一旦我们手动取消作业,文件的最后一行将被截断。如果我们使用保存点取消作业,一切正常,但文件仍处于 .pending 状态。如何使这些文件完成重命名?非常感谢!
解决方案
如果 .pending 文件在检查点列表中,您只需重新启动作业,然后 .pending 将重命名为最终名称以提交。如果 .pending 文件不在 checkpointed 列表中,即 .pending 文件可以被丢弃,flink 不会对其做任何事情,忽略它们是个好主意。
尝试阅读这篇博文,然后阅读BucketingSink的源代码,你就会知道为什么以及如何做到这一点。
推荐阅读
- spring-boot - Redis & Spring Boot 集成与 K8S 错误
- php - 在线表单中的电子邮件标题显示不正确
- c# - 如何使用 AspNetCoreModuleV2 设置 VS 2017?
- javascript - 我正在尝试创建一个机器人,我希望我的所有消息都包含在 JS 中的同一个 div 中
- php - 如何检查从时间戳过去了多少天 - 计算午夜的天数
- docker - 可以从主机访问 docker 容器,但这应该是不可能的?
- google-app-engine - 使用 appcfg.py 下载 App Engine 源代码时出错
- javascript - 如何使用 React Spring 更改图标?
- android - 在客户端代码中使用 FCM 服务器密钥的替代方法是什么?
- python - 获取python列表中下一个非零值的索引