apache-flink - Apache Flink - 数据集 api - 侧输出
问题描述
Flink 是否支持 Dataset(Batch Api) 中的 Side Outputs 功能?如果不是,从文件加载时如何处理有效和无效记录?
解决方案
你总是可以做这样的事情:
DataSet<EventOrInvalidRecord> goodAndBadTogether = input.map(new CreateObjectIfPossible())
goodAndBadTogether.filter(new KeepOnlyGood())...
goodAndBadTogether.filter(new KeepOnlyBad())...
在某些情况下,另一个合理的选择是继续使用 DataStream API,即使您没有流式源。
推荐阅读
- python - 为 Pandas 组分配唯一 ID,但如果重复则添加一个
- java - c++字符串操作到android studio java
- json - Flutter:在斩波转换器中使用 moor 生成的模型 json 工厂
- fortran - OpenMP 运行时条件 GPU 目标内核执行
- c# - ASP.NET CSHTML 忽略
- python - 如何在 Google Drive 中永久保存一个库并从 Google Colab 中加载它?
- firebase - Flutter Firestore:没有为“Query”类型定义方法“doc”
- javascript - 过滤不同对象内的嵌套数组并返回具有新过滤数组的对象
- node.js - Mongo $push 在它应该只添加 1 时添加了 2 个数组元素
- java - 无法解析“BeanUtils”中的方法“getProperty”