etl - 如何在输入中创建组并在 Talend 中的每个组中选择特定行?
问题描述
我正在研究 Talend 转换过程(我们使用的是 Talend 6.4)。,我不知道如何实现当前的要求。
我有一个输入包括:
- 两列是我的组键(帐户和产品),但不是唯一的(相同的帐户 x 产品对可能出现在多行中)
- 标准列(合同结束日期),这将帮助我决定要为每个组保留哪一行
- 一些需要传递到下一个处理步骤的“尾部”数据(合同号)
要执行的规则是:
- 每组只保留一个记录
- 所选记录必须是没有结束日期的记录,或者,如果所有记录都有结束日期,则具有最大的结束日期
- 选择的记录可以是随机的,以防出现平局
我想首先做以下事情:
- 按帐户、产品、结束日期排序(首先为空)
- 在每个组中“选择第一”
但我不够熟练,无法知道 Talend 中是否存在第二个转换。
问候,
皮埃尔
解决方案
推荐阅读
- python - 从字符串列表中提取特征
- python - 如何将多个页面的抓取数据收集到一个列表中?
- html - Outlook 电子邮件中完全可点击的按钮问题
- python - pip 安装不工作。无法从“pip._vendor.pkg_resources”(未知位置)导入名称“Requirement”
- angular - laravel-echo 该路由不支持 POST 方法
- algorithm - 计算机视觉、圆检测算法
- amazon-web-services - 使用 mup-aws-beanstalk 运行“mup deploy”会导致“无法加载插件 mup-aws-beanstalk ReferenceError:regeneratorRuntime 未定义”
- dataframe - 从每日数据的 DataFrame 中绘制每周数据
- java - 带有非空模拟对象的 InjectMock?
- python - 删除子列表中位于特定索引处的所有元素 - python 2