datastage - 从数据阶段工具中的输入获得输出
问题描述
我有一个包含数据的输入文件
GGN,IBM
BNGLR,IBM
GGN, HCL NOIDA,
HCL
BNGLR,HCL
我想要像
IBM、GGN、BNGLR
HCL、GGN、NOIDA、BNGLR 这样的输出
使用数据阶段工具。
提前致谢
解决方案
您没有向我们提供太多细节,所以我在这里对您正在使用的工作(服务器/并行)和您的 DataStage 版本做一些假设。在工作设计中,我认为您的第一个列的名称是“Value”,第二个是“Key”。
这是一个基本的工作设计,注意分区:工作设计图像
这是第一个变压器设置。我知道添加第二个转换器只是为了修剪是没有用的,但是 LastRowInGroup() 函数的一个限制是它只能接受列作为参数。因此,必须在将其传递给函数之前对其使用的列进行转换:第一个转换器图像
这是第二个变压器设置。阶段变量顺序很重要,不要忘记约束:第二个变压器图像
在第二个变压器中,请务必按照图片中的详细信息设置分区和约束:第二个变压器属性图像
您的输出数据将如下所示:输出阶段数据图像
希望有帮助并且很清楚,请仔细查看图像。我正在使用图像,因为它们说的比文字更多。
问候, Sam Gribble @InforgeAcademy
推荐阅读
- javascript - 字符串连接v JQuery
- java - 交换邮件标题格式
- excel - 从 Excel 中的一个单元格文本字符串中提取一个或两个单元格的经度和纬度
- python - Pytest 使用参数化夹具 VS。pytest.mark.parametrize
- php - 如何使 php 脚本运行插入 sql 查询,然后从插入的行中获取信息?我是初学者
- kubernetes - kubernetes redis cluster master IP 自动更改
- python-3.x - 棘手的python pandas条件数学,在不同的列中有很多缺失的行和可能的重新索引
- ios - Xamarin:更改 UITextView 中自动检测到的链接颜色并保留下划线
- python-3.x - 重命名python列表列表中的重复项
- python - += 不支持的操作数类型;Python中的“int”和“list”