首页 > 解决方案 > 在同一作业中使用不同文件运行 ibm 数据阶段作业

问题描述

我创建了一个将 excel 数据输入数据库的工作。我需要这项工作可重复用于不同的 excel 版本。excel 的列将是相同的,但只有值会改变,就像将最新的 excel 值版本插入数据库一样。

例如,sales_report_january.xlsx , sales_report_february.xlsx两者的文件具有相同的列,只有行值不同。我需要这项工作能够处理这两个文件,而无需更改文件路径以外的任何其他内容。因为为同一任务重新创建具有相同所有内容(文件路径除外)的不同作业似乎效率低下。

是否可以在 ibm 数据阶段执行此操作,或者我是否需要重新映射所有内容,尽管它不需要任何更改?我已经通过手动更改文件路径进行了尝试,但它引发了错误。

标签: exceldatastageibm-infosphere

解决方案


我至少可以想到四种方法来做到这一点。通常,如果文件都在同一个目录中,我们会在序列作业中使用循环来处理通过适当命令(例如UNIX/Linux的ls -m模式)获得的文件名列表。捕获输出,如有必要,将换行符转换为逗号等分隔符,并在 StartLoop 活动中使用该列表。


推荐阅读