首页 > 解决方案 > Pentaho - PDI:获取流字段

问题描述

这里有一个非常简单的问题:例如,如果我读取一个 .csv 文件,我如何在运行时知道该文件有哪些列?我想将该 .csv 文件转换为 JSON,但我不知道如何动态设置 JSON 输出步骤的字段,以包含该文件的所有行。你能帮我扩展我的知识吗?

提前致谢

标签: pentahopentaho-spoon

解决方案


这绝对是元数据注入的一个很好的用例。该步骤具体称为ETL Metadata Injection。您可能需要使用脚本步骤动态获取字段(有可用的 Java、JavaScript 和 Python 脚本步骤,如果您是 Enterprise 客户,还可以使用 R)。我认为没有内置步骤可以在运行时动态发现字段。

拥有字段后,您可以使用元数据注入步骤将字段名称注入 CSV 输入或文本文件输入步骤以及 JSON 输出步骤。

这是该ETL Metadata Injection步骤的官方帮助文档:https ://help.pentaho.com/Documentation/8.1/Products/Data_Integration/Transformation_Step_Reference/ETL_Metadata_Injection


推荐阅读