pentaho - Pentaho - PDI:获取流字段
问题描述
这里有一个非常简单的问题:例如,如果我读取一个 .csv 文件,我如何在运行时知道该文件有哪些列?我想将该 .csv 文件转换为 JSON,但我不知道如何动态设置 JSON 输出步骤的字段,以包含该文件的所有行。你能帮我扩展我的知识吗?
提前致谢
解决方案
这绝对是元数据注入的一个很好的用例。该步骤具体称为ETL Metadata Injection
。您可能需要使用脚本步骤动态获取字段(有可用的 Java、JavaScript 和 Python 脚本步骤,如果您是 Enterprise 客户,还可以使用 R)。我认为没有内置步骤可以在运行时动态发现字段。
拥有字段后,您可以使用元数据注入步骤将字段名称注入 CSV 输入或文本文件输入步骤以及 JSON 输出步骤。
这是该ETL Metadata Injection
步骤的官方帮助文档:https ://help.pentaho.com/Documentation/8.1/Products/Data_Integration/Transformation_Step_Reference/ETL_Metadata_Injection
推荐阅读
- python - 比较两种 Anagram 方法
- python - Python Selectors 模块中位掩码的实现
- r - 使用 reshape2 通过从多个因素创建列来透视数据
- c++ - 函数 C++ 中的新运算符
- glsl - WebGL:将纹理从顶点着色器传递到片段着色器
- c# - 在 C# 中为接收到的串行数据事件处理程序实现线程安全队列
- dynamic - 合并两个表和一个串联 - Power BI Q
- salesforce - 实体“任务”上没有这样的“电子邮件”列。
- java - Apache DateUtils 无法解析 2018-03-11 02:00:00 夏令时时间戳
- mysql - mysql在查询后没有释放池连接