首页 > 解决方案 > Pentaho - 数据格式

问题描述

我有两个关于 Pentaho Kettle 的问题,我需要一些帮助!所以,我有一个包含一些数据的 CSV 文件。在一个列中,文件有一些日期(以年为单位)。第一个问题是,某些行在该列中有“无”,而其他行的日期格式正确。这张图片应该有助于“看到”问题:

问题一

为了解决这个问题,我将输入文件和数据库中的数据类型更改为字符串。这行得通,但我认为这不是正确的做法。我也尝试使用“过滤行”步骤,但没有奏效..请帮忙?:)

第二个问题是关于日期字段中的空值。数据库希望收到一个日期值,但其中一些值为空。再一次,这张图片应该有助于“看到”问题:

问题二

我能做些什么来解决这两个问题?什么是正确的方法,不仅可以解决问题,而且在以后查询数据时具有良好的性能?

非常感谢!

此致!

标签: pentahokettlepentaho-spoonpentaho-data-integration

解决方案


对于第一个查询,使用输入步骤作为字符串,之后使用选择值步骤可以将字符串更改为日期格式。对于第二步,使用过滤行步骤并分隔之后没有任何行的行,然后将none替换为null并链接到下一步。


推荐阅读