首页 > 解决方案 > GCP 数据准备 AVRO 文件不反映数据准备中的架构。日期时间字段更改为字符串字段

问题描述

我正在使用 Google Cloud Platforms (GCP) Data Prep (DP) 通过 AVRO 文件将数据移动到 Big Query (BQ) 中。我使用一个没有转换的 DP 配方将数据直接从 CSV 文件转换为 AVRO 文件。在 DP 中,我的专栏类型CreatedDate如下date/time图所示:

在此处输入图像描述

注意:年份(格式为 YYYY-)已画出。

当我使用这些设置将数据发布到 AVRO 文件中时:

生成的 AVRO 模式在纯文本中如下所示:

{"name":"CreatedDate","type":["null","string"],"default":null}

而当导入到BQ中也是一列类型string

Replace-BigQuery但是,如果我使用DP 中的发布选项将数据直接发布到 BQ,则该CreatedDate列将是类型DATETIME,并且NULLABLE正是我想要的。

我环顾四周,找不到任何从 DP 发布到 AVRO 文件的已知问题,该文件会将日期时间字段转换为字符串字段。

我错过了什么吗?

AVRO 是否像 BQ 那样不支持这种格式的日期时间或日期时间?

是的,我需要将 DP 发布到 AVRO 文件。我只是直接发布到 BQ 作为测试。我不能长期这样做。

任何其他建议/帮助都会很棒!

标签: google-cloud-platformgoogle-bigqueryavrogoogle-cloud-dataprep

解决方案


推荐阅读