google-cloud-platform - GCP 数据准备 AVRO 文件不反映数据准备中的架构。日期时间字段更改为字符串字段
问题描述
我正在使用 Google Cloud Platforms (GCP) Data Prep (DP) 通过 AVRO 文件将数据移动到 Big Query (BQ) 中。我使用一个没有转换的 DP 配方将数据直接从 CSV 文件转换为 AVRO 文件。在 DP 中,我的专栏类型CreatedDate
如下date/time
图所示:
注意:年份(格式为 YYYY-)已画出。
当我使用这些设置将数据发布到 AVRO 文件中时:
生成的 AVRO 模式在纯文本中如下所示:
{"name":"CreatedDate","type":["null","string"],"default":null}
而当导入到BQ中也是一列类型string
Replace-BigQuery
但是,如果我使用DP 中的发布选项将数据直接发布到 BQ,则该CreatedDate
列将是类型DATETIME
,并且NULLABLE
正是我想要的。
我环顾四周,找不到任何从 DP 发布到 AVRO 文件的已知问题,该文件会将日期时间字段转换为字符串字段。
我错过了什么吗?
AVRO 是否像 BQ 那样不支持这种格式的日期时间或日期时间?
是的,我需要将 DP 发布到 AVRO 文件。我只是直接发布到 BQ 作为测试。我不能长期这样做。
任何其他建议/帮助都会很棒!
解决方案
推荐阅读
- asp.net - 有条件地设置引导列宽?
- r - 如何在 0 到 100 之间缩放 R 中的 int 值
- jquery - 在加载更多推文和 MutationObserver 实现时使用 JQuery 和 CSS 自定义 Twitter 时间线
- sass - 如何使用 Parceljs(又名 Globbing)导入目录中的所有 sass 文件
- flutter - 支持颤振的外部键盘
- visual-studio-code - Visual Studio Code 没有“工具”选项 \\菜单栏缺少它
- python - Python3.6 的 Zipfile 模块:写入字节而不是 Odoo 的文件
- c# - 为选定项目添加复选标记后如何更新表格视图?
- python - 如何读取 CSV 文件并将一行中的每个单元格添加到列表中?
- ios - 使用来自服务器的字符串公钥的 RSA 加密