amazon-redshift - S3 查询异常(获取)
问题描述
我已经以 Parquet 格式将数据从 Redshift 上传到 S3,并在 Glue 中创建了数据目录。我已经能够从 Athena 查询表,但是当我在 Redshift 上创建外部模式并尝试在表上查询时,我收到以下错误
ERROR: S3 Query Exception (Fetch)
DETAIL:
-----------------------------------------------
error: S3 Query Exception (Fetch)
code: 15001
context: Task failed due to an internal error. File 'https://s3-eu-west-1.amazonaws.com/bucket/folder/partition_key/filename.parquet_1 has an incompatible Parquet schema for column 's3://bucket/folder
query: 560922
location: dory_util.cpp:717
process: query1_118_560922 [pid=32409]
-----------------------------------------------
查询在 Athena 中运行良好
解决方案
它有点告诉你出了什么问题 - 表/分区的架构和文件内容差异太大。解决这个问题的最简单方法是在数据位置上运行爬虫,并选中“从表中更新每个分区定义”。
推荐阅读
- javascript - 使用 Hotwire 和 Stimulus.js Rails 6 提交后重置表单的问题
- javascript - 选择选项文本不完全可见?
- ios - iPhone 模拟器上的 iOS 应用程序错误:FBSOpenApplicationServiceErreurDomain
- javascript - 如何从字符串中删除逗号或其他内容?
- c# - c# 处理数据管道:'管道已结束'
- django - ManyToManyField 的 Django get_absolute_url
- c# - 即使使用 while 循环 C#,try/catch 函数也只运行一次
- swift - 如何在水平堆栈视图中拖动按钮
- wordpress - 人们可以在没有 Wordpress 帐户的情况下登录我的 Wordpress.com 网站吗?
- node.js - 如何在 Node.js&MongoDB 中替换子数组的元素