amazon-athena - Athena Engine V1 到 V2 在结构列上变慢
问题描述
我有一个在 Athena 上运行的 SQL 查询,它已按计划可靠地运行了 6 个月,执行时间通常为 1-2 分钟。在 Athena 引擎从 V1 升级到 V2 之后,性能下降到超过 20 分钟,并且在许多情况下,在这个比例因子错误下导致查询耗尽资源。我认为这与结构列的使用有关。当我简单地为结构列返回 * 时,它会快速返回。
这是一个简化的例子
select 'CURRENT ACTIVE' as record_type,
value.file_timestamp as servicer_file_date,
value.cardholder_base_segment.base_account_number, -- tokenized account id
value.sls_syd_segment.card_actd_dt, -- card activation date
value.cardholder_base_segment.orgn_acct_dt, -- Account Original Open Date
value.current_activity_segment.current_balance, -- current balance
where value.file_timestamp = (select max(value.file_timestamp) as max_file_date
from datalake_database.my_credit_card_data);
有没有其他人遇到过同样的问题?如果是这样,您是否能够找到解决方法?
解决方案
推荐阅读
- c++ - 当路径中出现希腊字母时,fs::directory_iterator 返回空列表
- sql - 为什么 SELECT COUNT(id) 这么慢?
- google-sheets - 从按天加权的每周数据中总结一个月的值
- sql - 如果使用 COUNT-GROUP BY 没有结果,则返回零
- ruby-on-rails - Ruby On Rails 5.2 和多个数据库
- graphql - GraphQL 突变为嵌套响应返回 null
- python - 测量点到线的距离
- php - 使用 pdo 检查 2 个条件
- oracle - 从plsql字符串中获取单词后的值
- bash - bash:嵌套的双引号和美元符号