pyspark - parquet 中的 Athena 类型 INT64 与表模式中定义的类型 double 不兼容
问题描述
我已经使用 pyspark infer 模式将数据从 csv 转换为 parquet 文件格式,并尝试使用 Athena 读取数据。
df.printSchehma()
test_num : double (nullable = true)
当我们使用 Glue 爬虫创建表时,Athena 也使用双数据类型,我们无法查询具有以下问题的表。
错误:
test_num : type INT64 in parquet is incompatible with type double defined in table schema
有什么建议可以解决这个问题吗?感谢你的帮助。
解决方案
推荐阅读
- vue.js - Vue 2 的 __vue__ 的 Vue 3 等价物是什么?
- reactjs - 创建 React App 构建无法正常工作
- java - Java vs PHP - 方法参数中的引用
- wordpress - 在 allTribeEvents(事件日历)中显示 ACF 查询
- python - 如何使用线性回归模型生成单个预测值?
- vue.js - 在 vue.js 的 UL 中渲染 LI。有隐形标签吗?
- javascript - 在 Svelte onMount 回调中使用流星数据订阅错误
- java - Java regex 不会查找第一个以外的单词
- c# - .Net Core 3.1 HttpClient Headers.TryAddWithoutValidation 不工作
- eclipse - 有没有办法在 Eclipse 中删除 Maven 启动配置?