首页 > 解决方案 > 在 org.apache.spark.sql.execution.datasources.orc.OrcColumnVector.getDecimal(OrcColumnVector.java:158)

问题描述

我正在尝试从 HDFS 路径中读取,该路径是销售日期的一个分区,然后仅选择一个特定的列 spark 作业失败,其类型为小数(32,20)(可为空 = true)。当我排除此列并选择其他列时,它工作正常。

访问 org.apache.spark.sql.execution.datasources.orc.OrcColumnVector.getDecimal(OrcColumnVector.java:158)

我采用的替代方法:我将数据样本放入另一个 HDFS 路径并查询它工作正常

什么情况下我们可以解决上述问题

标签: apache-sparkorc

解决方案


推荐阅读