apache-spark - Spark:读取镶木地板文件时出现问题
问题描述
读取任何镶木地板文件时出现以下异常:
org.apache.spark.sql.AnalysisException: Illegal Parquet type: FIXED_LEN_BYTE_ARRAY;
at org.apache.spark.sql.execution.datasources.parquet.ParquetSchemaConverter.illegalType$1(ParquetSchemaConverter.scala:126)
at org.apache.spark.sql.execution.datasources.parquet.ParquetSchemaConverter.convertPrimitiveField(ParquetSchemaConverter.scala:193)
在 apache spark 的 repo 中找到了一个关于此的拉取请求: https ://github.com/apache/spark/pull/20826
如何解决这个问题?
解决方案
我同意这很烦人。我们只是将它序列化为一个字符串,但我同意这是一个穷人的解决方案。
推荐阅读
- javascript - 将数组中的对象计数到表中的函数
- javascript - 是否可以像下面的弹出框一样在 javascript 中显示模式?
- angular - 如何对 PrimeNG 表中具有动态列数的某些列使用日期管道
- mysql - 如何在Vue中从数据库中渲染html
- java - 保持程序运行的 IBM MQ JMS java 侦听器代码
- php - HTTP 请求参数和监听器
- machine-learning - Ml.NET - 基于某些属性的 Pedicting 部门
- javascript - 检查数组中是否存在带参数的url
- c++ - 注册一个可以在 tensorflow C++ 中使用的自定义 tensorflow 操作,它本身使用了一些现有的 tensorflow 操作
- php - 有什么方法可以在CSV中输入用逗号分隔的数字?