java - 读取镶木地板文件时收到 CorruptStatistics 警告
问题描述
使用 spark version 读取镶木地板文件时收到警告2.4.5
。
Sep 2, 2021 10:54:03 PM WARNING: org.apache.parquet.CorruptStatistics: Ignoring statistics because created_by coul
d not be parsed (see PARQUET-251): parquet-cpp version 1.4.0
org.apache.parquet.VersionParser$VersionParseException: Could not parse created_by: parquet-cpp version 1.4.0 usin
g format: (.+) version ((.*) )?\(build ?(.*)\)
at org.apache.parquet.VersionParser.parse(VersionParser.java:112)
at org.apache.parquet.CorruptStatistics.shouldIgnoreStatistics(CorruptStatistics.java:60)
at org.apache.parquet.format.converter.ParquetMetadataConverter.fromParquetStatistics(ParquetMetadataConve
rter.java:263)
at org.apache.parquet.hadoop.ParquetFileReader$Chunk.readAllPages(ParquetFileReader.java:583)
at org.apache.parquet.hadoop.ParquetFileReader.readNextRowGroup(ParquetFileReader.java:513)
at org.apache.parquet.hadoop.InternalParquetRecordReader.checkRead(InternalParquetRecordReader.java:130)
at org.apache.parquet.hadoop.InternalParquetRecordReader.nextKeyValue(InternalParquetRecordReader.java:214
)
您对这条消息的来源有任何想法吗?以及如何解决?
解决方案
推荐阅读
- python - 如何使用 for 循环手动将对象添加到 Django 模型?
- android - 跨行动态拉伸表格单元格以适应其内容
- java - 如何修复我的应用程序崩溃而不是拨打电话?
- asp.net - 你可以在 ASP 中堆叠多个 IF 语句吗?我的不工作
- highcharts - 显示多行系列时,Highcharts单击事件未触发
- python-3.x - 如何在 Python 3.x 中使用 for 循环来解决这个难题?
- android - 2 orderby 方法在 firebase firestore android 上无法正常工作
- ruby-on-rails - 如何以相同的形式更新表及其关联的联接表?
- sql - 如何在 go-pg 中查询嵌套结构中的子字段(带有 Go 的 Postgres ORM)?
- python - 在 keras 中实现变分自动编码器时出现 InvalidArgumentError