hadoop - Apache pig 错误 org.apache.pig.backend.hadoop.executionengine.Launcher - 错误:org.apache.avro.file.DataFileWriter$AppendWriteException:
问题描述
我正在尝试加载一些数据,按特定字段过滤并将输出存储到 HDFS。我的代码如下所示:
data = LOAD '$inputPath' using AvroStorage();
data = FILTER data by condition;
STORE data INTO '$outputPath'using AvroStorage('schema', '$SCHEMA');
但我收到一条错误消息:
ERROR org.apache.pig.backend.hadoop.executionengine.Launcher - Error: org.apache.avro.file.DataFileWriter$AppendWriteException: java.lang.NullPointerException: null of int of int in field id of com.stackoverflow.id
有人可以建议可能出了什么问题吗?我猜这是因为从 HDFS 读取的某些字段为空,而 AvroStorage 不允许这种情况发生?感谢您的任何建议!
解决方案
您的 avro 架构正在定义一个不允许 null 但您的数据包含 null 的字段。
推荐阅读
- javascript - 解析 csv 文本以创建引导 div?
- ruby-on-rails - Rails 中的 ActiveModelSerializers
- android - 在读取 Android 中的共享首选项期间,Qt 上的 JNI 出现 NoSuchMethodError
- ruby-on-rails - 为拥有和属于许多关联创建中间模型
- python - 根据 Python 中的一个标准提取字符串数据框中的数字
- python - python的sklearn库中的statsmodels摘要函数是否有任何替代方法?
- javascript - 未捕获的类型错误:无法在 OnsenUI 中设置 null 的属性“onclick”
- python - 如何使用梯度矢量流获得曲线?
- vue.js - 使用 vuejs 从 php 服务器下载文件
- memory - Couchbase 集群中各节点的 RAM 使用不均