apache-pig - APACHE PIG - 模式中不存在错误投影字段 [Units_Sold]:组:chararray,D2:bag{:tuple(Item_Type:chararray,Units_Sold:int)}
问题描述
下午好 - 我有一个销售数据集,我正在尝试查看哪个商品的销量最多。这是我的代码:
Country:chararray,
Item_Type:chararray,
Sales_Channel:chararray,
Order_Priority_site:chararray,
Order_Date:chararray,
Order_ID:chararray,
Ship_Date:chararray,
Units_Sold:int,
Unit_Price: int,
Unit_Cost: int,
Total_Revenue: int,
Total_Cost: int,
Total_Profit:int);
D2 = FOREACH data GENERATE Item_Type, Units_Sold;
D3 = GROUP D2 BY Item_Type;
D4 = FOREACH D3 GENERATE group, SUM(Units_Sold);
DUMP D4;```
However, I get the error:
```<file D, line 20, column 36> Invalid field projection. Projected field [Units_Sold] does not exist in schema: group:chararray,D2:bag{:tuple(Item_Type:chararray,Units_Sold:int)}.```
Does anybody know how to fix this? Let me know if you need more info, this is the first qurstion I have posted on here
解决方案
SUM 正在等待一个袋子。该错误向您显示架构:
D2:bag{:tuple(Item_Type:chararray,Units_Sold:int)}
因此将 SUM 更改为:
SUM(D2.Units_Sold)
推荐阅读
- react-native - 反应本机 NativeBase CheckBox 不起作用
- python - 如何使用 Beautiful Soup 获取位于标签内的文本?
- scala - 删除 .ivy 文件夹后,Sbt 卡在“更新 ProjectRef”
- java - 如何将对象转换为接口?
- amazon-web-services - 有没有办法在 Heroku Private Space 和 AWS S3 之间建立私有连接?
- angular - 如何设置文件上传预览?
- ios - 导航栏的渐变颜色
- android - 构建“编译错误”,但检查员什么也没找到
- solr - Solr 云是否需要负载均衡器,例如主故障中的 HAPROXY
- mongodb - 根据mongodb中对象的子元素过滤对象列表