presto - 从 Alluxio 读取超时
问题描述
我在 Alluxio 上执行 Presto 查询时遇到了这个错误。这个超时是什么意思,我该如何解决?
com.facebook.presto.spi.PrestoException:使用 org.apache.hadoop.mapred.TextInputFormat 打开 Hive 拆分 alluxio://xxxxx:19998/s3/data/m-00020(偏移量=134217728,长度=67108864)时出错:超时从 [id: 0x23615709, L:/xxxxx:34740 - R:xxxxx/xxxxx:29999] 读取 39963328512
解决方案
当 Alluxio worker 花费太长时间(可通过 配置alluxio.user.network.netty.timeout
)向客户端提供数据时,您将收到此错误。
一种简单的解决方法是增加超时。
然而,这通常是工人以某种方式超载的症状。在您的设置中检查的常见事项:
- Alluxio 工作负载,如果您的计算位于同一位置并且没有资源管理,则可能会出现问题
- Alluxio worker 在文件系统负载/带宽下,这通常是对象存储等远程存储的瓶颈。
如果这些是瓶颈,您可以尝试降低并发性或增加集群中的节点数。
推荐阅读
- python - 设置 simpleRNN 的维度(请提供具有相同第一个维度的数据)
- python - 将嵌套字典与一系列可能值进行比较
- react-router - React-Router 与 window.location 不同步?
- xamarin.forms - Azure 通知中心设备注册
- javascript - 有什么方法可以在单击 div 时在节点 js 服务器中获取价值
- tfs - TFS 2013 Multipipeline 构建类似于 Jenkins
- php - PHP $_POST 有效,但 $_GET 无效
- python - pandas 子字符串查找,返回多个值(关键字标记)[python]
- excel - 在动态数组中添加间隙
- reactjs - 如何在reactjs中选择点击的元素?