apache-spark - 在火花中重现太大的帧异常
问题描述
在编写 spark 应用程序时,我经常遇到框架过大的异常。为了找到解决问题的方法,我需要能够在 Zeppelin 或 spark shell 中重现异常,而无需等待多个小时。
我已经尝试创建一个随机整数的数据帧,然后repartition(1).show
它要么返回结果,要么驱动程序不再响应。
我也知道这个问题与数据倾斜有很大关系,但独立于我需要重现异常的数据。
你能帮我重现异常吗?这是一个例子:
org.apache.spark.shuffle.FetchFailedException: Too large frame: 2222736257
at org.apache.spark.storage.ShuffleBlockFetcherIterator.throwFetchFailedException(ShuffleBlockFetcherIterator.scala:528)
at org.apache.spark.storage.ShuffleBlockFetcherIterator.next(ShuffleBlockFetcherIterator.scala:459)
at org.apache.spark.storage.ShuffleBlockFetcherIterator.next(ShuffleBlockFetcherIterator.scala:62)
解决方案
推荐阅读
- python - 语音识别不接受输入
- ios - 如何在swiftui中动态更改文本背景颜色?
- python - Anaconda 导航器没有响应
- tomcat - 使用tomcat中的常见jar创建苗条的grails战争文件?
- python - 在 Python 中循环遍历 100 个文本文件
- c++ - vcpckg 与 Visual Studio Code (Linux) 集成
- python - 选择我们可以选择非空且所有字符相同的所有子字符串
- python - 如何在乌龟中做螺旋旋转?
- python - 如何使用 OpenCV 检测反转颜色(0 和 255)图像中的轮廓?
- javascript - 反应:设置状态清除表单提交上的输入