首页 > 解决方案 > PySpark 多线程读取 Py4JNetworkError:Java 端的答案为空

问题描述

尝试在 PySpark 中使用 jdbc 从 Snowflake 并行读取数据时,我不断收到以下错误。它在使用非常少量的线程(例如 50)时工作正常,但在 100 左右时发生。该集群拥有巨大的资源 6k c/40T。我尝试过使用配置,但没有 PnC 帮助。这里分别是错误、火花配置和代码。

在此处输入图像描述

在此处输入图像描述

在此处输入图像描述

标签: pythonpyspark

解决方案


推荐阅读