首页 > 解决方案 > 控制在本地模式下运行 pyspark 的网络流量?

问题描述

我正在 12 核 mac pro 机器上以本地模式使用 pyspark 运行我的预处理例程。尽管我使用 --master local[*] 作为本地模式运行它,但我怀疑网络流量实际上会触及我的路由器,因此整体网络速度会变慢。

我考虑过通过防火墙阻止本地机器的火花使用的一些端口,但我相信可能有更好的方法来处理这个问题。

我不确定我关于增加网络流量的假设是对还是错,所以我很想听听其他人的经历。如果是这样,有没有办法用配置文件来处理这个问题?谢谢。

标签: apache-sparkpyspark

解决方案


推荐阅读