pyspark - 带有pycharm的Linux上的PySpark-第一个异常错误
问题描述
我正在尝试在我配置的 Linux VM 上运行我的第一个 PySpark 脚本。KeyError: SPARK_HOME
当我运行以下命令时,我收到的错误消息是:
from os import environ
from pyspark import SparkContext
我暂时通过运行使这个错误消失了export SPARK_HOME=~/spark-2.4.3-bin-hadoop2.7
。然后我遇到了一个新错误error=2, No such file or directory
。搜索将我带到此页面:https ://community.cloudera.com/t5/Community-Articles/Tutorial-Install-Configure-iPython-and-create-run-PySpark/ta-p/246400 。然后我跑了export PYSPARK_PYTHON=~/python3*
。这让我回到了体验KeyError: SPARK_HOME
错误。
老实说,我遇到了这个问题,因为这是我第一次配置 Spark 并使用 PySpark。我仍然不太了解 pycharm 的来龙去脉。
我希望能够在此页面上运行以下基本示例脚本:https ://medium.com/parrot-prediction/integrating-apache-spark-2-0-with-pycharm-ce-522a6784886f没有问题。
解决方案
这里有一个名为 findspark 的包
或者如果在环境中找不到,您可以使用以下代码设置路径
import os
if 'SPARK_HOME' not in os.environ:
os.environ['SPARK_HOME'] = 'full_path_to_spark_root'
[代码继续]
推荐阅读
- spring - 我可以使用 QuerydslPredicate 执行一对多连接查询吗?
- c# - 从 Azure Blob 存储读取文本文件值
- python - 在匹配条件的 pandas 数据框中查找列名及其各自的值并将结果存储在字典中
- django - Django - 分组数据并在模板中显示外键名称
- php - 应用程序在 Mac 上找不到路径(在类似条件下在 Win 上工作)
- android - 如何在 TimePicker 中显示 EditText 的时间?
- python - 尝试在 Node js 上路由函数时无法返回 /user/docker
- c# - Unity2D局部比例问题
- c - GTK+3 替换/交换 pixbuf 似乎中断了
- javascript - Chrome 内存泄漏