参考http://www.mamicode.com/info-detail-1523356.html
1.远端执行:vi /etc/profile
添加一行:
PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.9-src.zip
或者PYTHONPATH=$SPARK_HOME/python/:$SPARK_HOME/python/lib/py4j-0.8.2.1-src.zip
2.安装pip 和 py4j
下载pip-9.0.1.tar.gz和py4j-0.10.4.tar.gz
解压pip-9.0.1.tar.gz和py4j-0.10.4.tar.gz,cd到解压目录执行:sudo python setup.py install
3.本地Pycharm设置
File > Settings > Project Interpreter:
Tools > Dployment > Configuration:
4.运行代码中加入:
import os
import sys
os.environ['SPARK_HOME'] = "/opt/cloudera/parcels/CDH-5.9.1-1.cdh5.9.1.p0.4/lib/spark"
sys.path.append("/opt/cloudera/parcels/CDH-5.9.1-1.cdh5.9.1.p0.4/lib/spark/python")
windows下pycharm远程调试pyspark
推荐阅读
- 使用 Collections 实现排序 sort方法 对List 实体类实现Comparable类 示例
- 关于springboot默认日志框架Slf4j+logback,自定义Appender问题
- DMN 决策模型标记 介绍
- 博客园添加看板娘
- 如何用蔡格尼克效应指导我们的生活
- Confluence 6.15.2上的DrawIO插件不能支持BPMN 2.0(非BPMN暨1.0)的问题调查及结论
- Windows使用cmd命令查看当前用户名
- Android SDK Build-tools的版本已经高于Android SDK Platform-tools版本 的解决办法
- 亿级PV的ELK集群实践之路
- Zabbix latest data页面500错误解决