python - 如何在不使用的情况下将模块安装到特定的 Jupyter 内核!还是终端?
问题描述
我在 EMR 上使用 JupyterHub,Pandas 未安装在 PySpark 或 PySpark3 内核上。这些内核也不允许使用!
. 我试图安装使用
import pip
pip.main(['install','pandas])
但这引发了ValueError: I/O operation on closed file.
当我打开终端内核时,pandas 已经安装好了。
如果有其他方法可以安装到特定内核,请告诉我。
解决方案
面临类似的问题,这解决了我的情况
#bootstrap
sudo python3 -m pip install <packages>
# set in $SPARK_HOME/conf/spark-env.sh or use the config.json template for EMR
export PYSPARK_DRIVER_PYTHON=python3
export PYSPARK_PYTHON=python3
推荐阅读
- reactjs - SPLoaderError.loadComponentError:加载组件失败
- python - 如何使用 lastWill 消息连接到 AWS IoT
- java - 我想要特定的模式
- javascript - Javascript addEventListener 找到了什么标签
- tensorflow - 用于 CentOS/Fedora/Red Hat 的 TensorFlow C++ 预构建存储库
- jquery - 在复选框的单击事件上更改隐藏输入的值
- python - pyspark 使用窗口函数
- r - 创建的时间序列不匹配
- html - 来自firebase cloud functuion的gmail中的html内容
- blueprism - 如何更改 Blueprism 中 HTML 属性的路径?