首页 > 解决方案 > 创建自定义 dataproc 映像时无法安装 python3 包

问题描述

我按照以下链接创建 dataproc-version 1.5.21-debian10 https://cloud.google.com/dataproc/docs/guides/dataproc-images的自定义图像

如果我尝试下面的自定义脚本,根据此链接

#!/usr/bin/bash

apt-get -y update <-- 这以找不到错误命令结束

apt install python3-pip -y <-- E: 找不到包

python3.7 -m pip install numpy <-- /usr/bin/python3.7: 没有名为 pip 的模块

相反,如果我尝试 pip install numpy 它会在 python2.7 中安装包

请建议我能做什么?

标签: google-cloud-platformgoogle-cloud-dataproc

解决方案


Dataproc 1.5 映像默认使用 Conda 和 Python 3。要在 Conda 环境中安装软件包,您应该使用 Conda 的conda二进制文件而不是系统一:

/opt/conda/miniconda3/bin/conda install numpy

请注意,不鼓励使用 Pip 在 Conda 环境中安装软件包,但如果需要,您仍然可以这样做:

/opt/conda/miniconda3/bin/pip install numpy

推荐阅读