首页 > 解决方案 > 构建docker镜像时如何在gitlab runner中缓存spacy模型

问题描述

我使用 docker 和 gitlab。我的docker文件是这样的

FROM ubuntu:16.04
RUN apt-get update && apt-get install
RUN pip3 install wheel
RUN pip3 install spacy
RUN python3 -m spacy download en_core_web_md

当我构建 docker 容器时,wheel 和 spacy 包被缓存在 GitLab 运行器中,而不是 spacy 模型。

有没有办法在 GitLab 运行器中缓存 en_core_web_md 模型,以便可以安装模型而无需再次下载。

标签: dockergitlabspacy

解决方案


找到了解决方案。而不是使用以下命令安装模型,

RUN python3 -m spacy download en_core_web_md

首先,您需要下载模型

RUN pip3 download https://github.com/explosion/spacy-models/releases/download/en_core_web_md-2.2.0/en_core_web_md-2.2.0.tar.gz

然后安装它。

RUN pip3 install /en_core_web_md-2.1.0.tar.gz

当您重新运行管道时,模型不会再次下载。


推荐阅读