构建 docker 图像时如何在 gitlab runner 中缓存 spacy 模型

How to cache spacy model in gitlab runner when building docker image

我用的是docker和gitlab。我的 docker 文件是这样的

FROM ubuntu:16.04
RUN apt-get update && apt-get install
RUN pip3 install wheel
RUN pip3 install spacy
RUN python3 -m spacy download en_core_web_md

wheel 和 spacy 包在我构建 docker 容器时缓存在 GitLab runner 中,但不是 spacy 模型。

有没有办法把en_core_web_md模型也缓存在GitLab runner中,这样就可以安装模型而不需要再次下载了。

找到解决方案。而不是使用以下命令安装模型,

RUN python3 -m spacy download en_core_web_md

首先,您需要下载模型

RUN pip3 download https://github.com/explosion/spacy-models/releases/download/en_core_web_md-2.2.0/en_core_web_md-2.2.0.tar.gz

然后安装。

RUN pip3 install /en_core_web_md-2.1.0.tar.gz

当您重新运行管道时,模型将不会再次下载。