前言

随着 Hugging Face 的爆火，平台上出现了越来越多的有趣的模型和数据集，目前仅模型数量就高达 4 万 5 千多个。

这些模型有一个有趣的特点，在云平台上跑的好好的，但是一旦想在本地跑起来就得各种“费劲”折腾，项目关联的 GitHub 中总是能看到用户反馈：这个模型和代码，我本地跑不起来，运行环境和调用代码搞起来太麻烦了。

在日常的工作和学习中，我们也会经常遇到类似上面 Hugging Face 的情况：许多模型在“云上”跑的好好的，但是一到本地就跑不起来了，这或许是因为“操作系统环境、设备 CPU 架构（x86/ ARM）差异”、或许是因为“Python 运行时版本过高或过低”、或许是因为“某个 PIP 安装的软件包版本不对”、“冗长的示例代码中写死了一堆东西”…

用 Docker 容器搭配 Towhee，制作模型的一键运行环境。以腾讯 ARC 实验室开源的 GFPGAN 模型为例。

制作 PyTorch 模型使用的通用 Docker 基础镜像

通过容器解决或避免以下的情况

想要避免不同项目之间的环境造成干扰（污染）
想要确保项目依赖清晰，任何人都能够在任何设备上复现结果
想要复现模型的时间成本更低一些，不喜欢折腾 80% 重复的模型调优之外的工作内容（尤其是环境、基础配置）

考虑到模型可能需要在 x86 和 ARM 两类设备上运行，推荐使用 miniconda3 这个基于 debian 内置了 conda 工具包的基础镜像。

Dockerfile

FROM continuumio/miniconda3:4.11.0

LABEL maintainer=waringid@gmail.com

ARG USE_MIRROR=1

RUN if [ "$USE_MIRROR" = true ] ; then sed -i -e "s/deb.debian.org/mirrors.tuna.tsinghua.edu.cn/" /etc/apt/sources.list && sed -i -e "s/security.debian.org/mirrors.tuna.tsinghua.edu.cn/" /etc/apt/sources.list; fi

RUN apt update && \
    apt install -y libgl1-mesa-glx && \
    apt autoremove -y

RUN if [ "$USE_MIRROR" = true ] ; then pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/; fi

RUN conda install -y pytorch

RUN pip3 install --upgrade torch==1.9.0 torchvision==0.10.0

RUN pip install towhee

空间快捷链接

页面树结构

前言

制作 PyTorch 模型使用的通用 Docker 基础镜像

Dockerfile

空间快捷链接

页面树结构

D006-使用 Docker 来运行 HuggingFace 海量模型

前言

制作 PyTorch 模型使用的通用 Docker 基础镜像

Dockerfile