Docker镜像加载原理

Posted 2023-03-29

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Docker镜像加载原理相关的知识，希望对你有一定的参考价值。

参考技术A

1.1 UnionFS(联合文件系统)
UnionFS(联合文件系统): Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统，它支持对文件系统的修改作为一次提交来一层层的叠加，同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem)。Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承, 基于基础镜像(没有父镜像)，可以制作各种具体的应用镜像。
特性: 一次同时加载多个文件系统，但从外面看起来，只能看到一个文件系统，联合加载会把各层文件系统叠加起来，这样最终的文件系统会包含所有底层的文件和目录。

1.2 Docker镜像加载原理
docker的镜像实际上由一层一层的文件系统组成，这种层级的文件系统UnionFS。

bootfs(boot file system) 主要包含bootloader和kernel，bootloader主要是引导加载kernel，Linux刚启动时会加载bootfs文件系统，在Docker镜像的最底层是bootfs。这一层与我们典型的Linux/Unix系统是一样的, 包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了，此时内存的使用权已由bootfs转交给内核，此时系统也会卸载bootfs。

rootfs(root file system), 在bootfs之上。包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs就是各种不同的操作系统发行版，比如Ubuntu，Centos等等

特点：容器层之下都属于镜像层，镜像层是只读的！

Docker 镜像-加载原理分层原理commit镜像

一、什么是镜像

镜像是一种轻量级、可执行的独立软件包，用来打包软件运行环境和基于运行环境开发的软件。
它包含运行某个软件所需的所有内容，包括代码、运行时环境、库、环境变量和配置文件。
所有的应用，直接打包成docker镜像，就可以直接跑起来。

如何得到镜像：

从远程仓库下载
从其他地方copy
自己制作一个镜像 DockerFile

二、docker镜像加载原理

1. 联合文件系统UnionFS

UnionFS是一种分层、轻量级并且高性能的文件系统。支持对文件系统的修改作为一次提交来一层层的叠加，同时可以将不同目录
挂载到同一个虚拟文件系统下。这个在我们下载镜像的时候，就可以看到这样的效果。

比如有涉及到相同的文件，那么就可以共用了，极大节省资源。

UnionFS是docker镜像的基础，镜像可以通过分层来进行继承，基于基础镜像（没有父镜像），可以
制作各种具体的应用镜像。

特性：一次同时加载多个文件系统，但从外面看起来，只能看到一个文件系统，联合加载会把各层文件系统叠加起来，这样最终的文件系统会
包含所有底层的文件和目录。

2. 镜像加载原理

docker的镜像实际上由一层一层的文件系统组成，这种层级文件系统就是上述的UnionFS。接着，在内部又分为2部分：

bootfs(boot file system)：docker镜像的最底层是bootfs，主要包含bootloader（加载器）和kernel（内核）。
bootloader主要是引导加载kernel，linux刚启动时会加载bootfs文件系统。这一层与典型的linux/Unix系统一样，包含bootloader和kernel。当boot加载完成后，整个内核就在内存中了，此时内存的使用权已由bootfs转交给了内核，此时系统也会卸载bootfs。这里的加载，可以理解为，我们windows电脑开机时候，从黑屏到进入操作系统的过程。
rootfs(root filesystem)：在bootfs之上，包含的就是典型linux系统中的/dev、/proc、/bin、/etc等标准目录和文件。
rootfs就是各种不同的操作系统发行版，比如Ubuntu、Centos等等。

如图所示：

图中以debian系统为例，从左到右，分为3个过程:

图1，开始的状态，下载了一个debian系统。
图2，安装了一个emacs，这时候可以看到在图1基础上，加了一层Image。
图3，又装了一个Apache，此时在图2的基础上再加了一层Image。

说明了docker的镜像实际上是由层一层的文件系统组成的。对于不同的的linux发行版本，bootfs基本是一致的，rootfs会有差别，所以不同的
发行版可以共用bootfs。

另外，在docker上的操作系统通常都是精简版的，在VM上安装个centos镜像大小1个G多，而在docker上的centos镜像只有200M大小。
因为底层直接用主机的内核，自己只需要提供rootfs就行了，所以rootfs可以很小，只需要包含最基本的命令、工具和程序库即可。
这样一来，启动速度也快了，因为最浪费时间的引导加载过程没了。

三、分层原理

知道了镜像的加载原理，不妨再回头看下镜像分层的原理。之前提过，镜像下载的时候是分层下载的，有些层如果已经存在了，就无需再次下载。

比如我下载一个redis的镜像。

这种方式最大的好处就在于资源共享。比如有多个镜像都从相同的BASE镜像构建来的，那么宿主机只需要在磁盘上保留1分BASE镜像，同时内存中
也只需要加载一份BASE镜像，这样所有的容器都可以使用。另外，镜像的每一层都是可以共享的。

可以通过docker image inspect来查看镜像的分层，比如查看刚才下载的redis镜像：

docker image inspect redis:latest

所有的docker镜像都起始于一个基础镜像层，当进行修改或者增加新的内容时，就会在当前镜像层之上，创建新的镜像层。
比如：

我现在要制作一个镜像。

这个镜像基于Ubuntu linux 16.04，这也是镜像的第一层。
继续还要安装python包，就会在第一层之上创建第二个镜像层。
继续打补丁的话，还会再创建第三个镜像层。

要注意的是：
在添加额外的镜像层的同时，镜像始终保持是当前所有镜像的组合，如下图：

这里每个镜像层包含了3个文件，而镜像则是包含了来自2个镜像层的6个文件。

现在，如果第二层中的文件5 需要升级版本。这时候上层镜像中的文件会覆盖底层镜像中对应的文件，使得文件里更新版本作为一个新镜像层添加到镜像当中。

docker 通过存储引擎的方式来实现镜像层堆栈，并保证多镜像层对外展示为统一的文件系统。

四、commit镜像

通过上面的了解，现在已经知道镜像的结构原理，那么我们自己就可以制作一个镜像来。

比如，现在pull一个tomcat镜像作为基础层，我启动这个镜像后，在容器里做了一些我自己的改动，我觉得我的这些改动很好，镜像变得更好用了。那么我需要来保存这个容器的状态，通过commit命令，提交镜像。

docker commit -m="提交描述信息" -a="作者" 容器id 目标镜像名称:版本标签

运行tomcat后，进入到webapps下，发现是没有项目的，因为是阉割版。

现在我把webapps.dist下的所有内容copy到webapps下。

现在我用ip:8080就可以访问到项目了。

现在我提交这个改动过后的容器。

docker commit -m="pingguo first commit image" -a="pingguo" 03844ff66434 tomcatpingguo:1.0

通过自己的提交镜像操作，再回过来体会下镜像的分层，是不是理解更深刻了些？

–不要用肉体的勤奋，去掩盖思考的懒惰–

以上是关于Docker镜像加载原理的主要内容，如果未能解决你的问题，请参考以下文章

Docker 镜像-加载原理分层原理commit镜像

docker学习：docker镜像分层原理及本地镜像推送到阿里云或私服

Docker——Docker 镜像原理

Docker镜像详细