Docker镜像加载原理
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Docker镜像加载原理相关的知识,希望对你有一定的参考价值。
参考技术A 1.1 UnionFS(联合文件系统)
UnionFS(联合文件系统): Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem)。Union文件系统是Docker镜像的基础。镜像可以通过分层来进行继承, 基于基础镜像(没有父镜像), 可以制作各种具体的应用镜像。
特性: 一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。
1.2 Docker镜像加载原理
docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统UnionFS。
bootfs(boot file system) 主要包含bootloader和kernel,bootloader主要是引导加载kernel,Linux刚启动时会加载bootfs文件系统,在Docker镜像的最底层是bootfs。这一层与我们典型的Linux/Unix系统是一样的, 包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。
rootfs(root file system), 在bootfs之上。包含的就是典型Linux系统中的/dev, /proc, /bin, /etc等标准目录和文件。rootfs就是各种不同的操作系统发行版,比如Ubuntu,Centos等等
特点:容器层之下都属于镜像层,镜像层是只读的!
Docker 镜像-加载原理分层原理commit镜像
一、什么是镜像
镜像是一种轻量级、可执行的独立软件包,用来打包软件运行环境和基于运行环境开发的软件。
它包含运行某个软件所需的所有内容,包括代码、运行时环境、库、环境变量和配置文件。
所有的应用,直接打包成docker镜像,就可以直接跑起来。
如何得到镜像:
- 从远程仓库下载
- 从其他地方copy
- 自己制作一个镜像 DockerFile
二、docker镜像加载原理
1. 联合文件系统UnionFS
UnionFS是一种分层、轻量级并且高性能的文件系统。支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录
挂载到同一个虚拟文件系统下。这个在我们下载镜像的时候,就可以看到这样的效果。
比如有涉及到相同的文件,那么就可以共用了,极大节省资源。
UnionFS是docker镜像的基础,镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以
制作各种具体的应用镜像。
特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会
包含所有底层的文件和目录。
2. 镜像加载原理
docker的镜像实际上由一层一层的文件系统组成,这种层级文件系统就是上述的UnionFS。接着,在内部又分为2部分:
- bootfs(boot file system):docker镜像的最底层是bootfs,主要包含bootloader(加载器)和kernel(内核)。
bootloader主要是引导加载kernel,linux刚启动时会加载bootfs文件系统。这一层与典型的linux/Unix系统一样,包含bootloader和kernel。 当boot加载完成后,整个内核就在内存中了,此时内存的使用权已由bootfs转交给了内核,此时系统也会卸载bootfs。这里的加载,可以理解为,我们windows电脑开机时候,从黑屏到进入操作系统的过程。 - rootfs(root filesystem):在bootfs之上,包含的就是典型linux系统中的/dev、/proc、/bin、/etc等标准目录和文件。
rootfs就是各种不同的操作系统发行版,比如Ubuntu、Centos等等。
如图所示:
图中以debian系统为例,从左到右,分为3个过程:
- 图1,开始的状态,下载了一个debian系统。
- 图2,安装了一个emacs,这时候可以看到在图1基础上,加了一层Image。
- 图3,又装了一个Apache,此时在图2的基础上再加了一层Image。
说明了docker的镜像实际上是由层一层的文件系统组成的。对于不同的的linux发行版本,bootfs基本是一致的,rootfs会有差别,所以不同的
发行版可以共用bootfs。
另外,在docker上的操作系统通常都是精简版的,在VM上安装个centos镜像大小1个G多,而在docker上的centos镜像只有200M大小。
因为底层直接用主机的内核,自己只需要提供rootfs就行了,所以rootfs可以很小,只需要包含最基本的命令、工具和程序库即可。
这样一来,启动速度也快了,因为最浪费时间的引导加载过程没了。
三、分层原理
知道了镜像的加载原理,不妨再回头看下镜像分层的原理。之前提过,镜像下载的时候是分层下载的,有些层如果已经存在了,就无需再次下载。
比如我下载一个redis的镜像。
这种方式最大的好处就在于资源共享。比如有多个镜像都从相同的BASE镜像构建来的,那么宿主机只需要在磁盘上保留1分BASE镜像,同时内存中
也只需要加载一份BASE镜像,这样所有的容器都可以使用。另外,镜像的每一层都是可以共享的。
可以通过docker image inspect来查看镜像的分层,比如查看刚才下载的redis镜像:
docker image inspect redis:latest
所有的docker镜像都起始于一个基础镜像层,当进行修改或者增加新的内容时,就会在当前镜像层之上,创建新的镜像层。
比如:
我现在要制作一个镜像。
- 这个镜像基于Ubuntu linux 16.04,这也是镜像的第一层。
- 继续还要安装python包,就会在第一层之上创建第二个镜像层。
- 继续打补丁的话,还会再创建第三个镜像层。
要注意的是:
在添加额外的镜像层的同时,镜像始终保持是当前所有镜像的组合,如下图:
这里每个镜像层包含了3个文件,而镜像则是包含了来自2个镜像层的6个文件。
现在,如果第二层中的 文件5 需要升级版本。这时候上层镜像中的文件会覆盖底层镜像中对应的文件,使得文件里更新版本作为一个新镜像层添加到镜像当中。
docker 通过存储引擎的方式来实现镜像层堆栈,并保证多镜像层对外展示为统一的文件系统。
四、commit镜像
通过上面的了解,现在已经知道镜像的结构原理,那么我们自己就可以制作一个镜像来。
比如,现在pull一个tomcat镜像作为基础层,我启动这个镜像后,在容器里做了一些我自己的改动,我觉得我的这些改动很好,镜像变得更好用了。那么我需要来保存这个容器的状态,通过commit命令,提交镜像。
docker commit -m="提交描述信息" -a="作者" 容器id 目标镜像名称:版本标签
运行tomcat后,进入到webapps下,发现是没有项目的,因为是阉割版。
现在我把webapps.dist下的所有内容copy到webapps下。
现在我用ip:8080就可以访问到项目了。
现在我提交这个改动过后的容器。
docker commit -m="pingguo first commit image" -a="pingguo" 03844ff66434 tomcatpingguo:1.0
通过自己的提交镜像操作,再回过来体会下镜像的分层,是不是理解更深刻了些?
–不要用肉体的勤奋,去掩盖思考的懒惰–
以上是关于Docker镜像加载原理的主要内容,如果未能解决你的问题,请参考以下文章
docker学习:docker镜像分层原理及本地镜像推送到阿里云或私服
docker学习:docker镜像分层原理及本地镜像推送到阿里云或私服