Docker 网络 和 资源限制
Posted 奋斗的蜗牛灬
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Docker 网络 和 资源限制相关的知识,希望对你有一定的参考价值。
前言
- Docker 是通过 namespace 实现资源隔离,通过 cgroup 实现资源限制
一、Docker 网络实现原理
1.1 Docker 的网桥与容器IP
- Docker 使用 Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时 会根据 Docker网桥的网段分配给容器一个IP地址,称为 Container-IP,同时Docker网桥(docker0)是每个容器的默认网关。
- 因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的 Container-IP(容器IP)直接通信。
- 默认情况下,外部网络不知道 docker 的 127.17.0.1 网桥地址 和 容器的 IP 地址。
1.2 查看容器的 IP 地址
docker ps -a
查看容器 exec 进入容器
yum install -y net-tools
1.3 宿主机访问容器
首先需要开启宿主机的IP转发功能:
echo 'net.ipv4.ip_forward=1' >> /etc/sysctl.conf
sysctl -p
重启docker 与网卡
- Docker网桥(docker 0)是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过Container-IP访问到容器。
- 如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即 docker run 创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过
[宿主机IP]:[容器端口]
访问容器。
启动容器时,指定容器端口格式:
docker run -itd --name test1 -P nginx #随机映射端口 (从32768开始)
docker run -itd --name test2 -p 43000:80 nginx #指定映射端口
-P 随机生成端口
宿主机IP:容器映射端口 来访问容器中的内容
-p 指定容器端口
用 http://192.168.10.70:49999/ 也可以成功访问 nginx服务。
进入容器中,修改查看 nginx 主页文件
那么是如何实现宿主机与容器之间的通信呢?
答:通过 iptables 的 DNAT ,目的网络地址转换
在docker run 指定 -p/-P 的时候就会添加一条 iptables 规则。
查看规则:iptables -t nat -nvL
1.4 Docker 的网络模式:
Docker 有五种网络模式:
- Host:容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。
- Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口。
- None:该模式关闭了容器的网络功能(不用网卡和IP地址)。
- Bridge:Docker默认为该模式,此模式会为每一个容器分配、设置IP等,并将容器连接到一个docker 0 虚拟网桥,通过 docker 0 网桥以及iptables nat 表配置与宿主机通信。
- 自定义网络:自己制定网段
安装Docker时,它会自动创建三个网络:
- Bridge (创建容器默认连接到此网络)
- None
- Host
#查看docker网络列表
docker network ls或docker network list
指定网络模式:
使用 docker run 创建 Docker 容器时,可以用 --net
或 --network
选项指定容器的网络模式:
- Host模式:使用
--net=host
指定。 - None模式:使用
--net=none
指定。 - Container模式:使用
--net=container:容器NAME 或 容器ID
指定,因为要制定是哪个容器。 - Bidge模式:使用
--net=bridge
指定,默认设置,可省略。
详解网络模式:
1.4.1 Host 模式
-
Host 是和宿主机共享IP和端口,相同
-
相当于Vmware中的桥接模式,与宿主机在同一个网络中,但没有独立IP地址;
-
Docker 使用了Linux的 Namespaces 技术来进行资源隔离,如:
- PID Namespace 隔离进程;
- Mount Namespace 隔离文件系统
- Network Namespacel 隔离网络等。
-
一个Network Namespace 提供了一份独立的网络环境,包括 网卡、路由、iptable规则等都与其他的Network Namespace隔离。
-
一个Docker容器一般会分配一个独立的Network Namespace。但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace,而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。
1.4.2 Container 模式
- Container 是和 容器共享网络IP和端口的,指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享;
- 新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等;
- 两个容器除了网络方面(两个容器共用一个命名空间),其他的如文件系统、进程列表等还是隔离的;
- 两个容器的进程可以通过lo网卡设备通信。
查看容器的进程号
一个容器就是一个进程,查看容器的进程号
docker ps -a
docker inspect -f '{{.State.Pid}}' 容器ID
根据容器进程ID查看容器命名空间 net namespace 编号
ls /proc/进程ID/ns
可以看到 两个容器的 net namespace 网络命名空间一样。
1.4.3 None模式
- 不用网卡和IP地址
- 使用 None模式,Docker容器拥有自己的 Network Namespace,但是,并不为Docker容器进行任何网络配置。
- 也就是说,这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络,没有其他网卡。这种类型的网络没有办法联网,封闭的网络能很好的保证容器的安全性。
- None网络模式下的 容器之间可以互通通信,无法与互联网进行通信。
1.4.4 Bridge模式
- Bridge 模式是 Docker 的默认网络模式,不指定
--net
参数,就是Bridge模式; - 相当于Vmware中的 nat 模式,容器使用独立 Network Namespace,并连接到 docker 0 虚拟网卡。通过 docker 0 网桥以及 iptables nat 表配置与宿主机通信,此模式会为每一个容器分配 Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。
(1)当Docker进程启动时,会在主机上创建一个名为 docker 0 的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。
(2)从 docker 0 子网中分配一个IP给容器使用,并设置 docker 0 的IP地址为容器的默认网关。在主机上创建一对虚拟网卡 veth pair 设备。veth 设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth 设备常用来连接两个网络设备。
(3)Docker 将 veth pair 设备的一端放在新创建的容器中,并命名为 eth0(容器的网卡),另一端放在主机中, 以veth*
这样类似的名字命名,并将这个网络设备加入到 docker 0 网桥中。可以通过 brctl show
命令查看。
(4)使用 docker run -p
时,docker实际是在iptables做了 DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL
查看。
两层
- 网桥和容器 通信用 veth pair 设备进行通信;
- 宿主机 和 docker 0 网桥 用 DNAT 转换(端口映射,实现外部网络和docker内部网络的通信)
1.4.5 自定义网络
#直接使用bridge模式,是无法支持指定IP运行docker的,例如执行以下命令就会报错
#先下载镜像(成功),再启动容器(会提示:不允许指定ip)
docker run -itd --name test3 --network bridge --ip 172.17.0.10 centos:7 /bin/bash
创建自定义网络,只能用自定义网络指定IP
#可以先自定义网络,再使用指定IP 运行docker
docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork
#docker1 为执行 ifconfig -a 命令时,显示的网卡名,如果不使用--opt参数指定此名称,那在使用 ifconfig -a命令查看网络信息时,看到的是类似 br-110eb56a0b22这样的名字,可读性差。
#mynetwork为执行 docker network list命令时,显示的bridge网络模式名称。
--subnet 指定网段
--opt 指定网卡名称
创建自定义网络后,执行 ifconfig 就能看到新生成的网卡。
用 docker network ls 就能查看到所有的网络模式
#用新生成的自定义网络 创建一个容器
docker run -itd --name test4 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash
二、Docker 资源限制
Docker 通过 cgroup 实现资源限制,cgroup 的四大功能:
- 资源限制:可以对任务使用的资源总额进行限制;
- 优先级分配:通过分配的 CPU 时间片数量以及磁盘 IO 带宽大小,实际上相当于控制了任务运行优先级;
- 资源统计:可以统计系统的资源使用量,如CPU 时长,内存用量等
- 任务控制:cgroup可以对任务执行挂起、恢复等操作;
批量停止、删除容器
2.1 设置CPU使用率上限(–cpu-quota)
- Linux 通过CFS(Completely Fair Scheduler,完全公平调度器)来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
- 我们可以设置每个容器进程的调度周期,以及在这个周期内各个容器最多能使用多少CPU时间(分片处理)。
使用 `--cpu-period` 即可设置调度周期,使用 `--cp-quota` 即可设置在每个周期内 容器能使用的CPU时间。两者可以配合使用。
CFS周期的有效范围是 1ms ~ 1s,对应的 --cpu-period 的数值范围是 1000~1000000。
而容器的CPU配额必须不小于1ms,即 --cpu-quota 的值必须 >= 1000。
#运行一个容器
docker run -itd --name test1 centos:7 /bin/bash
docker ps -a
CONTAINER ID IMAGE COMMAND STATUS NAMES
529892a5a585 centos:7 "/bin/bash" Up test1
cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
cat cpu.cfs_quota_us
-1
cat cpu.cfs_period_us
100000 #单位是微秒
-----------------
#cpu.cfs_period_us:cpu分配的周期(微秒,所以文件名中用 us 表示),默认为100000。
#cpu.cfs_quota_us:表示该control group限制占用的时间(微秒),默认为-1,表示不限制。 如果设为50000,表示占用50000/100000=50%的CPU。
-----------------
#进行CPU压力测试,写个一直执行的脚本
docker exec -it 529892a5a585 /bin/bash
vim /cpu.sh
#!/bin/bash
i=0
while true
do
let i++
done
#赋予权限,执行脚本
chmod +x /cpu.sh
./cpu.sh
exit
#查看这个脚本占了很多的cpu资源
top
执行 top 命令,可以看到 cpu.sh 占用 cpu 将近 100% ,这样CPU就被占满了,显然是不行的。
所以我们可以给它设置个使用 CPU 的上限。
CPU 修改限额、验证
【如果想只占用CPU 的50% ,就拿 cfs_period_us 的结果 乘以 50% 得到结果 50000 (100000*0.5=50000) ,修改到 cpu.cfs_quota_us 文件中】
#可以在刚启动容器时指定 CPU 限额
#设置CPU 使用时间上限比例 为 50%
docker run -itd --name test2 --cpu-quota 50000 centos:7 /bin/bash #可以重新创建一个容器并设置限额
#或者 在根据已经创建了的容器ID ,修改限额的文件,重新进入容器中
cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
echo 50000 > cpu.cfs_quota_us
docker exec -it 529892a5a585 /bin/bash
./cpu.sh
exit
#可以看到cpu占用率接近50%,cgroups对cpu的控制起了效果
top
2.2 设置CPU资源占用比(–cpu-shares)
- Docker 通过
--cpu-shares
指定CPU份额,默认值为1024,值为1024的倍数。 - 设置多个容器时才有效
#创建两个容器为 c1和 c2,若只有这两个容器,设置容器的权重,使得 c1 和 c2 的 CPU 资源占比为 1/3 和 2/3。
docker run -itd --name c1 --cpu-shares 512 centos:7
docker run -itd --name c2 --cpu-shares 1024 centos:7
#分别进入两个容器,安装stress压力测试工具
#进行压力测试
docker exec -it 容器ID1/容器ID2 bash
yum install -y epel-release
yum install -y stress
紧接着在两个容器内分别执行:产生四个进程
stress -c 4 #产生四个进程,每个进程都反复不停的计算随机数的平方根
#在开启个终端,查看容器运行状态(会动态更新)
docker stats #可以看到 CPU% 列的使用百分比为 1:2
我有两个CPU ,所以加起来是200%
top 能看到cpu 是将近100%
2.3 设置容器绑定指定的CPU(–cpuset-cpus)
- 比如虚拟机中有多个CPU,比如有四个CPU,序号分别为1、2、3 、4,我们可以指定序号为1、3 的两个CPU给容器 C3用。
#先分配虚拟机4个CPU核数
docker run -itd --name c3 --cpuset-cpus 1,3 centos:7 /bin/bash
#进入容器,进行压力测试,安装stress压力测试工具
docker exec -it 容器ID bash
yum install -y epel-release
yum install -y stress
stress -c 4
#退出容器,执行top命令再按1查看CPU使用情况。
top #按快捷键1
2.4 对内存使用的限制(-m)
#运行容器,对内存限额512M
docker run -itd --name test8 -m 512m centos:7 /bin/bash
#查看容器状态
docker stats
2.5 对磁盘IO配额控制(blkio)的限制
--device-read-bps
:限制某个设备上的读速度bps(数据量),单位可以是kb/s、mb(M)/s 或者 gb/s
例:
docker run -itd --name test9 --device-read-bps /dev/sda:1M centos:7 /bin/bash
--device-write-bps
:限制某个设备上的写速度bps (数据量),单位可以是kb/s、mb(M) 或者 gb/s
格式:--device-write-bps 磁盘名:容器在这个磁盘中写入的速度最大是`数据量/s`
如:/dev/sda:1mb
例:
docker run -itd --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash
--device-read-iops
:限制 读某个设备的 iops(次数)--device-write-iops
:限制 写入某个设备的 iops(次数)
#创建容器,并限制写速度
docker run -it --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash
#通过dd来验证写速度,if:从哪里获取数据 of:到哪个文件里 bs:每次取多少大小 count:执行写的次数
dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct
#添加oflag参数以规避掉文件系统cache
10+0 records in
10+0 records out
20971520 bytes (21 MB) copied, 20.0043 s, 1.0 MB/s
清理docker占用的磁盘空间
docker system prune -a
#可以用于清理磁盘,删除关闭的容器、无用的数据卷和网络,如 Exited 状态的容器
以上是关于Docker 网络 和 资源限制的主要内容,如果未能解决你的问题,请参考以下文章
Docker02:Docker核心技术探索使用cgroup限制资源的使用