Docker 网络和资源限制

Posted 2021-08-28 奋斗的蜗牛灬

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Docker 网络和资源限制相关的知识，希望对你有一定的参考价值。

前言

Docker 是通过 namespace 实现资源隔离，通过 cgroup 实现资源限制

一、Docker 网络实现原理

1.1 Docker 的网桥与容器IP

Docker 使用 Linux桥接，在宿主机虚拟一个Docker容器网桥（docker0），Docker启动一个容器时会根据 Docker网桥的网段分配给容器一个IP地址，称为 Container-IP，同时Docker网桥（docker0）是每个容器的默认网关。
因为在同一宿主机内的容器都接入同一个网桥，这样容器之间就能够通过容器的 Container-IP（容器IP）直接通信。
默认情况下，外部网络不知道 docker 的 127.17.0.1 网桥地址和容器的 IP 地址。

1.2 查看容器的 IP 地址

docker ps -a 
查看容器 exec 进入容器
yum install -y net-tools

1.3 宿主机访问容器

首先需要开启宿主机的IP转发功能：

echo 'net.ipv4.ip_forward=1' >> /etc/sysctl.conf
sysctl -p
重启docker 与网卡

Docker网桥（docker 0）是宿主机虚拟出来的，并不是真实存在的网络设备，外部网络是无法寻址到的，这也意味着外部网络无法直接通过Container-IP访问到容器。
如果容器希望外部访问能够访问到，可以通过映射容器端口到宿主主机（端口映射），即 docker run 创建容器时候通过 -p 或 -P 参数来启用，访问容器的时候就通过 [宿主机IP]:[容器端口] 访问容器。

启动容器时，指定容器端口格式：
docker run -itd --name test1 -P nginx   #随机映射端口 (从32768开始）
docker run -itd --name test2 -p 43000:80 nginx  #指定映射端口

-P 随机生成端口

宿主机IP:容器映射端口来访问容器中的内容

-p 指定容器端口

用 http://192.168.10.70:49999/ 也可以成功访问 nginx服务。

进入容器中，修改查看 nginx 主页文件

那么是如何实现宿主机与容器之间的通信呢？
答：通过 iptables 的 DNAT ，目的网络地址转换
在docker run 指定 -p/-P 的时候就会添加一条 iptables 规则。

查看规则：iptables -t nat -nvL

1.4 Docker 的网络模式:

Docker 有五种网络模式：

Host：容器将不会虚拟出自己的网卡、配置自己的IP等，而是使用宿主机的IP和端口。
Container：创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口。
None：该模式关闭了容器的网络功能（不用网卡和IP地址）。
Bridge：Docker默认为该模式，此模式会为每一个容器分配、设置IP等，并将容器连接到一个docker 0 虚拟网桥，通过 docker 0 网桥以及iptables nat 表配置与宿主机通信。
自定义网络：自己制定网段

安装Docker时，它会自动创建三个网络：

Bridge (创建容器默认连接到此网络）
None
Host

#查看docker网络列表
docker network ls或docker network list

指定网络模式：

使用 docker run 创建 Docker 容器时，可以用 --net 或 --network 选项指定容器的网络模式：

Host模式：使用 --net=host 指定。
None模式：使用 --net=none 指定。
Container模式：使用 --net=container:容器NAME 或容器ID 指定，因为要制定是哪个容器。
Bidge模式：使用 --net=bridge 指定，默认设置，可省略。

详解网络模式：

1.4.1 Host 模式

Host 是和宿主机共享IP和端口，相同
相当于Vmware中的桥接模式，与宿主机在同一个网络中，但没有独立IP地址；
Docker 使用了Linux的 Namespaces 技术来进行资源隔离，如：
- PID Namespace 隔离进程;
- Mount Namespace 隔离文件系统
- Network Namespacel 隔离网络等。
一个Network Namespace 提供了一份独立的网络环境，包括网卡、路由、iptable规则等都与其他的Network Namespace隔离。
一个Docker容器一般会分配一个独立的Network Namespace。但如果启动容器的时候使用host模式，那么这个容器将不会获得一个独立的Network Namespace，而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等，而是使用宿主机的IP和端口。

1.4.2 Container 模式

Container 是和容器共享网络IP和端口的，指定新创建的容器和已经存在的一个容器共享一个Network Namespace，而不是和宿主机共享；
新创建的容器不会创建自己的网卡，配置自己的IP，而是和一个指定的容器共享IP、端口范围等；
两个容器除了网络方面（两个容器共用一个命名空间），其他的如文件系统、进程列表等还是隔离的；
两个容器的进程可以通过lo网卡设备通信。

查看容器的进程号

一个容器就是一个进程，查看容器的进程号

docker ps -a
docker inspect -f '{{.State.Pid}}' 容器ID

根据容器进程ID查看容器命名空间 net namespace 编号

ls /proc/进程ID/ns

可以看到两个容器的 net namespace 网络命名空间一样。

1.4.3 None模式

不用网卡和IP地址
使用 None模式，Docker容器拥有自己的 Network Namespace，但是，并不为Docker容器进行任何网络配置。
也就是说，这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络，没有其他网卡。这种类型的网络没有办法联网，封闭的网络能很好的保证容器的安全性。
None网络模式下的容器之间可以互通通信，无法与互联网进行通信。

1.4.4 Bridge模式

Bridge 模式是 Docker 的默认网络模式，不指定 --net 参数，就是Bridge模式；
相当于Vmware中的 nat 模式，容器使用独立 Network Namespace，并连接到 docker 0 虚拟网卡。通过 docker 0 网桥以及 iptables nat 表配置与宿主机通信，此模式会为每一个容器分配 Network Namespace、设置IP等，并将一个主机上的 Docker 容器连接到一个虚拟网桥上。

（1）当Docker进程启动时，会在主机上创建一个名为 docker 0 的虚拟网桥，此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似，这样主机上的所有容器就通过交换机连在了一个二层网络中。

（2）从 docker 0 子网中分配一个IP给容器使用，并设置 docker 0 的IP地址为容器的默认网关。在主机上创建一对虚拟网卡 veth pair 设备。veth 设备总是成对出现的，它们组成了一个数据的通道，数据从一个设备进入，就会从另一个设备出来。因此，veth 设备常用来连接两个网络设备。

（3）Docker 将 veth pair 设备的一端放在新创建的容器中，并命名为 eth0（容器的网卡），另一端放在主机中，以veth*这样类似的名字命名，并将这个网络设备加入到 docker 0 网桥中。可以通过 brctl show 命令查看。

（4）使用 docker run -p 时，docker实际是在iptables做了 DNAT规则，实现端口转发功能。可以使用iptables -t nat -vnL 查看。

两层

网桥和容器通信用 veth pair 设备进行通信；
宿主机和 docker 0 网桥用 DNAT 转换（端口映射，实现外部网络和docker内部网络的通信）

1.4.5 自定义网络

#直接使用bridge模式，是无法支持指定IP运行docker的，例如执行以下命令就会报错

#先下载镜像（成功），再启动容器（会提示：不允许指定ip）
docker run -itd --name test3 --network bridge --ip 172.17.0.10 centos:7 /bin/bash

创建自定义网络，只能用自定义网络指定IP

#可以先自定义网络，再使用指定IP 运行docker
docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork

#docker1 为执行 ifconfig -a 命令时，显示的网卡名，如果不使用--opt参数指定此名称，那在使用 ifconfig -a命令查看网络信息时，看到的是类似 br-110eb56a0b22这样的名字，可读性差。
#mynetwork为执行 docker network list命令时，显示的bridge网络模式名称。

--subnet 指定网段
--opt 指定网卡名称

创建自定义网络后，执行 ifconfig 就能看到新生成的网卡。

用 docker network ls 就能查看到所有的网络模式

#用新生成的自定义网络 创建一个容器
docker run -itd --name test4 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash

二、Docker 资源限制

Docker 通过 cgroup 实现资源限制，cgroup 的四大功能：

资源限制：可以对任务使用的资源总额进行限制；
优先级分配：通过分配的 CPU 时间片数量以及磁盘 IO 带宽大小，实际上相当于控制了任务运行优先级；
资源统计：可以统计系统的资源使用量，如CPU 时长，内存用量等
任务控制：cgroup可以对任务执行挂起、恢复等操作；

批量停止、删除容器

2.1 设置CPU使用率上限（–cpu-quota）

Linux 通过CFS（Completely Fair Scheduler，完全公平调度器）来调度各个进程对CPU的使用。CFS默认的调度周期是100ms。
我们可以设置每个容器进程的调度周期，以及在这个周期内各个容器最多能使用多少CPU时间（分片处理）。

使用 `--cpu-period` 即可设置调度周期，使用 `--cp-quota` 即可设置在每个周期内 容器能使用的CPU时间。两者可以配合使用。

CFS周期的有效范围是 1ms ~ 1s，对应的 --cpu-period 的数值范围是 1000~1000000。

而容器的CPU配额必须不小于1ms，即 --cpu-quota 的值必须 >= 1000。

#运行一个容器
docker run -itd --name test1 centos:7 /bin/bash

docker ps -a
CONTAINER ID   IMAGE      COMMAND       STATUS  NAMES
529892a5a585 centos:7   "/bin/bash"   Up      test1

cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
cat cpu.cfs_quota_us 
-1
cat cpu.cfs_period_us 
100000   #单位是微秒

-----------------
#cpu.cfs_period_us：cpu分配的周期(微秒，所以文件名中用 us 表示），默认为100000。
#cpu.cfs_quota_us：表示该control group限制占用的时间（微秒），默认为-1，表示不限制。 如果设为50000，表示占用50000/100000=50%的CPU。
-----------------

#进行CPU压力测试，写个一直执行的脚本
docker exec -it 529892a5a585 /bin/bash

vim /cpu.sh

#!/bin/bash
i=0
while true
do
	let i++
done

#赋予权限，执行脚本
chmod +x /cpu.sh
./cpu.sh
exit

#查看这个脚本占了很多的cpu资源
top

执行 top 命令，可以看到 cpu.sh 占用 cpu 将近 100% ，这样CPU就被占满了，显然是不行的。

所以我们可以给它设置个使用 CPU 的上限。

CPU 修改限额、验证

【如果想只占用CPU 的50% ,就拿 cfs_period_us 的结果 乘以 50% 得到结果 50000 （100000*0.5=50000） ，修改到 cpu.cfs_quota_us 文件中】

#可以在刚启动容器时指定 CPU 限额
#设置CPU 使用时间上限比例 为 50%
docker run -itd --name test2 --cpu-quota 50000 centos:7 /bin/bash	#可以重新创建一个容器并设置限额

#或者 在根据已经创建了的容器ID ，修改限额的文件，重新进入容器中

cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
echo 50000 > cpu.cfs_quota_us

docker exec -it 529892a5a585 /bin/bash
./cpu.sh
exit

#可以看到cpu占用率接近50%，cgroups对cpu的控制起了效果
top

2.2 设置CPU资源占用比（–cpu-shares）

Docker 通过 --cpu-shares 指定CPU份额，默认值为1024，值为1024的倍数。
设置多个容器时才有效

#创建两个容器为 c1和 c2，若只有这两个容器，设置容器的权重，使得 c1 和 c2 的 CPU 资源占比为 1/3 和 2/3。
docker run -itd --name c1 --cpu-shares 512 centos:7
docker run -itd --name c2 --cpu-shares 1024 centos:7

#分别进入两个容器，安装stress压力测试工具
#进行压力测试
docker exec -it 容器ID1/容器ID2 bash  
yum install -y epel-release
yum install -y stress

紧接着在两个容器内分别执行：产生四个进程
stress -c 4      #产生四个进程，每个进程都反复不停的计算随机数的平方根

#在开启个终端，查看容器运行状态(会动态更新)
docker stats    #可以看到 CPU% 列的使用百分比为 1:2

我有两个CPU ，所以加起来是200%

top 能看到cpu 是将近100%

2.3 设置容器绑定指定的CPU（–cpuset-cpus）

比如虚拟机中有多个CPU，比如有四个CPU，序号分别为1、2、3 、4，我们可以指定序号为1、3 的两个CPU给容器 C3用。

#先分配虚拟机4个CPU核数
docker run -itd --name c3 --cpuset-cpus 1,3 centos:7 /bin/bash

#进入容器，进行压力测试,安装stress压力测试工具
docker exec -it 容器ID bash 
yum install -y epel-release
yum install -y stress 
stress -c 4
#退出容器，执行top命令再按1查看CPU使用情况。
top  #按快捷键1

2.4 对内存使用的限制（-m）

#运行容器，对内存限额512M
docker run -itd --name test8 -m 512m centos:7 /bin/bash

#查看容器状态
docker stats

2.5 对磁盘IO配额控制（blkio）的限制

--device-read-bps：限制某个设备上的读速度bps（数据量），单位可以是kb/s、mb(M)/s 或者 gb/s

例：
docker run -itd --name test9 --device-read-bps /dev/sda:1M centos:7 /bin/bash

--device-write-bps：限制某个设备上的写速度bps (数据量)，单位可以是kb/s、mb(M) 或者 gb/s

格式：--device-write-bps  磁盘名:容器在这个磁盘中写入的速度最大是`数据量/s`
如：/dev/sda:1mb 

例: 
docker run -itd --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash

--device-read-iops：限制读某个设备的 iops（次数)
--device-write-iops：限制写入某个设备的 iops（次数）

#创建容器，并限制写速度
docker run -it --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash


#通过dd来验证写速度，if：从哪里获取数据  of：到哪个文件里   bs：每次取多少大小 count:执行写的次数 
dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct	

#添加oflag参数以规避掉文件系统cache
10+0 records in
10+0 records out
20971520 bytes (21 MB) copied, 20.0043 s, 1.0 MB/s

清理docker占用的磁盘空间

docker system prune -a
#可以用于清理磁盘，删除关闭的容器、无用的数据卷和网络，如 Exited 状态的容器

以上是关于Docker 网络和资源限制的主要内容，如果未能解决你的问题，请参考以下文章

Docker 网络 和 资源限制

目录

前言