Docker 网络 和 资源限制

Posted 奋斗的蜗牛灬

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Docker 网络 和 资源限制相关的知识,希望对你有一定的参考价值。

前言

  • Docker 是通过 namespace 实现资源隔离,通过 cgroup 实现资源限制

一、Docker 网络实现原理

1.1 Docker 的网桥与容器IP

  • Docker 使用 Linux桥接,在宿主机虚拟一个Docker容器网桥(docker0),Docker启动一个容器时 会根据 Docker网桥的网段分配给容器一个IP地址,称为 Container-IP,同时Docker网桥(docker0)是每个容器的默认网关。
  • 因为在同一宿主机内的容器都接入同一个网桥,这样容器之间就能够通过容器的 Container-IP(容器IP)直接通信。
  • 默认情况下,外部网络不知道 docker 的 127.17.0.1 网桥地址 和 容器的 IP 地址。

1.2 查看容器的 IP 地址

docker ps -a 
查看容器 exec 进入容器
yum install -y net-tools


1.3 宿主机访问容器

首先需要开启宿主机的IP转发功能:

echo 'net.ipv4.ip_forward=1' >> /etc/sysctl.conf
sysctl -p
重启docker 与网卡
  • Docker网桥(docker 0)是宿主机虚拟出来的,并不是真实存在的网络设备,外部网络是无法寻址到的,这也意味着外部网络无法直接通过Container-IP访问到容器。
  • 如果容器希望外部访问能够访问到,可以通过映射容器端口到宿主主机(端口映射),即 docker run 创建容器时候通过 -p 或 -P 参数来启用,访问容器的时候就通过 [宿主机IP]:[容器端口] 访问容器
启动容器时,指定容器端口格式:
docker run -itd --name test1 -P nginx   #随机映射端口 (32768开始)
docker run -itd --name test2 -p 43000:80 nginx  #指定映射端口

-P 随机生成端口

宿主机IP:容器映射端口 来访问容器中的内容

-p 指定容器端口

用 http://192.168.10.70:49999/ 也可以成功访问 nginx服务。

进入容器中,修改查看 nginx 主页文件

那么是如何实现宿主机与容器之间的通信呢?
答:通过 iptables 的 DNAT ,目的网络地址转换
在docker run 指定 -p/-P 的时候就会添加一条 iptables 规则。

查看规则:iptables -t nat -nvL

1.4 Docker 的网络模式:

Docker 有五种网络模式:

  • Host:容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。
  • Container:创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口。
  • None:该模式关闭了容器的网络功能(不用网卡和IP地址)。
  • Bridge:Docker默认为该模式,此模式会为每一个容器分配、设置IP等,并将容器连接到一个docker 0 虚拟网桥,通过 docker 0 网桥以及iptables nat 表配置与宿主机通信。
  • 自定义网络:自己制定网段

安装Docker时,它会自动创建三个网络:

  • Bridge (创建容器默认连接到此网络)
  • None
  • Host
#查看docker网络列表
docker network ls或docker network list

指定网络模式:

使用 docker run 创建 Docker 容器时,可以用 --net 或 --network 选项指定容器的网络模式:

  • Host模式:使用 --net=host 指定。
  • None模式:使用 --net=none 指定。
  • Container模式:使用 --net=container:容器NAME 或 容器ID 指定,因为要制定是哪个容器。
  • Bidge模式:使用 --net=bridge 指定,默认设置,可省略。

详解网络模式:

1.4.1 Host 模式

  • Host 是和宿主机共享IP和端口,相同

  • 相当于Vmware中的桥接模式,与宿主机在同一个网络中,但没有独立IP地址;

  • Docker 使用了Linux的 Namespaces 技术来进行资源隔离,如:

    • PID Namespace 隔离进程;
    • Mount Namespace 隔离文件系统
    • Network Namespacel 隔离网络等。
  • 一个Network Namespace 提供了一份独立的网络环境,包括 网卡、路由、iptable规则等都与其他的Network Namespace隔离。

  • 一个Docker容器一般会分配一个独立的Network Namespace。但如果启动容器的时候使用host模式,那么这个容器将不会获得一个独立的Network Namespace,而是和宿主机共用一个Network Namespace。容器将不会虚拟出自己的网卡、配置自己的IP等,而是使用宿主机的IP和端口。

1.4.2 Container 模式

  • Container 是和 容器共享网络IP和端口的,指定新创建的容器和已经存在的一个容器共享一个Network Namespace,而不是和宿主机共享;
  • 新创建的容器不会创建自己的网卡,配置自己的IP,而是和一个指定的容器共享IP、端口范围等;
  • 两个容器除了网络方面(两个容器共用一个命名空间),其他的如文件系统、进程列表等还是隔离的;
  • 两个容器的进程可以通过lo网卡设备通信。

查看容器的进程号

一个容器就是一个进程,查看容器的进程号

docker ps -a
docker inspect -f '{{.State.Pid}}' 容器ID

根据容器进程ID查看容器命名空间 net namespace 编号

ls /proc/进程ID/ns




可以看到 两个容器的 net namespace 网络命名空间一样。

1.4.3 None模式

  • 不用网卡和IP地址
  • 使用 None模式,Docker容器拥有自己的 Network Namespace,但是,并不为Docker容器进行任何网络配置。
  • 也就是说,这个Docker容器没有网卡、IP、路由等信息。这种网络模式下容器只有lo回环网络,没有其他网卡。这种类型的网络没有办法联网,封闭的网络能很好的保证容器的安全性。
  • None网络模式下的 容器之间可以互通通信,无法与互联网进行通信。

1.4.4 Bridge模式

  • Bridge 模式是 Docker 的默认网络模式,不指定 --net 参数,就是Bridge模式;
  • 相当于Vmware中的 nat 模式,容器使用独立 Network Namespace,并连接到 docker 0 虚拟网卡。通过 docker 0 网桥以及 iptables nat 表配置与宿主机通信,此模式会为每一个容器分配 Network Namespace、设置IP等,并将一个主机上的 Docker 容器连接到一个虚拟网桥上。

(1)当Docker进程启动时,会在主机上创建一个名为 docker 0 的虚拟网桥,此主机上启动的Docker容器会连接到这个虚拟网桥上。虚拟网桥的工作方式和物理交换机类似,这样主机上的所有容器就通过交换机连在了一个二层网络中。

(2)从 docker 0 子网中分配一个IP给容器使用,并设置 docker 0 的IP地址为容器的默认网关。在主机上创建一对虚拟网卡 veth pair 设备。veth 设备总是成对出现的,它们组成了一个数据的通道,数据从一个设备进入,就会从另一个设备出来。因此,veth 设备常用来连接两个网络设备。

(3)Docker 将 veth pair 设备的一端放在新创建的容器中,并命名为 eth0(容器的网卡),另一端放在主机中, 以veth*这样类似的名字命名,并将这个网络设备加入到 docker 0 网桥中。可以通过 brctl show 命令查看。

(4)使用 docker run -p 时,docker实际是在iptables做了 DNAT规则,实现端口转发功能。可以使用iptables -t nat -vnL 查看。


两层

  • 网桥和容器 通信用 veth pair 设备进行通信;
  • 宿主机 和 docker 0 网桥 用 DNAT 转换(端口映射,实现外部网络和docker内部网络的通信)

1.4.5 自定义网络

#直接使用bridge模式,是无法支持指定IP运行docker的,例如执行以下命令就会报错

#先下载镜像(成功),再启动容器(会提示:不允许指定ip)
docker run -itd --name test3 --network bridge --ip 172.17.0.10 centos:7 /bin/bash

创建自定义网络,只能用自定义网络指定IP

#可以先自定义网络,再使用指定IP 运行docker
docker network create --subnet=172.18.0.0/16 --opt "com.docker.network.bridge.name"="docker1" mynetwork

#docker1 为执行 ifconfig -a 命令时,显示的网卡名,如果不使用--opt参数指定此名称,那在使用 ifconfig -a命令查看网络信息时,看到的是类似 br-110eb56a0b22这样的名字,可读性差。
#mynetwork为执行 docker network list命令时,显示的bridge网络模式名称。

--subnet 指定网段
--opt 指定网卡名称

创建自定义网络后,执行 ifconfig 就能看到新生成的网卡。

 docker network ls 就能查看到所有的网络模式
#用新生成的自定义网络 创建一个容器
docker run -itd --name test4 --net mynetwork --ip 172.18.0.10 centos:7 /bin/bash



二、Docker 资源限制

Docker 通过 cgroup 实现资源限制,cgroup 的四大功能:

  • 资源限制:可以对任务使用的资源总额进行限制;
  • 优先级分配:通过分配的 CPU 时间片数量以及磁盘 IO 带宽大小,实际上相当于控制了任务运行优先级
  • 资源统计:可以统计系统的资源使用量,如CPU 时长,内存用量等
  • 任务控制cgroup可以对任务执行挂起、恢复等操作;

批量停止、删除容器

2.1 设置CPU使用率上限(–cpu-quota)

  • Linux 通过CFS(Completely Fair Scheduler,完全公平调度器)来调度各个进程对CPU的使用CFS默认的调度周期是100ms。
  • 我们可以设置每个容器进程的调度周期,以及在这个周期内各个容器最多能使用多少CPU时间(分片处理)。
使用 `--cpu-period` 即可设置调度周期,使用 `--cp-quota` 即可设置在每个周期内 容器能使用的CPU时间。两者可以配合使用。

CFS周期的有效范围是 1ms ~ 1s,对应的 --cpu-period 的数值范围是 1000~1000000

而容器的CPU配额必须不小于1ms,即 --cpu-quota 的值必须 >= 1000
#运行一个容器
docker run -itd --name test1 centos:7 /bin/bash

docker ps -a
CONTAINER ID   IMAGE      COMMAND       STATUS  NAMES
529892a5a585 centos:7   "/bin/bash"   Up      test1

cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
cat cpu.cfs_quota_us 
-1
cat cpu.cfs_period_us 
100000   #单位是微秒

-----------------
#cpu.cfs_period_us:cpu分配的周期(微秒,所以文件名中用 us 表示),默认为100000
#cpu.cfs_quota_us:表示该control group限制占用的时间(微秒),默认为-1,表示不限制。 如果设为50000,表示占用50000/100000=50%的CPU。
-----------------

#进行CPU压力测试,写个一直执行的脚本
docker exec -it 529892a5a585 /bin/bash

vim /cpu.sh

#!/bin/bash
i=0
while true
do
	let i++
done

#赋予权限,执行脚本
chmod +x /cpu.sh
./cpu.sh
exit

#查看这个脚本占了很多的cpu资源
top					


执行 top 命令,可以看到 cpu.sh 占用 cpu 将近 100% ,这样CPU就被占满了,显然是不行的。

所以我们可以给它设置个使用 CPU 的上限。

CPU 修改限额、验证

【如果想只占用CPU 50% ,就拿 cfs_period_us 的结果 乘以 50% 得到结果 50000 100000*0.5=50000 ,修改到 cpu.cfs_quota_us 文件中】
#可以在刚启动容器时指定 CPU 限额
#设置CPU 使用时间上限比例  50%
docker run -itd --name test2 --cpu-quota 50000 centos:7 /bin/bash	#可以重新创建一个容器并设置限额

#或者 在根据已经创建了的容器ID ,修改限额的文件,重新进入容器中

cd /sys/fs/cgroup/cpu/docker/529892a5a585f57d35a80024710b91cf69c85f9a93300e1a5816102e1fea324f/
echo 50000 > cpu.cfs_quota_us

docker exec -it 529892a5a585 /bin/bash
./cpu.sh
exit

#可以看到cpu占用率接近50%,cgroups对cpu的控制起了效果
top					

2.2 设置CPU资源占用比(–cpu-shares)

  • Docker 通过 --cpu-shares 指定CPU份额,默认值为1024,值为1024的倍数
  • 设置多个容器时才有效
#创建两个容器为 c1和 c2,若只有这两个容器,设置容器的权重,使得 c1  c2  CPU 资源占比为 1/3  2/3
docker run -itd --name c1 --cpu-shares 512 centos:7
docker run -itd --name c2 --cpu-shares 1024 centos:7

#分别进入两个容器,安装stress压力测试工具
#进行压力测试
docker exec -it 容器ID1/容器ID2 bash  
yum install -y epel-release
yum install -y stress

紧接着在两个容器内分别执行:产生四个进程
stress -c 4      #产生四个进程,每个进程都反复不停的计算随机数的平方根

#在开启个终端,查看容器运行状态(会动态更新)
docker stats    #可以看到 CPU% 列的使用百分比为 1:2



我有两个CPU ,所以加起来是200%

top 能看到cpu 是将近100%

2.3 设置容器绑定指定的CPU(–cpuset-cpus)

  • 比如虚拟机中有多个CPU,比如有四个CPU,序号分别为1、2、3 、4,我们可以指定序号为1、3 的两个CPU给容器 C3用。
#先分配虚拟机4个CPU核数
docker run -itd --name c3 --cpuset-cpus 1,3 centos:7 /bin/bash

#进入容器,进行压力测试,安装stress压力测试工具
docker exec -it 容器ID bash 
yum install -y epel-release
yum install -y stress 
stress -c 4
#退出容器,执行top命令再按1查看CPU使用情况。
top  #按快捷键1


2.4 对内存使用的限制(-m)

#运行容器,对内存限额512M
docker run -itd --name test8 -m 512m centos:7 /bin/bash

#查看容器状态
docker stats


2.5 对磁盘IO配额控制(blkio)的限制

  • --device-read-bps:限制某个设备上的读速度bps(数据量),单位可以是kb/s、mb(M)/s 或者 gb/s
例:
docker run -itd --name test9 --device-read-bps /dev/sda:1M centos:7 /bin/bash
  • --device-write-bps:限制某个设备上的写速度bps (数据量),单位可以是kb/s、mb(M) 或者 gb/s
格式:--device-write-bps  磁盘名:容器在这个磁盘中写入的速度最大是`数据量/s`
如:/dev/sda:1mb 

: 
docker run -itd --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash
  • --device-read-iops:限制 读某个设备的 iops(次数)
  • --device-write-iops:限制 写入某个设备的 iops(次数)
#创建容器,并限制写速度
docker run -it --name test10 --device-write-bps /dev/sda:1mb centos:7 /bin/bash


#通过dd来验证写速度,if:从哪里获取数据  of:到哪个文件里   bs:每次取多少大小 count:执行写的次数 
dd if=/dev/zero of=test.out bs=1M count=10 oflag=direct	

#添加oflag参数以规避掉文件系统cache
10+0 records in
10+0 records out
20971520 bytes (21 MB) copied, 20.0043 s, 1.0 MB/s

清理docker占用的磁盘空间

docker system prune -a
#可以用于清理磁盘,删除关闭的容器、无用的数据卷和网络,如 Exited 状态的容器


以上是关于Docker 网络 和 资源限制的主要内容,如果未能解决你的问题,请参考以下文章

Docker 运行时资源限制

Docker02:Docker核心技术探索使用cgroup限制资源的使用

理解Docker:Docker 容器使用 cgroups 限制资源使用

Docker之Linux Cgroup实践

Docker第八回(docker资源限制和验证)

Hello Docker——Docker资源配额