2 二进制方式搭建K8S集群
Posted Frankmy
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了2 二进制方式搭建K8S集群相关的知识,希望对你有一定的参考价值。
本文介绍单/多Master的K8S集群搭建全过程。
目录
4.4 部署 kube-controller-manager
7.2 部署 Nginx+Keepalived 高可用负载均衡器
1 环境要求、节点规划、配置
1.1 环境要求
- 操作系统:CentOS7.8_x64 (mini)
- 系统配置(每台虚拟机):2G内存、2个CPU、每个CPU上1个核心、20G硬盘
- 网络要求:每台虚拟机可访问外网,机器之间可相互访问
- Docker 版本:19-ce
- Kubernetes 版本:1.18
1.2 节点规划
由于我只有一台笔记本电脑(WIN10,16G内存),为了在VMWare中少开启几台虚拟机,就把ETCD集群分别放到仅有的3个节点中,单Master节点的K8S集群部署架构及组件安装如下图:
因此,本次环境搭建,一共用到3台虚拟机(单Master节点、双Node节点,1+2=3台)
单Master的K8S集群节点规划如下 :
节点 | ip | 需要安装的组件 |
k8s-master1 | 192.168.200.200 | kube-apiserver、kube-controller-manager、kube-scheduler、etcd |
k8s-node1 | 192.168.200.201 | kubelet、kube-proxy、docker、etcd |
k8s-node2 | 192.168.200.202 | kubelet、kube-proxy、docker、etcd |
1.3 操作系统初始化配置
如下的8个步骤,需要在三台主机上分别执行一遍:
# 1、关闭防火墙
systemctl stop firewalld && systemctl disable firewalld
# 2、关闭selinux(我选择永久关闭,需要重启机器)
永久关闭:sed -i 's/enforcing/disabled/' /etc/selinux/config
临时关闭:setenforce 0
# 3、关闭swap(我选择永久关闭)
永久关闭:sed -ri 's/.*swap.*/#&/' /etc/fstab
临时关闭:swapoff -a
# 4、根据规划设置主机名(更改后命令行输入:bash 直接生效)
hostnamectl set-hostname k8s-master1
hostnamectl set-hostname k8s-node1
hostnamectl set-hostname k8s-node2
# 5、在master节点中添加集群中各个节点的主机名与ip的对应关系
#只有这个部分是只在Master中执行,其他的指令需要在3台机器上都执行一遍
cat >> /etc/hosts << EOF
192.168.200.200 k8s-master
192.168.200.201 k8s-node1
192.168.200.202 k8s-node2
EOF
# 6、将桥接的IPv4流量传递到iptables的链
cat > /etc/sysctl.d/k8s.conf << EOF
net.bridge.bridge-nf-call-ip6tables = 1
net.bridge.bridge-nf-call-iptables = 1
EOF
# 7、配置生效
sysctl --system
# 8、时间同步
yum install ntpdate -y && ntpdate time.windows.com
2 ETCD集群部署
Etcd 是一个分布式键值存储系统,Kubernetes使用Etcd进行数据存储,所以先准备一个Etcd数据库,为解决Etcd单点故障,应采用集群方式部署,这里使用3台组建集群,可容忍1台机器故障。为了节省机器,这里把3个ETCD实例分别部署在一个Matser节点和两个Node节点上。
ETCD实例 | IP |
etcd-1 | 192.168.200.200 |
etcd-2 | 192.168.200.201 |
etcd-3 | 192.168.200.202 |
2.1 准备cfssl证书生成工具
#1、安装cfssl证书生成工具(如果下载不了,可尝试换成http协议)
wget https://pkg.cfssl.org/R1.2/cfssl_linux-amd64
wget https://pkg.cfssl.org/R1.2/cfssljson_linux-amd64
wget https://pkg.cfssl.org/R1.2/cfssl-certinfo_linux-amd64
chmod +x cfssl_linux-amd64 cfssljson_linux-amd64 cfssl-certinfo_linux-amd64
mv cfssl_linux-amd64 /usr/local/bin/cfssl
mv cfssljson_linux-amd64 /usr/local/bin/cfssljson
mv cfssl-certinfo_linux-amd64 /usr/bin/cfssl-certinfo
2.2 生成ETCD证书
#2、生成自签证书的根证书:创建文件夹
mkdir -p ~/TLS/{etcd,k8s}
cd TLS/etcd
#3、生成自签证书的根证书:文件夹中写入配置文件2个
#配置文件1
cat > ca-config.json << EOF
{
"signing": {
"default": {
"expiry": "87600h"
},
"profiles": {
"www": {
"expiry": "87600h",
"usages": [
"signing",
"key encipherment",
"server auth",
"client auth"
]
}
}
}
}
EOF
#配置文件2
cat > ca-csr.json << EOF
{
"CN": "etcd CA",
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "Beijing",
"ST": "Beijing"
}
]
}
EOF
#4、执行如下指令生成证书
cfssl gencert -initca ca-csr.json | cfssljson -bare ca -
接下来,使用自签的根证书签发ETCD HTTPS证书:
#5、创建证书申请文件
cat > server-csr.json << EOF
{
"CN": "etcd",
"hosts": [
"192.168.200.200",
"192.168.200.201",
"192.168.200.202"
],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing"
}
]
}
EOF
注意:上面配置文件中hosts字段中的IP为所有etcd节点的集群内部通信IP,为了方便后期扩容可以多写几个预留IP(我没有预留)。
#6、生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=www server-csr.json | cfssljson -bare server
到目前为止,已经基于ETCD的根证书,生成了两个域名证书如下,用于ETCD集群使用HTTPS进行通信 :
2.3 下载ETCD的二进制文件
浏览器输入地址直接下载,下载之后把压缩包拖动到root目录下。
https://github.com/etcd-io/etcd/releases/download/v3.4.9/etcd-v3.4.9-linux-amd64.tar.gz
2.4 部署ETCD集群
以下操作只在节点1(Master)上进行一遍,至于节点2、3,直接从节点1中把结果拷贝过去即可。
- step1:创建工作目录并解压二进制包
mkdir /opt/etcd/{bin,cfg,ssl} -p
tar zxvf etcd-v3.4.9-linux-amd64.tar.gz
mv etcd-v3.4.9-linux-amd64/{etcd,etcdctl} /opt/etcd/bin/
- step2:创建ETCD配置文件
cat > /opt/etcd/cfg/etcd.conf << EOF
#[Member]
ETCD_NAME="etcd-1"
ETCD_DATA_DIR="/var/lib/etcd/default.etcd"
ETCD_LISTEN_PEER_URLS="https://192.168.200.200:2380"
ETCD_LISTEN_CLIENT_URLS="https://192.168.200.200:2379"
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.200.200:2380"
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.200.200:2379"
ETCD_INITIAL_CLUSTER="etcd-1=https://192.168.200.200:2380,etcd-2=https://192.168.200.201:2380,etcd-3=https://192.168.200.202:2380"
ETCD_INITIAL_CLUSTER_TOKEN="etcd-cluster"
ETCD_INITIAL_CLUSTER_STATE="new"
EOF
配置文件中各个参数含义如下:
#ETCD_NAME:节点名称,集群中唯一
#ETCD_DATA_DIR:数据目录
#ETCD_LISTEN_PEER_URLS:集群通信监听地址
#ETCD_LISTEN_CLIENT_URLS:客户端访问监听地址
#ETCD_INITIAL_ADVERTISE_PEER_URLS:集群通告地址
#ETCD_ADVERTISE_CLIENT_URLS:客户端通告地址
#ETCD_INITIAL_CLUSTER:集群节点地址
#ETCD_INITIAL_CLUSTER_TOKEN:集群Token
#ETCD_INITIAL_CLUSTER_STATE:加入集群的当前状态,new是新集群,existing表示加入已有集群
- step3:systemd管理etcd
cat > /usr/lib/systemd/system/etcd.service << EOF
[Unit]
Description=Etcd Server
After=network.target
After=network-online.target
Wants=network-online.target
[Service]
Type=notify
EnvironmentFile=/opt/etcd/cfg/etcd.conf
ExecStart=/opt/etcd/bin/etcd \\
--cert-file=/opt/etcd/ssl/server.pem \\
--key-file=/opt/etcd/ssl/server-key.pem \\
--peer-cert-file=/opt/etcd/ssl/server.pem \\
--peer-key-file=/opt/etcd/ssl/server-key.pem \\
--trusted-ca-file=/opt/etcd/ssl/ca.pem \\
--peer-trusted-ca-file=/opt/etcd/ssl/ca.pem \\
--logger=zap
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
- step4:拷贝证书到配置文件路径下
cp ~/TLS/etcd/ca*pem ~/TLS/etcd/server*pem /opt/etcd/ssl/
- step5:启动,并设置开机启动
systemctl daemon-reload
systemctl enable etcd
systemctl start etcd
注意:systemctl start etcd 指令执行之后会“卡住”因为其他的ETCD节点还没部署呢。输入以下的指令可以查看日志:
#把和etcd有关的日志保存到a文件中,再从a中检索和ip相关的内容,下图截取了其中的一部分
#注意:本步骤不是必须要执行的
journalctl -u etcd > a
cat a grep|192.168.200
- step6:将上述节点1所有生成的文件拷贝到节点2和节点3
#分别拷贝etcd的工作目录、管理服务的配置文件到另外两台主机
scp -r /opt/etcd/ root@192.168.200.201:/opt/
scp /usr/lib/systemd/system/etcd.service root@192.168.200.201:/usr/lib/systemd/system/
scp -r /opt/etcd/ root@192.168.200.202:/opt/
scp /usr/lib/systemd/system/etcd.service root@192.168.200.202:/usr/lib/systemd/system/
注意:需要修改ETCD配置文件参数(共5处修改点),分别修改另外2个ETCD的参数
vi /opt/etcd/cfg/etcd.conf
#[Member]
ETCD_NAME="etcd-1" # 修改1,节点2改为etcd-2,节点3改为etcd-3
ETCD_LISTEN_PEER_URLS="https://192.168.200.201:2380" # 修改2 当前服务器IP
ETCD_LISTEN_CLIENT_URLS="https://192.168.200.201:2379" # 修改3 当前服务器IP
#[Clustering]
ETCD_INITIAL_ADVERTISE_PEER_URLS="https://192.168.200.201:2380" # 修改4 当前服务器IP
ETCD_ADVERTISE_CLIENT_URLS="https://192.168.200.201:2379" # 修改5 当前服务器IP
启动并设置开机启动(同上):
systemctl daemon-reload
systemctl enable etcd
systemctl start etcd
- step7:查看集群状态
在任意一个ETCD节点上输入如下指令,可以查看集群状态情况true表示健康(保证IP正确)
ETCDCTL_API=3 /opt/etcd/bin/etcdctl --cacert=/opt/etcd/ssl/ca.pem --cert=/opt/etcd/ssl/server.pem --key=/opt/etcd/ssl/server-key.pem --endpoints="https://192.168.200.200:2379,https://192.168.200.201:2379,https://192.168.200.202:2379" endpoint health --write-out=table
3 安装Docker
其实,我这三台虚拟机上本来就安装好了Docker,如果没有安装Docker,可以参考该教程,当然,如果虚拟机本来就安装了Docker,我也会把修改点指出来。
如果虚拟机上本来就没安装Docker,安装步骤分为如下5步:
- step1:下载Docker的安装包(二级制安装,yum也可以)浏览器输入如下指令就能下载:
https://download.docker.com/linux/static/stable/x86_64/docker-19.03.9.tgz
- step2:解压,移动
tar zxvf docker-19.03.9.tgz
mv docker/* /usr/bin
- step3:设置systemd管理docker的配置文件(指定了docker守护进程启动的命令)
cat > /usr/lib/systemd/system/docker.service << EOF
[Unit]
Description=Docker Application Container Engine
Documentation=https://docs.docker.com
After=network-online.target firewalld.service
Wants=network-online.target
[Service]
Type=notify
ExecStart=/usr/bin/dockerd
ExecReload=/bin/kill -s HUP $MAINPID
LimitNOFILE=infinity
LimitNPROC=infinity
LimitCORE=infinity
TimeoutStartSec=0
Delegate=yes
KillMode=process
Restart=on-failure
StartLimitBurst=3
StartLimitInterval=60s
[Install]
WantedBy=multi-user.target
EOF
- step4:设置镜像加速
mkdir /etc/docker
cat > /etc/docker/daemon.json << EOF
{
"registry-mirrors": ["https://b9pmyelo.mirror.aliyuncs.com"]
}
EOF
- step5:启动并设置开机启动
systemctl daemon-reload
systemctl start docker
systemctl enable docker
如果虚拟机上本来就安装了Docker,只需要把修改2个配置文件即可:
- step1:修改systemd管理docker的配置文件
执行上面的step3。
- step2:设置镜像加速
执行上面的step4(去掉第一行创建文件夹的操作)。
- step3:启动并设置开机启动
执行上面的step5。最后,命令行输入:docker info 查看docker是否成功启动,上面所有的操作在3台机器上分别执行。
4 部署 Master-Node
到目前为止,前期准备工作已经完成了(环境准备、部署ETCD集群、安装Docker),接下来基于K8S中的各种组件的二进制文件,进行组件的配置与安装。不过,在进行配置安装操作之前先了解一下K8S的证书机制:
- K8S所有组件均采用HTTPS通信,基于两套根证书(apiserver、etcd)
- 证书分为管理节点和工作节点:
- 管理节点:controller-manager和scheduler连接apiserver时所需要的客户端证书
- 工作节点:kubelet、kube-proxy连接apiserver时所需要的客户端证书,一般采用BootStrap TLS机制,所以kubelet的证书初次启动会向apiserver申请颁发证书,由controller-manager组件自动颁发,如下图:
4.1 生成kube-apiserver证书
- step1:切换到目录:
cd TLS/k8s
- step2:自签证书颁发机构(CA)
cat > ca-config.json << EOF
{
"signing": {
"default": {
"expiry": "87600h"
},
"profiles": {
"kubernetes": {
"expiry": "87600h",
"usages": [
"signing",
"key encipherment",
"server auth",
"client auth"
]
}
}
}
}
EOF
cat > ca-csr.json << EOF
{
"CN": "kubernetes",
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "Beijing",
"ST": "Beijing",
"O": "k8s",
"OU": "System"
}
]
}
EOF
- step3:生成证书
cfssl gencert -initca ca-csr.json | cfssljson -bare ca -
- step4:使用自签CA签发kube-apiserver HTTPS证书
注:上述文件hosts字段中IP为所有Master节点ip、负载均衡器LB的ip、负载均衡器的VIP,一个都不能少!为了方便后期扩容可以多写几个预留的IP(203是第二个Mstser、88是VIP)。
cat > server-csr.json << EOF
{
"CN": "kubernetes",
"hosts": [
"10.0.0.1",
"127.0.0.1",
"192.168.200.200",
"192.168.200.201",
"192.168.200.202",
"192.168.200.203",
"192.168.200.88",
"kubernetes",
"kubernetes.default",
"kubernetes.default.svc",
"kubernetes.default.svc.cluster",
"kubernetes.default.svc.cluster.local"
],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "k8s",
"OU": "System"
}
]
}
EOF
- step5:生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes server-csr.json | cfssljson -bare server
4.2 下载并解压二进制文件
下载
https://github.com/kubernetes/kubernetes/blob/master/CHANGELOG/CHANGELOG-1.18.md#v1183
下载如下这个二进制压缩包即可。
解压
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}
tar zxvf kubernetes-server-linux-amd64.tar.gz
cd kubernetes/server/bin
cp kube-apiserver kube-scheduler kube-controller-manager /opt/kubernetes/bin
cp kubectl /usr/bin/
4.3 部署 kube-apiserver
- step1:创建配置文件
etcd-servers:分别填写3台机器的ip,bind-address、advertise-address填写Master节点ip
cat > /opt/kubernetes/cfg/kube-apiserver.conf << EOF
KUBE_APISERVER_OPTS="--logtostderr=false \\\\
--v=2 \\\\
--log-dir=/opt/kubernetes/logs \\\\
--etcd-servers=https://192.168.200.200:2379,https://192.168.200.201:2379,https://192.168.200.202:2379 \\\\
--bind-address=192.168.200.200 \\\\
--secure-port=6443 \\\\
--advertise-address=192.168.200.200 \\\\
--allow-privileged=true \\\\
--service-cluster-ip-range=10.0.0.0/24 \\\\
--enable-admission-plugins=NamespaceLifecycle,LimitRanger,ServiceAccount,ResourceQuota,NodeRestriction \\\\
--authorization-mode=RBAC,Node \\\\
--enable-bootstrap-token-auth=true \\\\
--token-auth-file=/opt/kubernetes/cfg/token.csv \\\\
--service-node-port-range=30000-32767 \\\\
--kubelet-client-certificate=/opt/kubernetes/ssl/server.pem \\\\
--kubelet-client-key=/opt/kubernetes/ssl/server-key.pem \\\\
--tls-cert-file=/opt/kubernetes/ssl/server.pem \\\\
--tls-private-key-file=/opt/kubernetes/ssl/server-key.pem \\\\
--client-ca-file=/opt/kubernetes/ssl/ca.pem \\\\
--service-account-key-file=/opt/kubernetes/ssl/ca-key.pem \\\\
--etcd-cafile=/opt/etcd/ssl/ca.pem \\\\
--etcd-certfile=/opt/etcd/ssl/server.pem \\\\
--etcd-keyfile=/opt/etcd/ssl/server-key.pem \\\\
--audit-log-maxage=30 \\\\
--audit-log-maxbackup=3 \\\\
--audit-log-maxsize=100 \\\\
--audit-log-path=/opt/kubernetes/logs/k8s-audit.log"
EOF
配置文件中参数解释如下:
logtostderr:启用日志
v:日志等级
log-dir:日志目录
etcd-servers:etcd集群地址
bind-address:监听地址
secure-port:https安全端口
advertise-address:集群通告地址
allow-privileged:启用授权
service-cluster-ip-range:Service虚拟IP地址段
enable-admission-plugins:准入控制模块
authorization-mode:认证授权,启用RBAC授权和节点自管理
enable-bootstrap-token-auth:启用TLS bootstrap机制
token-auth-file:bootstrap token文件
service-node-port-range:Service nodeport类型默认分配端口范围
kubelet-client-xxx:apiserver访问kubelet客户端证书
tls-xxx-file:apiserver https证书
etcd-xxxfile:连接Etcd集群证书
audit-log-xxx:审计日志
- step2:拷贝证书
把刚才生成的证书拷贝到配置文件中的路径:
cp ~/TLS/k8s/ca*pem ~/TLS/k8s/server*pem /opt/kubernetes/ssl/
- step3:启用 TLS Bootstrapping 机制
生成token:
head -c 16 /dev/urandom | od -An -t x | tr -d ' '
创建上述配置文件中token文件(把生成的token替换,格式:token,用户名,UID,用户组)
cat > /opt/kubernetes/cfg/token.csv << EOF
4ec49cd2f31388108e1c8958a805c8d4,kubelet-bootstrap,10001,"system:node-bootstrapper"
EOF
- step4:systemd管理apiserver
cat > /usr/lib/systemd/system/kube-apiserver.service << EOF
[Unit]
Description=Kubernetes API Server
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-apiserver.conf
ExecStart=/opt/kubernetes/bin/kube-apiserver \\$KUBE_APISERVER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
- step5:启动并设置开机启动
systemctl daemon-reload
systemctl start kube-apiserver
systemctl enable kube-apiserver
- step6:授权kubelet-bootstrap用户允许请求证书(给token中的用户最小权限)
kubectl create clusterrolebinding kubelet-bootstrap \\
--clusterrole=system:node-bootstrapper \\
--user=kubelet-bootstrap
4.4 部署 kube-controller-manager
- step1:创建配置文件
cat > /opt/kubernetes/cfg/kube-controller-manager.conf << EOF
KUBE_CONTROLLER_MANAGER_OPTS="--logtostderr=false \\\\
--v=2 \\\\
--log-dir=/opt/kubernetes/logs \\\\
--leader-elect=true \\\\
--master=127.0.0.1:8080 \\\\
--bind-address=127.0.0.1 \\\\
--allocate-node-cidrs=true \\\\
--cluster-cidr=10.244.0.0/16 \\\\
--service-cluster-ip-range=10.0.0.0/24 \\\\
--cluster-signing-cert-file=/opt/kubernetes/ssl/ca.pem \\\\
--cluster-signing-key-file=/opt/kubernetes/ssl/ca-key.pem \\\\
--root-ca-file=/opt/kubernetes/ssl/ca.pem \\\\
--service-account-private-key-file=/opt/kubernetes/ssl/ca-key.pem \\\\
--experimental-cluster-signing-duration=87600h0m0s"
EOF
配置文件中参数介绍如下:
#参数介绍
master:通过本地非安全本地端口8080连接apiserver。
leader-elect:当该组件启动多个时,自动选举(HA)
cluster-signing-cert-file/–cluster-signing-key-file:自动为kubelet颁发证书的CA,与apiserver保持一致
- step2: 生成kubeconfig文件(这一步似乎不用执行)
除了为该组件创建 .conf 主配置文件之外,还需要生成一个该组件专属的 .kubeconfig 配置文件用于连接apiserver
先生成kube-controller-manager证书
#切换工作目录
cd ~/TLS/k8s
#创建证书请求文件
cat > kube-controller-manager-csr.json << EOF
{
"CN": "system:kube-controller-manager",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "system:masters",
"OU": "System"
}
]
}
EOF
#生成controller-manager 证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-controller-manager-csr.json | cfssljson -bare kube-controller-manager
再生成kubeconfig配置文件
KUBE_CONFIG="/opt/kubernetes/cfg/kube-controller-manager.kubeconfig"
KUBE_APISERVER="https://192.168.200.200:6443"
kubectl config set-cluster kubernetes \\
--certificate-authority=/opt/kubernetes/ssl/ca.pem \\
--embed-certs=true \\
--server=${KUBE_APISERVER} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-controller-manager \\
--client-certificate=./kube-controller-manager.pem \\
--client-key=./kube-controller-manager-key.pem \\
--embed-certs=true \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \\
--cluster=kubernetes \\
--user=kube-controller-manager \\
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
kubeconfig配置文件生成之后,可以用以下指令查看:
cat /opt/kubernetes/cfg/kube-controller-manager.kubeconfig
- step3:systemd管理controller-manager
cat > /usr/lib/systemd/system/kube-controller-manager.service << EOF
[Unit]
Description=Kubernetes Controller Manager
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-controller-manager.conf
ExecStart=/opt/kubernetes/bin/kube-controller-manager \\$KUBE_CONTROLLER_MANAGER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
- step4:启动并设置开机启动
systemctl daemon-reload
systemctl start kube-controller-manager
systemctl enable kube-controller-manager
4.5 部署 kube-scheduler
- step1:创建配置文件
cat > /opt/kubernetes/cfg/kube-scheduler.conf << EOF
KUBE_SCHEDULER_OPTS="--logtostderr=false \\
--v=2 \\
--log-dir=/opt/kubernetes/logs \\
--leader-elect \\
--master=127.0.0.1:8080 \\
--bind-address=127.0.0.1"
EOF
配置文件中参数介绍如下:
#参数介绍
master:通过本地非安全本地端口8080连接apiserver。
leader-elect:当该组件启动多个时,自动选举(HA)
- step2:生成 kubeconfig 文件(这一步似乎不用执行)
除了为该组件创建 .conf 主配置文件之外,还需要生成一个该组件专属的 .kubeconfig 配置文件用于连接apiserver
先生成 kube-scheduler证书
#切换工作目录
cd ~/TLS/k8s
#创建证书请求文件
cat > kube-scheduler-csr.json << EOF
{
"CN": "system:kube-scheduler",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "system:masters",
"OU": "System"
}
]
}
EOF
#生成 kube-scheduler 证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-scheduler-csr.json | cfssljson -bare kube-scheduler
再生成kubeconfig配置文件
KUBE_CONFIG="/opt/kubernetes/cfg/kube-scheduler.kubeconfig"
KUBE_APISERVER="https://192.168.200.200:6443"
kubectl config set-cluster kubernetes \\
--certificate-authority=/opt/kubernetes/ssl/ca.pem \\
--embed-certs=true \\
--server=${KUBE_APISERVER} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-scheduler \\
--client-certificate=./kube-scheduler.pem \\
--client-key=./kube-scheduler-key.pem \\
--embed-certs=true \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \\
--cluster=kubernetes \\
--user=kube-scheduler \\
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
kubeconfig配置文件生成之后,可以用以下指令查看:
cat /opt/kubernetes/cfg/kube-scheduler.kubeconfig
- step3:systemd管理scheduler
cat > /usr/lib/systemd/system/kube-scheduler.service << EOF
[Unit]
Description=Kubernetes Scheduler
Documentation=https://github.com/kubernetes/kubernetes
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-scheduler.conf
ExecStart=/opt/kubernetes/bin/kube-scheduler \\$KUBE_SCHEDULER_OPTS
Restart=on-failure
[Install]
WantedBy=multi-user.target
EOF
- step4:启动并设置开机启动
systemctl daemon-reload
systemctl start kube-scheduler
systemctl enable kube-scheduler
- step5:查看集群状态
查看集群状态用到kubectl工具,kubectl连接集群前进行配置(生成证书+生成连接用配置文件,但是,这一步似乎不用执行)
#1、切换工作目录
cd ~/TLS/k8s
#2、生成kubectl连接K8S集群的证书
cat > admin-csr.json << EOF
{
"CN": "admin",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "system:masters",
"OU": "System"
}
]
}
EOF
#3、生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes admin-csr.json | cfssljson -bare admin
#4、生成kubeconfig配置文件(放到kubectl默认的配置文件夹/root/.kube/config下)
mkdir /root/.kube
KUBE_CONFIG="/root/.kube/config"
KUBE_APISERVER="https://192.168.200.200:6443"
kubectl config set-cluster kubernetes \\
--certificate-authority=/opt/kubernetes/ssl/ca.pem \\
--embed-certs=true \\
--server=${KUBE_APISERVER} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials cluster-admin \\
--client-certificate=./admin.pem \\
--client-key=./admin-key.pem \\
--embed-certs=true \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \\
--cluster=kubernetes \\
--user=cluster-admin \\
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
到目前为止,Matser节点上的所有组件都已经启动成功(scheduler、controller-manager、etcd-0),通过kubectl工具查看当前集群组件状态:
kubectl get cs
5 部署 Work-Node
- 注意:Node节点所需要配置和安装的所有操作,都会在Matser节点机器上执行一遍,即Master既作为Master节点,同时又作为工作节点(只不过不使用工作节点的功能而已)。
- 注意:在Matser节点上还是要部署Node组件的,一方面,如果要在Master上运行Pod容器就需要部署Node组件。另一方面,如果只是想让Matser节点单纯的作为容器管理的节点,那么可以给Matser打上污点即可,这样Pod就不会部署到Matser节点上了。此外,如果不在Matser上部署Node组件,“kubectl get node” 指令中就没法找到Master组件了。
- 配置完成后,会把在Master节点上生成的所有文件拷贝到各个Node节点中,并修改必要的配置参数信息。
5.1 创建工作目录并拷贝二进制文件
在所有worker node创建工作目录,并从master节点上把二进制文件拷贝到Node节点工作目录
mkdir -p /opt/kubernetes/{bin,cfg,ssl,logs}
cd kubernetes/server/bin
cp kubelet kube-proxy /opt/kubernetes/bin # 本地拷贝
5.2 部署kubelet
- step1:创建主配置文件
cat > /opt/kubernetes/cfg/kubelet.conf << EOF
KUBELET_OPTS="--logtostderr=false \\\\
--v=2 \\\\
--log-dir=/opt/kubernetes/logs \\\\
--hostname-override=k8s-master1 \\\\
--network-plugin=cni \\\\
--kubeconfig=/opt/kubernetes/cfg/kubelet.kubeconfig \\\\
--bootstrap-kubeconfig=/opt/kubernetes/cfg/bootstrap.kubeconfig \\\\
--config=/opt/kubernetes/cfg/kubelet-config.yml \\\\
--cert-dir=/opt/kubernetes/ssl \\\\
--pod-infra-container-image=lizhenliang/pause-amd64:3.0"
EOF
#配置文件参数解释
hostname-override:显示名称,集群中唯一
network-plugin:启用CNI
kubeconfig:空路径,会自动生成,后面用于连接apiserver
bootstrap-kubeconfig:首次启动向apiserver申请证书
config:配置参数文件
cert-dir:kubelet证书生成目录
pod-infra-container-image:管理Pod网络容器的镜像
- step2:配置参数文件
cat > /opt/kubernetes/cfg/kubelet-config.yml << EOF
kind: KubeletConfiguration
apiVersion: kubelet.config.k8s.io/v1beta1
address: 0.0.0.0
port: 10250
readOnlyPort: 10255
cgroupDriver: cgroupfs
clusterDNS:
- 10.0.0.2
clusterDomain: cluster.local
failSwapOn: false
authentication:
anonymous:
enabled: false
webhook:
cacheTTL: 2m0s
enabled: true
x509:
clientCAFile: /opt/kubernetes/ssl/ca.pem
authorization:
mode: Webhook
webhook:
cacheAuthorizedTTL: 5m0s
cacheUnauthorizedTTL: 30s
evictionHard:
imagefs.available: 15%
memory.available: 100Mi
nodefs.available: 10%
nodefs.inodesFree: 5%
maxOpenFiles: 1000000
maxPods: 110
EOF
- step3:生成kubelet初次加入集群引导kubeconfig文件
KUBE_CONFIG="/opt/kubernetes/cfg/bootstrap.kubeconfig"
KUBE_APISERVER="https://192.168.200.200:6443" # apiserver IP:PORT
TOKEN="4ec49cd2f31388108e1c8958a805c8d4" # 与token.csv里保持一致
# 生成 kubelet bootstrap kubeconfig 配置文件
kubectl config set-cluster kubernetes \\
--certificate-authority=/opt/kubernetes/ssl/ca.pem \\
--embed-certs=true \\
--server=${KUBE_APISERVER} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials "kubelet-bootstrap" \\
--token=${TOKEN} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \\
--cluster=kubernetes \\
--user="kubelet-bootstrap" \\
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
- step4:systemd管理kubelet
cat > /usr/lib/systemd/system/kubelet.service << EOF
[Unit]
Description=Kubernetes Kubelet
After=docker.service
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kubelet.conf
ExecStart=/opt/kubernetes/bin/kubelet \\$KUBELET_OPTS
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
- step5:启动并设置开机启动
systemctl daemon-reload
systemctl start kubelet
systemctl enable kubelet
5.3 批准 kubelet 证书申请并加入集群
查看kubelet证书请求,批准请求(请求name按实际填写)
kubectl get csr
kubectl certificate approve node-csr-BWueBGbAmxsFfA8nydpgvg0wEX592ppsxXVChZZGapU
查看节点
kubectl get node
查看节点时,由于 网络插件还没有部署,所以显示NotReady状态:
5.4 部署 kube-proxy
- step1:创建主配置文件
cat > /opt/kubernetes/cfg/kube-proxy.conf << EOF
KUBE_PROXY_OPTS="--logtostderr=false \\\\
--v=2 \\\\
--log-dir=/opt/kubernetes/logs \\\\
--config=/opt/kubernetes/cfg/kube-proxy-config.yml"
EOF
- step2:配置参数文件
cat > /opt/kubernetes/cfg/kube-proxy-config.yml << EOF
kind: KubeProxyConfiguration
apiVersion: kubeproxy.config.k8s.io/v1alpha1
bindAddress: 0.0.0.0
metricsBindAddress: 0.0.0.0:10249
clientConnection:
kubeconfig: /opt/kubernetes/cfg/kube-proxy.kubeconfig
hostnameOverride: k8s-master1
clusterCIDR: 10.244.0.0/16
EOF
- step3:生成kube-proxy.kubeconfig文件
# 1、切换工作目录
cd ~/TLS/k8s
# 2、创建证书请求文件
cat > kube-proxy-csr.json << EOF
{
"CN": "system:kube-proxy",
"hosts": [],
"key": {
"algo": "rsa",
"size": 2048
},
"names": [
{
"C": "CN",
"L": "BeiJing",
"ST": "BeiJing",
"O": "k8s",
"OU": "System"
}
]
}
EOF
# 3、生成证书
cfssl gencert -ca=ca.pem -ca-key=ca-key.pem -config=ca-config.json -profile=kubernetes kube-proxy-csr.json | cfssljson -bare kube-proxy
# 4、生成kubeconfig文件:
KUBE_CONFIG="/opt/kubernetes/cfg/kube-proxy.kubeconfig"
KUBE_APISERVER="https://192.168.200.200:6443"
kubectl config set-cluster kubernetes \\
--certificate-authority=/opt/kubernetes/ssl/ca.pem \\
--embed-certs=true \\
--server=${KUBE_APISERVER} \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-credentials kube-proxy \\
--client-certificate=./kube-proxy.pem \\
--client-key=./kube-proxy-key.pem \\
--embed-certs=true \\
--kubeconfig=${KUBE_CONFIG}
kubectl config set-context default \\
--cluster=kubernetes \\
--user=kube-proxy \\
--kubeconfig=${KUBE_CONFIG}
kubectl config use-context default --kubeconfig=${KUBE_CONFIG}
- step4:systemd 管理kube-proxy
cat > /usr/lib/systemd/system/kube-proxy.service << EOF
[Unit]
Description=Kubernetes Proxy
After=network.target
[Service]
EnvironmentFile=/opt/kubernetes/cfg/kube-proxy.conf
ExecStart=/opt/kubernetes/bin/kube-proxy \\$KUBE_PROXY_OPTS
Restart=on-failure
LimitNOFILE=65536
[Install]
WantedBy=multi-user.target
EOF
- step5:启动并设置开机启动
systemctl daemon-reload
systemctl start kube-proxy
systemctl enable kube-proxy
5.5 部署网络组件
Calico是一个纯三层的数据中心网络方案,是目前Kubernetes主流的网络方案
首先把Calico的配置文件 calico.yaml 拖动到:/root/ 目录下,并cd回到root下:cd,然后执行如下两条指令:
#安装calico
kubectl apply -f calico.yaml
#列出“kube-system”命名空间下的所有pod
kubectl get pods -n kube-system
当Calico Pod都Running起来后,节点网络也会准备就绪,此时查看集群中的节点信息:
kubectl get node
5.6 授权 apiserver 访问 kubelet
应用场景:kubectl logs
cat > apiserver-to-kubelet-rbac.yaml << EOF
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRole
metadata:
annotations:
rbac.authorization.kubernetes.io/autoupdate: "true"
labels:
kubernetes.io/bootstrapping: rbac-defaults
name: system:kube-apiserver-to-kubelet
rules:
- apiGroups:
- ""
resources:
- nodes/proxy
- nodes/stats
- nodes/log
- nodes/spec
- nodes/metrics
- pods/log
verbs:
- "*"
---
apiVersion: rbac.authorization.k8s.io/v1
kind: ClusterRoleBinding
metadata:
name: system:kube-apiserver
namespace: ""
roleRef:
apiGroup: rbac.authorization.k8s.io
kind: ClusterRole
name: system:kube-apiserver-to-kubelet
subjects:
- apiGroup: rbac.authorization.k8s.io
kind: User
name: kubernetes
EOF
kubectl apply -f apiserver-to-kubelet-rbac.yaml
到目前为止,在Matser节点中要部署的所有组件都已经安装配置到Matser节点中了
(1)Matser组件:apiserver、controller-manager、scheduler
(2)Node组件:kubelet、kube-proxy
当然,Node工作节点中的组件可以不部署在Matser节点中,但是本案例还是这样做了,无伤大雅,接下来就把在Master节点中所部署的Node组件直接拷贝到各个Node节点上来,并修改必要的配置信息。Node节点的部署就轻松很多了。
5.7 新增加 Worker-Node
- step1:拷贝已部署好的Node相关文件到新节点
在Master节点中,将Worker Node涉及文件拷贝到另外2个新节点192.168.200.201/202
#拷贝工作目录(连带Master的内容一起拷贝了,没关系,反正也用不到)
scp -r /opt/kubernetes root@192.168.200.201:/opt/
#拷贝配置文件
scp -r /usr/lib/systemd/system/{kubelet,kube-proxy}.service root@192.168.200.201:/usr/lib/systemd/system
#拷贝证书文件
scp /opt/kubernetes/ssl/ca.pem root@192.168.200.201:/opt/kubernetes/ssl
#对202机器同样执行一遍
scp -r /opt/kubernetes root@192.168.200.202:/opt/
scp -r /usr/lib/systemd/system/{kubelet,kube-proxy}.service root@192.168.200.202:/usr/lib/systemd/system
scp /opt/kubernetes/ssl/ca.pem root@192.168.200.202:/opt/kubernetes/ssl
- step2:删除 kubelet 证书和 kubeconfig 文件
由于这几个文件是证书申请审批后自动生成的,每个Node不同,因此必须删除
#在node1、node2两个节点上分别执行如下命令
rm -f /opt/kubernetes/cfg/kubelet.kubeconfig
rm -f /opt/kubernetes/ssl/kubelet*
- step3:修改主机名
在两台机器上分别打开2个配置文件,并修改主机名
#修改kubelet配置文件
vi /opt/kubernetes/cfg/kubelet.conf
--hostname-override=k8s-node1
#修改kube-proxy配置文件
vi /opt/kubernetes/cfg/kube-proxy-config.yml
hostnameOverride: k8s-node1
#名称换成:k8s-node2再执行一遍
- step4:启动并设置开机启动
systemctl daemon-reload
systemctl start kubelet kube-proxy
systemctl enable kubelet kube-proxy
- step5:在Master上批准新的Node kubelet证书申请
注意:该操作在Master节点上完成!
先查看证书请求:
kubectl get csr
在两台node机器上分别执行完前4步操作之后(node节点中启动kubelet后就会有请求信息),查看证书请求会看到2条信息:
根据证书请求name进行授权
#授权ndoe1
kubectl certificate approve node-csr-MYWfZXy8o2n8Gb6dZ-fVKw1qVFkmgEkSFdg7m1VL56w
#授权node2
kubectl certificate approve node-csr-XAp5v8JU6qlAkDwzXPiN0DkJ9xlqsq4KbMekUFqBwKM
- step6:查看Node状态
kubectl get node
6 部署 DashBoard 和 CoreDNS
- dashboard是k8s官方的UI工具,可以通过可视化界面的方式查看、操作k8s集群,但是功能较弱。
- CoreDNS用于集群内部Service名称解析
6.1 部署 DashBoard
- step1:把 DashBoard 的yaml文件拷贝到Master节点的 /root/路径下
- step2: 安装 DashBoard
kubectl apply -f kubernetes-dashboard.yaml
- step3:查看 DashBoard 部署情况
kubectl get pods,svc -n kubernetes-dashboard
- step4: 访问地址 https://192.168.200.200:30001
此时需要一个token,生成token步骤如下(Master主机下操作):
#创建service account
kubectl create serviceaccount dashboard-admin -n kube-system
#将service account绑定到集群角色,具备管理员权限
kubectl create clusterrolebinding dashboard-admin --clusterrole=cluster-admin --serviceaccount=kube-system:dashboard-admin
#获取token
kubectl describe secrets -n kube-system $(kubectl -n kube-system get secret | awk '/dashboard-admin/{print $1}')
输入token后进入DashBoard界面:
6.2 部署 CoreDNS
- step1:把 CoreDNS 的yaml文件拷贝到Master节点的 /root/路径下
- step2:安装
kubectl apply -f coredns.yaml
- step3:查看部署情况
kubectl get pods -n kube-system
到目前为止,一个单Master集群就搭建完成了,接下来进行多Master集群扩容。
如果你的机器配置不够用,到这里就已经可以进行后续的K8S学习了。
但是如果追求K8S集群的高可用的话,就再搞一台虚拟机作为第二个Matser-Node,操作如下。
7 扩容多 Master(高可用架构)
- Kubernetes作为容器集群系统,通过健康检查+重启策略实现了Pod故障自我修复能力,通过调度算法实现将Pod分布式部署,并保持预期副本数,根据Node失效状态自动在其他Node拉起Pod,实现了应用层的高可用性。
- 针对Kubernetes集群,高可用性还应包含以下两个层面的考虑:Etcd数据库的高可用性和Kubernetes Master组件的高可用性。 而Etcd我们已经采用3个节点组建集群实现高可用,本节将对Master节点高可用进行说明和实施。
- Master节点扮演着总控中心的角色,通过不断与工作节点上的Kubelet和kube-proxy进行通信来维护整个集群的健康工作状态。如果Master节点故障,将无法使用kubectl工具或者API做任何集群管理。
- Master节点主要有三个服务kube-apiserver、kube-controller-manager和kube-scheduler,其中kube-controller-manager和kube-scheduler组件自身通过选择机制已经实现了高可用,所以Master高可用主要针对kube-apiserver组件,而该组件是以HTTP API提供服务,因此对他高可用与Web服务器类似,增加负载均衡器对其负载均衡即可,并且可水平扩容。
7.1 部署 Master2 Node
现在需要再增加一台新服务器(虚拟机),作为Master2 Node,IP是192.168.200.203。
Master2 与已部署的Master1所有操作一致,只需将Master1所有K8s文件拷贝过来,再修改下服务器IP和主机名启动即可。
- step1:安装Docker
##在Matser1节点上进行如下拷贝操作,拷贝到Master2节点
scp /usr/bin/docker* root@192.168.200.203:/usr/bin
scp /usr/bin/runc root@192.168.200.203:/usr/bin
scp /usr/bin/containerd* root@192.168.200.203:/usr/bin
scp /usr/lib/systemd/system/docker.service root@192.168.200.203:/usr/lib/systemd/system
scp -r /etc/docker root@192.168.200.203:/etc
# 在Master2中启动Docker
systemctl daemon-reload
systemctl start docker
systemctl enable docker
- step2:在Matser2中创建ETCD证书目录
mkdir -p /opt/etcd/ssl
- step3:拷贝Master1上所有K8s文件和etcd证书到Master2
scp -r /opt/kubernetes root@192.168.200.203:/opt
scp -r /opt/etcd/ssl root@192.168.200.203:/opt/etcd
scp /usr/lib/systemd/system/kube* root@192.168.200.203:/usr/lib/systemd/system
scp /usr/bin/kubectl root@192.168.200.203:/usr/bin
scp -r ~/.kube root@192.168.200.203:~
- step4:删除kubelet证书和kubeconfig文件
rm -f /opt/kubernetes/cfg/kubelet.kubeconfig
rm -f /opt/kubernetes/ssl/kubelet*
- step5:修改配置文件ip与主机名
修改apiserver、kubelet
以上是关于2 二进制方式搭建K8S集群的主要内容,如果未能解决你的问题,请参考以下文章