docker 和 k8s 面试总结
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了docker 和 k8s 面试总结相关的知识,希望对你有一定的参考价值。
参考技术A 花了大半个月对k8s&docker进行了梳理,包括之前读过的书,官方文档以及k&d在公司项目的实践等。以下是个人对docker & k8s 面试知识点的总结:
1 docker
常见面试题如下 每一点可根据回答进行适当深入
1.1 什么是docker
docker和传统linux的差异?
容器和镜像的区别?
如何理解docker的缓存机制?
1.2 docker 网络模型是什么?有何局限
docker的网络基础是什么?
docker的网络模型是?有什么局限?
docker如何实现容器间通信的?
1.3 docker 基础命令
cmd和entryPoint差异?
copy和add的差异?
简单讲下swam/compose?
2 kubernetes
常见面试题如下 每一点可根据回答进行适当深入
2.1 什么是k8s?
1 为什么用k8s 解决了什么问题?
2 k8s有哪些组件,有什么作用?【同:Master节点和Node节点都用哪些组件】
3 可以简单说下Node Pod container 之间的关系吗? 【可引入2.2/2.3对Pod SVC的考察】
4 什么是SVC可以简单描述下吗?【可引入2.3对SVC的考察】
5 可以简单讲下k8s的网络模型吗?
6 Pod SVC Node Container 之间如何相互访问
7 swarm和k8s如何选择?
2.2 考察Pod
静态Pod和普通Pod的差异?
简单讲下Pod的生命周期重启策略呢?
- 不同组件对Pod的重启策略要求一样吗?
如何检查Pod的健康状态?哪2种探针?
- 2种探针的实现方式
简单说下Pod的调度方式?
2.3 考察SVC
SVC有哪4种类型
2.4 k8s网络模型
DNS和Iptables在k8s中的运用?有何差异
- k8s如何解决多机器部署容器的网络问题?
Pod SVC Node Container 之间如何相互访问
3 参考答案
答案是根据所在公司项目结合自己的理解给出的答案 不一定完全准确但在面试中要做到有理有据突出自己的思路即可。
4 docker
问题和答案 如下
4.1 什么是docker?
通常问这个问题主要在于考察候选人是否真正了解过docker,很多人项目中都有用到docker,真正去了解过概念,架构的不多。从而来辨别简历上的熟悉/了解docker的水分。
如果这个都无法回答,那么接下来的docker考察也就毫无意义了,此问题通常也会结合以下问题来进行考察。
docker和传统linux的差异?
docker都有哪些核心组件?
可以简单说下docker的架构吗?
容器和镜像的区别?
docker是什么: Docker是一个可以把开发的应用程序自动部署到容器的开源引擎。
docker和VM差异: docker是一个应用层的抽象,容器之间通过网络命名空间进行隔离,多个容器共享同一个操作系统内核。VM是对物理硬件层的抽象,每个VM都包含独立的操作系统,重且启动缓慢。VM主要为了提供系统环境,容器主要是为了提供应用环境。
docker组件: docker引擎【包含Docker客户端&服务端】,docker镜像,docker容器,Registry【镜像仓库】
docker的架构: C/s架构
容器和镜像的区别: 镜像是一个只读模板,包括运行容器所需的数据,其内容在构建之后就不会被改变,可以用来创建新的容器。 镜像由多个只读层组成,容器在只读层的基础上多了一个读写层。
4.2 docker 网络模型是什么?有何局限
这里也经常会结合K8s网络原理进行考察,以及如下几个考点
docker的网络基础是什么?
docker的网络模型是?有什么局限?
docker如何实现容器间通信的?
Docker网络基础: Docker是在操作系统层上对应用的抽象,使用网络命名空间来对不同容器之间进行网络隔离,用Veth设备对来进行容器之间的通讯。
docker的网络模型: 有4种网络模型 分别是Bridge Container host none 默认使用bridge网络模型,容器的初次启动会虚拟化出来一个新的网卡名为docker0,在多机器部署下docker0地址可能会冲突。所以docker对多机部署支持的不够友好。
4.3 docker 基础命令
出现频率较高的为以下几条命令的考察
cmd和entry差异?
copy和add的差异?
docker-compose & docker swarm?
CMD & ENTRYPONIT
都是容器操作指令:
CMD 用于指定容器启动时候默认执行的命令。可以被docker run指定的启动命令覆盖。ENTRYPONIT 指令可让容器以应用程序或者服务的形式运行。一般不会被docker run指定的启动命令覆盖。dockerfile中的多个CMD & ENTRYPONIT只有最后一个会生效。
注意区别docker run 和RUN 一个是容器启动命令,一个是镜像构建时候所用。
copy & add
ADD & COPY 选取目标文件复制到镜像当中。是针对镜像的指令,唯一差别在于add源文件可以支持url且可以对压缩文件进行解压操作。而copy针对的是当前构建环境。
docker-compose & docker swarm
使用Docker compose可以用YAML文件来定义一组需要启动的容器,以及容器运行时的属性。docker-compose用来对这一组容器进行操作。
docker swarm 原生的Docker集群管理工具,依赖docker本身,很多重要功能依赖团队二次开发。且社区不够活跃,一般公司生产环境会选择k8s,个人项目或者容器数量较少可选swarm,只需要docker即可完成,相对较轻。
5 kubernetes
5.1 什么是k8s?
对k8s的考察一般逃不过这样入门级的问题,针对入门级的问题,面试官可能也会针对如下几个点进行考察,在候选人答出来的基础上,选择其中一个进行深入。
为什么用k8s 解决了什么问题?
k8s有哪些组件,有什么作用?
可以简单说下Node Pod container 之间的关系吗? 【进一步可对Pod SVC细节进行考察】
什么是SVC可以简单描述下吗?【可引对SVC的考察】
可以简单讲下k8s的网络模型吗?【可以和docker网络模型结合考察】
Pod SVC Node Container 之间如何相互访问【衍生 外部环境如何访问k8s】
swarm和k8s如何选择?
1 什么是k8s 为什么用k8s:
一个开源的容器集群管理平台【容器编排工具】,可提供容器集群的自动部署,扩缩容,维护等功能。分为管理节点Master和工作节点Node。在我们的项目中主要解决了环境一致性的问题,通过CI/CD使得运维部署变得简单起来,以及自动部署,故障监控,自动扩缩容。可以提升开发效率。
2 k8s有那些组件:
etcd保存了整个集群的状态;
apiserver提供了资源操作的唯一入口,并提供认证、授权、访问控制、API注册和发现等机制;
controller manager负责维护集群的状态,比如故障检测、自动扩展、滚动更新等;
scheduler负责资源的调度,按照预定的调度策略将Pod调度到相应的机器上;
kubelet负责维护容器的生命周期,同时也负责Volume(CVI)和网络(CNI)的管理;
Container runtime负责镜像管理以及Pod和容器的真正运行(CRI);
kube-proxy负责为Service提供cluster内部的服务发现和负载均衡;
3 Node&Pod&container之间的关系:Node一般指工作节点包含多个Pod Pod中包含多个Container,Pod中的container共享同一个网络命名空间。
4 什么是SVC: SVC是对一组功能相似的Pod资源的抽象,相当于一组服务的负载均衡。
5 k8s的网络模型:IP-Per-Pod 每个Pod有独立的Ip地址,无论是否处于同一个Node节点,Pod可以通过IP相互访问,且Pod和容器的地址和外部看到的地址是同一个地址。
6 Pod SVC Node Container 之间如何相互访问:
同Pod内的容器:同一个Pod的容器共享同一个网络命名空间可以直接进行通讯
同Node内不同Pod的容器:多个Pod都关联在同一个Docker0网桥上,通过docker0网桥完成相互通讯。
不同Node内Pod的容器:不同Node上的docker0可能会相同,PodIP和docker0是同网段的,所以需要将PodIP和NodeIP进行关联且保障唯一,不同Pod之间的数据通过物理机的端口进行转发即可完成通讯。
7: k8s 和docker swarm如何选择: :
5.2 对SVC的考察
SVC是k8s中的核心概念 这里涉及知识点众多 常见的面试考点如下
什么是SVC? 如何创建SVC?
使用SVC创建多个副本和使用RC创建多个副本有什么差异?
SVC有哪几种类型?
SVC 负载分发策略有那些?
集群外如何访问SVC?
SVC: 是对一组功能相似的Pod资源的抽象,相当于一组服务的负载均衡。可以使用配置文件的方式创建也可以使用命令创建kubectl expose
SVC和RC提供服务的差距: RC创建的服务PodIP可能会变。SVC提供的clusterIP不会。通过Iptables的NAT转换重定向到本地端口,在均衡到后端Pod。
svc的几种类型: ClusterIp/NodePort/LoadBalancer/ExternalName
ClusterIp 默认类型 分配的一个虚拟地址,内部可以相互访问,外部不行
NodePort 将SVC端口号映射到物理机
LoadBalancer 基于NodePort,云服务商在外部创建了一个负载均衡到Pod
ExternalName 将外部地址经过集群内部的再一次封装(实际上就是集群DNS服务器将CNAME解析到了外部地址上),实现了集群内部访问即可。
svc负载分发策略: RoundRobin/SessionAffinity/自定义实现【基于标签选择器】
集群外部访问: 端口映射到物理机即可
5.2 Pod考察
Pod和静态Pod的区别
生命周期和重启策略 【这里可扩展 不同控制器对Pod的重启策略要求】
Pod如何健康检查?
Pod的调度方式?【扩展调度算法】
Pod如何扩缩容?【扩展 RC和RS的差异】
答案
待补充 --详见 《k8s权威指南》读书笔记
5.3 基础原理类考察
主要考察对基本组件的理解 和原理分析
API Server
Controller Manager【Replication Controller/Node Controller/ResourceQuota Controller/Namespace Controller/SVC Controller& Endpoint Controller】
Scheduler
Kubelet 【Pod健康检查 资源监控】
Kube-Proxy
k8s-DNS & Iptables差异
k8s中Ingress是什么
简述k8s中的如下属性及其作用resources tolerations affinity
k8s中pod、rs、deployment、hpa的基本概念,以及他们之间的关系
答案
待补充 --详见 《k8s权威指南》读书笔记
5.4 网络原理类考察
主要考察对基本组件的理解 和原理分析
k8s的网络模型是什么?
Docker的网络基础是什么?
Docker的网络模型和局限?
k8s的网络组件之间是如何通讯的?
外部如何访问k8s集群?
有那些开源组件支持k8s网络模型?
评分模型的检验方法和标准通常有:K-S指标交换曲线AR值Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成
评分模型的检验方法和标准通常有:K-S指标、交换曲线、AR值、Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。
例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。
信用评分模型介绍(一)
引言:对于信用评分模型,很多朋友或多或少有所了解,这里做一般性的介绍,并分享自己的多年从业经验。这边短文主要包括:信用评分模型,自变量的生成、筛选、分档和转换,及常用有监督学习模型。
信用评分模型
信用评分模型是一种有监督的学习模型(Supervised Learning),数据由一群自变量X和对应的因变量y构成。传统零售信用模型中,X大致分为客户的基本信息(年龄、性别、职业、学位等),财务信息(收入,每月生活消费,每月信贷还款额等),产品信息(LTV,信用卡类别,个人贷款用途等),征信信息(前6个月被查询次数,前6个信用卡最大利用率,未结清贷款数等);而一般取值0-1因变量y可以定义为在未来12个月是否出现欠款90天等.
经验备注:在大数据下,很多互联网公司对个人的评估不再局限于以上几种信息,而是根据更为广泛的数据源对个人进行更全面的刻画,故有称之为客户画像。数据维度会考虑个人在社会上留下的任何数据,如手机使用行为,理财行为,社交圈,网购行为,旅游行为等等等等。大家的各方面数据其实都在被不同的公司和不同的APP收集。。。
自变量的生成
自变量是信用风险的来源,除了考虑直接收集的变量,信用评分建模过程中往往需要建模人员产生更多的衍生变量。这部分工作要分析人员的直觉、长期经验的积累和数据挖掘技术的应用。大家可以通过京东和支付宝的评分一窥其自变量的维度:芝麻信用分为5个维度:身份特质,履约能力,信用历史,人脉关系,行为偏好;小白信用分也分为5个维度:身份,资产,关系,履约,偏好。
经验备注:现在越来越多的模型技术被应用于信用模型,但是个人觉得无论高级模型还是初级模型,最为重要的是更广泛的数据和产生更多更具有预测能力的自变量。
自变量的筛选
自变量一旦丰富了起来,就涉及到有效变量的筛选,大致可根据一下几个原则或方法:变量的直观意义(是否跟y有关),变量的单调性或合理性,未来是否可以获取以便模型可实施,变量的区分能力(IV),变量间相关性(变量聚类),变量缺失率,分档之后的稳定性等等。
经验备注:对于区分能力太强的变量,或缺失率很大的变量,不建议直接放入模型,可以考虑做成规则或者做成最后模型的调整。在大数据下,人们经常强调自变量与因变量的相关关系,应用于精准性要求不高的营销模型问题不大。而对于精准度要求极高的信用评分模型,相关关系的应用值得推敲。
自变量分档和转换
为了保持模型的稳定性,信用模型一般对自变量进行分档,比如根据风险不同把年龄分成几档。这样每档需要一个值来代表这段的自变量输入,这就是变量的转换,常见的有WOE和Logit转换。通过转换后不仅实现了稳定性要求,也克服不同变量间刻度不统一的问题,还克服回归中缺失值的填充问题。
经验备注:如果分档过粗糙,不但会降低单个变量的预测能力,也会造成最终评分集中度过高的问题。解决方法:可以考虑每档用线性插值来代替常数,也可以寻找更多能区分分数集中样本的自变量放入模型。
有监督学习模型介绍
目前比较流行的模型主要有以下几种(以后分享会逐一介绍):
-
Logistic 回归(Logistic Regression)
-
决策树(Decision Tree)
-
支持向量机(Support Vector Machine)
-
人工神经网络(Artificial Neural Network)
-
生存分析模型(Survival Analysis Model)
经验备注:除此上述之外,还有些高级方法或算法:集成方法(Ensemble Method)(例如随机森林(Random Forrest),Boosting,AdaBoost),深度学习方法(Deep Learning),随机梯度下降算法(Stochastic Gradient Descent)等。
以上是关于docker 和 k8s 面试总结的主要内容,如果未能解决你的问题,请参考以下文章