docker 和 k8s 面试总结

Posted 2023-04-18

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了docker 和 k8s 面试总结相关的知识，希望对你有一定的参考价值。

参考技术A 花了大半个月对k8s&docker进行了梳理，包括之前读过的书，官方文档以及k&d在公司项目的实践等。

以下是个人对docker & k8s 面试知识点的总结：

1 docker

常见面试题如下每一点可根据回答进行适当深入

1.1 什么是docker

docker和传统linux的差异？

容器和镜像的区别？

如何理解docker的缓存机制？

1.2 docker 网络模型是什么？有何局限

docker的网络基础是什么？

docker的网络模型是？有什么局限？

docker如何实现容器间通信的？

1.3 docker 基础命令

cmd和entryPoint差异？

copy和add的差异？

简单讲下swam/compose？

2 kubernetes

常见面试题如下每一点可根据回答进行适当深入

2.1 什么是k8s?

1 为什么用k8s 解决了什么问题？

2 k8s有哪些组件,有什么作用？【同：Master节点和Node节点都用哪些组件】

3 可以简单说下Node Pod container 之间的关系吗？【可引入2.2/2.3对Pod SVC的考察】

4 什么是SVC可以简单描述下吗？【可引入2.3对SVC的考察】

5 可以简单讲下k8s的网络模型吗？

6 Pod SVC Node Container 之间如何相互访问

7 swarm和k8s如何选择？

2.2 考察Pod

静态Pod和普通Pod的差异？

简单讲下Pod的生命周期重启策略呢？

- 不同组件对Pod的重启策略要求一样吗？

如何检查Pod的健康状态？哪2种探针？

- 2种探针的实现方式

简单说下Pod的调度方式？

2.3 考察SVC

SVC有哪4种类型

2.4 k8s网络模型

DNS和Iptables在k8s中的运用？有何差异

- k8s如何解决多机器部署容器的网络问题？

Pod SVC Node Container 之间如何相互访问

3 参考答案

答案是根据所在公司项目结合自己的理解给出的答案不一定完全准确但在面试中要做到有理有据突出自己的思路即可。

4 docker

问题和答案如下

4.1 什么是docker？

通常问这个问题主要在于考察候选人是否真正了解过docker，很多人项目中都有用到docker，真正去了解过概念，架构的不多。从而来辨别简历上的熟悉/了解docker的水分。

如果这个都无法回答，那么接下来的docker考察也就毫无意义了，此问题通常也会结合以下问题来进行考察。

docker和传统linux的差异？

docker都有哪些核心组件？

可以简单说下docker的架构吗？

容器和镜像的区别？

docker是什么： Docker是一个可以把开发的应用程序自动部署到容器的开源引擎。

docker和VM差异： docker是一个应用层的抽象，容器之间通过网络命名空间进行隔离，多个容器共享同一个操作系统内核。VM是对物理硬件层的抽象，每个VM都包含独立的操作系统，重且启动缓慢。VM主要为了提供系统环境，容器主要是为了提供应用环境。

docker组件： docker引擎【包含Docker客户端&服务端】,docker镜像，docker容器，Registry【镜像仓库】

docker的架构: C/s架构

容器和镜像的区别：镜像是一个只读模板，包括运行容器所需的数据，其内容在构建之后就不会被改变，可以用来创建新的容器。镜像由多个只读层组成，容器在只读层的基础上多了一个读写层。

4.2 docker 网络模型是什么？有何局限

这里也经常会结合K8s网络原理进行考察，以及如下几个考点

docker的网络基础是什么？

docker的网络模型是？有什么局限？

docker如何实现容器间通信的？

Docker网络基础： Docker是在操作系统层上对应用的抽象，使用网络命名空间来对不同容器之间进行网络隔离，用Veth设备对来进行容器之间的通讯。

docker的网络模型：有4种网络模型分别是Bridge Container host none 默认使用bridge网络模型，容器的初次启动会虚拟化出来一个新的网卡名为docker0,在多机器部署下docker0地址可能会冲突。所以docker对多机部署支持的不够友好。

4.3 docker 基础命令

出现频率较高的为以下几条命令的考察

cmd和entry差异？

copy和add的差异？

docker-compose & docker swarm？

CMD & ENTRYPONIT

都是容器操作指令：

CMD 用于指定容器启动时候默认执行的命令。可以被docker run指定的启动命令覆盖。ENTRYPONIT 指令可让容器以应用程序或者服务的形式运行。一般不会被docker run指定的启动命令覆盖。dockerfile中的多个CMD & ENTRYPONIT只有最后一个会生效。

注意区别docker run 和RUN 一个是容器启动命令，一个是镜像构建时候所用。

copy & add

ADD & COPY 选取目标文件复制到镜像当中。是针对镜像的指令，唯一差别在于add源文件可以支持url且可以对压缩文件进行解压操作。而copy针对的是当前构建环境。

docker-compose & docker swarm

使用Docker compose可以用YAML文件来定义一组需要启动的容器，以及容器运行时的属性。docker-compose用来对这一组容器进行操作。

docker swarm 原生的Docker集群管理工具，依赖docker本身，很多重要功能依赖团队二次开发。且社区不够活跃，一般公司生产环境会选择k8s，个人项目或者容器数量较少可选swarm,只需要docker即可完成，相对较轻。

5 kubernetes

5.1 什么是k8s?

对k8s的考察一般逃不过这样入门级的问题，针对入门级的问题，面试官可能也会针对如下几个点进行考察，在候选人答出来的基础上，选择其中一个进行深入。

为什么用k8s 解决了什么问题？

k8s有哪些组件,有什么作用？

可以简单说下Node Pod container 之间的关系吗？【进一步可对Pod SVC细节进行考察】

什么是SVC可以简单描述下吗？【可引对SVC的考察】

可以简单讲下k8s的网络模型吗？【可以和docker网络模型结合考察】

Pod SVC Node Container 之间如何相互访问【衍生外部环境如何访问k8s】

swarm和k8s如何选择？

1 什么是k8s 为什么用k8s：

一个开源的容器集群管理平台【容器编排工具】，可提供容器集群的自动部署，扩缩容，维护等功能。分为管理节点Master和工作节点Node。在我们的项目中主要解决了环境一致性的问题，通过CI/CD使得运维部署变得简单起来，以及自动部署，故障监控，自动扩缩容。可以提升开发效率。

2 k8s有那些组件：

etcd保存了整个集群的状态；

apiserver提供了资源操作的唯一入口，并提供认证、授权、访问控制、API注册和发现等机制；

controller manager负责维护集群的状态，比如故障检测、自动扩展、滚动更新等；

scheduler负责资源的调度，按照预定的调度策略将Pod调度到相应的机器上；

kubelet负责维护容器的生命周期，同时也负责Volume（CVI）和网络（CNI）的管理；

Container runtime负责镜像管理以及Pod和容器的真正运行（CRI）；

kube-proxy负责为Service提供cluster内部的服务发现和负载均衡；

3 Node&Pod&container之间的关系：Node一般指工作节点包含多个Pod Pod中包含多个Container,Pod中的container共享同一个网络命名空间。

4 什么是SVC: SVC是对一组功能相似的Pod资源的抽象，相当于一组服务的负载均衡。

5 k8s的网络模型：IP-Per-Pod 每个Pod有独立的Ip地址，无论是否处于同一个Node节点，Pod可以通过IP相互访问，且Pod和容器的地址和外部看到的地址是同一个地址。

6 Pod SVC Node Container 之间如何相互访问：

同Pod内的容器：同一个Pod的容器共享同一个网络命名空间可以直接进行通讯

同Node内不同Pod的容器：多个Pod都关联在同一个Docker0网桥上，通过docker0网桥完成相互通讯。

不同Node内Pod的容器：不同Node上的docker0可能会相同，PodIP和docker0是同网段的，所以需要将PodIP和NodeIP进行关联且保障唯一，不同Pod之间的数据通过物理机的端口进行转发即可完成通讯。

7： k8s 和docker swarm如何选择： :

5.2 对SVC的考察

SVC是k8s中的核心概念这里涉及知识点众多常见的面试考点如下

什么是SVC? 如何创建SVC?

使用SVC创建多个副本和使用RC创建多个副本有什么差异？

SVC有哪几种类型？

SVC 负载分发策略有那些？

集群外如何访问SVC?

SVC: 是对一组功能相似的Pod资源的抽象，相当于一组服务的负载均衡。可以使用配置文件的方式创建也可以使用命令创建kubectl expose

SVC和RC提供服务的差距： RC创建的服务PodIP可能会变。SVC提供的clusterIP不会。通过Iptables的NAT转换重定向到本地端口，在均衡到后端Pod。

svc的几种类型： ClusterIp/NodePort/LoadBalancer/ExternalName

ClusterIp 默认类型分配的一个虚拟地址，内部可以相互访问，外部不行

NodePort 将SVC端口号映射到物理机

LoadBalancer 基于NodePort，云服务商在外部创建了一个负载均衡到Pod

ExternalName 将外部地址经过集群内部的再一次封装(实际上就是集群DNS服务器将CNAME解析到了外部地址上)，实现了集群内部访问即可。

svc负载分发策略： RoundRobin/SessionAffinity/自定义实现【基于标签选择器】

集群外部访问：端口映射到物理机即可

5.2 Pod考察

Pod和静态Pod的区别

生命周期和重启策略【这里可扩展不同控制器对Pod的重启策略要求】

Pod如何健康检查？

Pod的调度方式？【扩展调度算法】

Pod如何扩缩容？【扩展 RC和RS的差异】

答案

待补充 --详见《k8s权威指南》读书笔记

5.3 基础原理类考察

主要考察对基本组件的理解和原理分析

API Server

Controller Manager【Replication Controller/Node Controller/ResourceQuota Controller/Namespace Controller/SVC Controller& Endpoint Controller】

Scheduler

Kubelet 【Pod健康检查资源监控】

Kube-Proxy

k8s-DNS & Iptables差异

k8s中Ingress是什么

简述k8s中的如下属性及其作用resources tolerations affinity

k8s中pod、rs、deployment、hpa的基本概念，以及他们之间的关系

答案

待补充 --详见《k8s权威指南》读书笔记

5.4 网络原理类考察

主要考察对基本组件的理解和原理分析

k8s的网络模型是什么？

Docker的网络基础是什么？

Docker的网络模型和局限？

k8s的网络组件之间是如何通讯的？

外部如何访问k8s集群？

有那些开源组件支持k8s网络模型？

评分模型的检验方法和标准通常有：K-S指标交换曲线AR值Gini数等。例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成

评分模型的检验方法和标准通常有：K-S指标、交换曲线、AR值、Gini数等。例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成功的应用价值。K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

例如，K-S指标是用来衡量验证结果是否优于期望值，具体标准为：如果K-S大于40%，模型具有较好的预测功能，发展的模型具有成功的应用价值。K-S值越大，表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

信用评分模型介绍（一）

2016-08-28 蒋靓 Larry Jiang Larry的风险模型分享与探讨

引言：对于信用评分模型，很多朋友或多或少有所了解，这里做一般性的介绍，并分享自己的多年从业经验。这边短文主要包括：信用评分模型，自变量的生成、筛选、分档和转换，及常用有监督学习模型。

信用评分模型

信用评分模型是一种有监督的学习模型（Supervised Learning），数据由一群自变量X和对应的因变量y构成。传统零售信用模型中，X大致分为客户的基本信息（年龄、性别、职业、学位等），财务信息（收入，每月生活消费，每月信贷还款额等），产品信息（LTV，信用卡类别，个人贷款用途等），征信信息（前6个月被查询次数，前6个信用卡最大利用率，未结清贷款数等）；而一般取值0-1因变量y可以定义为在未来12个月是否出现欠款90天等.

经验备注：在大数据下，很多互联网公司对个人的评估不再局限于以上几种信息，而是根据更为广泛的数据源对个人进行更全面的刻画，故有称之为客户画像。数据维度会考虑个人在社会上留下的任何数据，如手机使用行为，理财行为，社交圈，网购行为，旅游行为等等等等。大家的各方面数据其实都在被不同的公司和不同的APP收集。。。

自变量的生成

自变量是信用风险的来源，除了考虑直接收集的变量，信用评分建模过程中往往需要建模人员产生更多的衍生变量。这部分工作要分析人员的直觉、长期经验的积累和数据挖掘技术的应用。大家可以通过京东和支付宝的评分一窥其自变量的维度：芝麻信用分为5个维度：身份特质，履约能力，信用历史，人脉关系，行为偏好；小白信用分也分为5个维度：身份，资产，关系，履约，偏好。

经验备注：现在越来越多的模型技术被应用于信用模型，但是个人觉得无论高级模型还是初级模型，最为重要的是更广泛的数据和产生更多更具有预测能力的自变量。

自变量的筛选

自变量一旦丰富了起来，就涉及到有效变量的筛选，大致可根据一下几个原则或方法：变量的直观意义（是否跟y有关），变量的单调性或合理性，未来是否可以获取以便模型可实施，变量的区分能力（IV），变量间相关性（变量聚类），变量缺失率，分档之后的稳定性等等。

经验备注：对于区分能力太强的变量，或缺失率很大的变量，不建议直接放入模型，可以考虑做成规则或者做成最后模型的调整。在大数据下，人们经常强调自变量与因变量的相关关系，应用于精准性要求不高的营销模型问题不大。而对于精准度要求极高的信用评分模型，相关关系的应用值得推敲。

自变量分档和转换

为了保持模型的稳定性，信用模型一般对自变量进行分档，比如根据风险不同把年龄分成几档。这样每档需要一个值来代表这段的自变量输入，这就是变量的转换，常见的有WOE和Logit转换。通过转换后不仅实现了稳定性要求，也克服不同变量间刻度不统一的问题，还克服回归中缺失值的填充问题。

经验备注：如果分档过粗糙，不但会降低单个变量的预测能力，也会造成最终评分集中度过高的问题。解决方法：可以考虑每档用线性插值来代替常数，也可以寻找更多能区分分数集中样本的自变量放入模型。

有监督学习模型介绍

目前比较流行的模型主要有以下几种（以后分享会逐一介绍）：

Logistic 回归（Logistic Regression）
决策树（Decision Tree）
支持向量机（Support Vector Machine）
人工神经网络（Artificial Neural Network）
生存分析模型（Survival Analysis Model）

经验备注：除此上述之外，还有些高级方法或算法：集成方法（Ensemble Method）（例如随机森林（Random Forrest），Boosting，AdaBoost），深度学习方法（Deep Learning），随机梯度下降算法（Stochastic Gradient Descent）等。

以上是关于docker 和 k8s 面试总结的主要内容，如果未能解决你的问题，请参考以下文章

超详细！K8s 面试题总结

超详细！k8s 面试题总结

BAT研发面试36题总结:Spring+Redis+Docker+Dubbo+高并发架构

Java开发社招面试总结！docker镜像导出与导入

Java开发社招面试总结！docker学习

面试思路总结