docker 和 k8s 面试总结

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了docker 和 k8s 面试总结相关的知识,希望对你有一定的参考价值。

参考技术A 花了大半个月对k8s&docker进行了梳理,包括之前读过的书,官方文档以及k&d在公司项目的实践等。

以下是个人对docker & k8s 面试知识点的总结:

1 docker

常见面试题如下 每一点可根据回答进行适当深入

1.1 什么是docker

docker和传统linux的差异?

容器和镜像的区别?

如何理解docker的缓存机制?

1.2 docker 网络模型是什么?有何局限

docker的网络基础是什么?

docker的网络模型是?有什么局限?

docker如何实现容器间通信的?

1.3 docker 基础命令

cmd和entryPoint差异?

copy和add的差异?

简单讲下swam/compose?

2 kubernetes

常见面试题如下 每一点可根据回答进行适当深入

2.1 什么是k8s?

1 为什么用k8s 解决了什么问题?

2 k8s有哪些组件,有什么作用?【同:Master节点和Node节点都用哪些组件】

3 可以简单说下Node Pod container 之间的关系吗? 【可引入2.2/2.3对Pod SVC的考察】

4 什么是SVC可以简单描述下吗?【可引入2.3对SVC的考察】

5 可以简单讲下k8s的网络模型吗?

6 Pod SVC Node Container 之间如何相互访问

7 swarm和k8s如何选择?

2.2 考察Pod

静态Pod和普通Pod的差异?

简单讲下Pod的生命周期重启策略呢?

- 不同组件对Pod的重启策略要求一样吗?

如何检查Pod的健康状态?哪2种探针?

- 2种探针的实现方式

简单说下Pod的调度方式?

2.3 考察SVC

SVC有哪4种类型

2.4 k8s网络模型

DNS和Iptables在k8s中的运用?有何差异

- k8s如何解决多机器部署容器的网络问题?

Pod SVC Node Container 之间如何相互访问

3 参考答案

答案是根据所在公司项目结合自己的理解给出的答案 不一定完全准确但在面试中要做到有理有据突出自己的思路即可。

4 docker

问题和答案 如下

4.1 什么是docker?

通常问这个问题主要在于考察候选人是否真正了解过docker,很多人项目中都有用到docker,真正去了解过概念,架构的不多。从而来辨别简历上的熟悉/了解docker的水分。

如果这个都无法回答,那么接下来的docker考察也就毫无意义了,此问题通常也会结合以下问题来进行考察。

docker和传统linux的差异?

docker都有哪些核心组件?

可以简单说下docker的架构吗?

容器和镜像的区别?

docker是什么:  Docker是一个可以把开发的应用程序自动部署到容器的开源引擎。

docker和VM差异:  docker是一个应用层的抽象,容器之间通过网络命名空间进行隔离,多个容器共享同一个操作系统内核。VM是对物理硬件层的抽象,每个VM都包含独立的操作系统,重且启动缓慢。VM主要为了提供系统环境,容器主要是为了提供应用环境。

docker组件:  docker引擎【包含Docker客户端&服务端】,docker镜像,docker容器,Registry【镜像仓库】

docker的架构:  C/s架构

容器和镜像的区别:  镜像是一个只读模板,包括运行容器所需的数据,其内容在构建之后就不会被改变,可以用来创建新的容器。 镜像由多个只读层组成,容器在只读层的基础上多了一个读写层。

4.2 docker 网络模型是什么?有何局限

这里也经常会结合K8s网络原理进行考察,以及如下几个考点

docker的网络基础是什么?

docker的网络模型是?有什么局限?

docker如何实现容器间通信的?

Docker网络基础:  Docker是在操作系统层上对应用的抽象,使用网络命名空间来对不同容器之间进行网络隔离,用Veth设备对来进行容器之间的通讯。

docker的网络模型:  有4种网络模型 分别是Bridge Container host none 默认使用bridge网络模型,容器的初次启动会虚拟化出来一个新的网卡名为docker0,在多机器部署下docker0地址可能会冲突。所以docker对多机部署支持的不够友好。

4.3 docker 基础命令

出现频率较高的为以下几条命令的考察

cmd和entry差异?

copy和add的差异?

docker-compose & docker swarm?

CMD & ENTRYPONIT

都是容器操作指令:

CMD 用于指定容器启动时候默认执行的命令。可以被docker run指定的启动命令覆盖。ENTRYPONIT 指令可让容器以应用程序或者服务的形式运行。一般不会被docker run指定的启动命令覆盖。dockerfile中的多个CMD & ENTRYPONIT只有最后一个会生效。

注意区别docker run 和RUN 一个是容器启动命令,一个是镜像构建时候所用。

copy & add

ADD & COPY 选取目标文件复制到镜像当中。是针对镜像的指令,唯一差别在于add源文件可以支持url且可以对压缩文件进行解压操作。而copy针对的是当前构建环境。

docker-compose & docker swarm

使用Docker compose可以用YAML文件来定义一组需要启动的容器,以及容器运行时的属性。docker-compose用来对这一组容器进行操作。

docker swarm 原生的Docker集群管理工具,依赖docker本身,很多重要功能依赖团队二次开发。且社区不够活跃,一般公司生产环境会选择k8s,个人项目或者容器数量较少可选swarm,只需要docker即可完成,相对较轻。

5 kubernetes

5.1 什么是k8s?

对k8s的考察一般逃不过这样入门级的问题,针对入门级的问题,面试官可能也会针对如下几个点进行考察,在候选人答出来的基础上,选择其中一个进行深入。

为什么用k8s 解决了什么问题?

k8s有哪些组件,有什么作用?

可以简单说下Node Pod container 之间的关系吗? 【进一步可对Pod SVC细节进行考察】

什么是SVC可以简单描述下吗?【可引对SVC的考察】

可以简单讲下k8s的网络模型吗?【可以和docker网络模型结合考察】

Pod SVC Node Container 之间如何相互访问【衍生 外部环境如何访问k8s】

swarm和k8s如何选择?

1 什么是k8s 为什么用k8s:

一个开源的容器集群管理平台【容器编排工具】,可提供容器集群的自动部署,扩缩容,维护等功能。分为管理节点Master和工作节点Node。在我们的项目中主要解决了环境一致性的问题,通过CI/CD使得运维部署变得简单起来,以及自动部署,故障监控,自动扩缩容。可以提升开发效率。

2 k8s有那些组件:

etcd保存了整个集群的状态;

apiserver提供了资源操作的唯一入口,并提供认证、授权、访问控制、API注册和发现等机制;

controller manager负责维护集群的状态,比如故障检测、自动扩展、滚动更新等;

scheduler负责资源的调度,按照预定的调度策略将Pod调度到相应的机器上;

kubelet负责维护容器的生命周期,同时也负责Volume(CVI)和网络(CNI)的管理;

Container runtime负责镜像管理以及Pod和容器的真正运行(CRI);

kube-proxy负责为Service提供cluster内部的服务发现和负载均衡;

3 Node&Pod&container之间的关系:Node一般指工作节点包含多个Pod Pod中包含多个Container,Pod中的container共享同一个网络命名空间。

4 什么是SVC: SVC是对一组功能相似的Pod资源的抽象,相当于一组服务的负载均衡。

5 k8s的网络模型:IP-Per-Pod 每个Pod有独立的Ip地址,无论是否处于同一个Node节点,Pod可以通过IP相互访问,且Pod和容器的地址和外部看到的地址是同一个地址。

6 Pod SVC Node Container 之间如何相互访问:

同Pod内的容器:同一个Pod的容器共享同一个网络命名空间可以直接进行通讯

同Node内不同Pod的容器:多个Pod都关联在同一个Docker0网桥上,通过docker0网桥完成相互通讯。

不同Node内Pod的容器:不同Node上的docker0可能会相同,PodIP和docker0是同网段的,所以需要将PodIP和NodeIP进行关联且保障唯一,不同Pod之间的数据通过物理机的端口进行转发即可完成通讯。

7: k8s 和docker swarm如何选择:  :

5.2 对SVC的考察

SVC是k8s中的核心概念 这里涉及知识点众多 常见的面试考点如下

什么是SVC? 如何创建SVC?

使用SVC创建多个副本和使用RC创建多个副本有什么差异?

SVC有哪几种类型?

SVC 负载分发策略有那些?

集群外如何访问SVC?

SVC: 是对一组功能相似的Pod资源的抽象,相当于一组服务的负载均衡。可以使用配置文件的方式创建也可以使用命令创建kubectl expose

SVC和RC提供服务的差距:  RC创建的服务PodIP可能会变。SVC提供的clusterIP不会。通过Iptables的NAT转换重定向到本地端口,在均衡到后端Pod。

svc的几种类型:  ClusterIp/NodePort/LoadBalancer/ExternalName

ClusterIp 默认类型 分配的一个虚拟地址,内部可以相互访问,外部不行

NodePort 将SVC端口号映射到物理机

LoadBalancer 基于NodePort,云服务商在外部创建了一个负载均衡到Pod

ExternalName 将外部地址经过集群内部的再一次封装(实际上就是集群DNS服务器将CNAME解析到了外部地址上),实现了集群内部访问即可。

svc负载分发策略:  RoundRobin/SessionAffinity/自定义实现【基于标签选择器】

集群外部访问:  端口映射到物理机即可

5.2 Pod考察

Pod和静态Pod的区别

生命周期和重启策略 【这里可扩展 不同控制器对Pod的重启策略要求】

Pod如何健康检查?

Pod的调度方式?【扩展调度算法】

Pod如何扩缩容?【扩展 RC和RS的差异】

答案

待补充 --详见 《k8s权威指南》读书笔记

5.3 基础原理类考察

主要考察对基本组件的理解 和原理分析

API Server

Controller Manager【Replication Controller/Node Controller/ResourceQuota Controller/Namespace Controller/SVC Controller& Endpoint Controller】

Scheduler

Kubelet 【Pod健康检查 资源监控】

Kube-Proxy

k8s-DNS & Iptables差异

k8s中Ingress是什么

简述k8s中的如下属性及其作用resources tolerations affinity

k8s中pod、rs、deployment、hpa的基本概念,以及他们之间的关系

答案

待补充 --详见 《k8s权威指南》读书笔记

5.4 网络原理类考察

主要考察对基本组件的理解 和原理分析

k8s的网络模型是什么?

Docker的网络基础是什么?

Docker的网络模型和局限?

k8s的网络组件之间是如何通讯的?

外部如何访问k8s集群?

有那些开源组件支持k8s网络模型?

评分模型的检验方法和标准通常有:K-S指标交换曲线AR值Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成

评分模型的检验方法和标准通常有:K-S指标、交换曲线、AR值、Gini数等。例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

 

 

例如,K-S指标是用来衡量验证结果是否优于期望值,具体标准为:如果K-S大于40%,模型具有较好的预测功能,发展的模型具有成功的应用价值。K-S值越大,表示评分模型能够将“好客户”、“坏客户”区分开来的程度越大。

 

信用评分模型介绍(一)

2016-08-28 蒋靓 Larry Jiang Larry的风险模型分享与探讨

引言:对于信用评分模型,很多朋友或多或少有所了解,这里做一般性的介绍,并分享自己的多年从业经验。这边短文主要包括:信用评分模型,自变量的生成、筛选、分档和转换,及常用有监督学习模型。

 

信用评分模型

信用评分模型是一种有监督的学习模型(Supervised Learning),数据由一群自变量X和对应的因变量y构成。传统零售信用模型中,X大致分为客户的基本信息(年龄、性别、职业、学位等),财务信息(收入,每月生活消费,每月信贷还款额等),产品信息(LTV,信用卡类别,个人贷款用途等),征信信息(前6个月被查询次数,前6个信用卡最大利用率,未结清贷款数等);而一般取值0-1因变量y可以定义为在未来12个月是否出现欠款90天等.

经验备注:在大数据下,很多互联网公司对个人的评估不再局限于以上几种信息,而是根据更为广泛的数据源对个人进行更全面的刻画,故有称之为客户画像。数据维度会考虑个人在社会上留下的任何数据,如手机使用行为,理财行为,社交圈,网购行为,旅游行为等等等等。大家的各方面数据其实都在被不同的公司和不同的APP收集。。。

 

自变量的生成

自变量是信用风险的来源,除了考虑直接收集的变量,信用评分建模过程中往往需要建模人员产生更多的衍生变量。这部分工作要分析人员的直觉、长期经验的积累和数据挖掘技术的应用。大家可以通过京东和支付宝的评分一窥其自变量的维度:芝麻信用分为5个维度:身份特质,履约能力,信用历史,人脉关系,行为偏好;小白信用分也分为5个维度:身份,资产,关系,履约,偏好。

经验备注:现在越来越多的模型技术被应用于信用模型,但是个人觉得无论高级模型还是初级模型,最为重要的是更广泛的数据和产生更多更具有预测能力的自变量。

 

自变量的筛选

自变量一旦丰富了起来,就涉及到有效变量的筛选,大致可根据一下几个原则或方法:变量的直观意义(是否跟y有关),变量的单调性或合理性,未来是否可以获取以便模型可实施,变量的区分能力(IV),变量间相关性(变量聚类),变量缺失率,分档之后的稳定性等等。

经验备注:对于区分能力太强的变量,或缺失率很大的变量,不建议直接放入模型,可以考虑做成规则或者做成最后模型的调整。在大数据下,人们经常强调自变量与因变量的相关关系,应用于精准性要求不高的营销模型问题不大。而对于精准度要求极高的信用评分模型,相关关系的应用值得推敲。

 

自变量分档和转换

为了保持模型的稳定性,信用模型一般对自变量进行分档,比如根据风险不同把年龄分成几档。这样每档需要一个值来代表这段的自变量输入,这就是变量的转换,常见的有WOE和Logit转换。通过转换后不仅实现了稳定性要求,也克服不同变量间刻度不统一的问题,还克服回归中缺失值的填充问题。

经验备注:如果分档过粗糙,不但会降低单个变量的预测能力,也会造成最终评分集中度过高的问题。解决方法:可以考虑每档用线性插值来代替常数,也可以寻找更多能区分分数集中样本的自变量放入模型。

 

有监督学习模型介绍

目前比较流行的模型主要有以下几种(以后分享会逐一介绍):

  1. Logistic 回归(Logistic Regression)

  2. 决策树(Decision Tree)

  3. 支持向量机(Support Vector Machine)

  4. 人工神经网络(Artificial Neural Network) 

  5. 生存分析模型(Survival Analysis Model)

经验备注:除此上述之外,还有些高级方法或算法:集成方法(Ensemble Method)(例如随机森林(Random Forrest),Boosting,AdaBoost),深度学习方法(Deep Learning),随机梯度下降算法(Stochastic Gradient Descent)等。

以上是关于docker 和 k8s 面试总结的主要内容,如果未能解决你的问题,请参考以下文章

超详细!K8s 面试题总结

超详细!k8s 面试题总结

BAT研发面试36题总结:Spring+Redis+Docker+Dubbo+高并发架构

Java开发社招面试总结!docker镜像导出与导入

Java开发社招面试总结!docker学习

面试思路总结