电脑的平均无故障运行时间是怎么测量的

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了电脑的平均无故障运行时间是怎么测量的相关的知识,希望对你有一定的参考价值。

参考技术A   平均无故障时间,简称MTBF,电脑没有,硬盘有。  这个是硬盘厂家,在设计和测试硬盘的时候,根据硬盘的情况,推出的硬盘的指标。  一般家用硬盘的MTBF是60万小时左右,企业级的一般都超过100万小时,固态硬盘通常在120万小时以上。  平均无故障时间(Mean Time Between Failures,简称MTBF)是指MO磁光盘机平均能够正常运行多长时间,才发生一次故障。这是衡量MO磁光盘机可靠性的重要参数,平均无故障时间越长,MO磁光盘机的可靠性就越高。目前主流产品的平均无故障时间(MTBF)达到了100000小时以上。

处理coredns Pending故障

参考技术A 生产环境中,遇到coredns Pending问题,如下

当前业务并无异常,只是pod状态不正常。删除pending状态的coredns,会立即启动一个,但依然是pending状态。查看一个pending状态的pod详细描述,可以看到报错原因

大概意思是现有的17个节点不满足节点亲和性,所以pod无法运行。

当前k8s集群里有17个node,coredns启动了22个,有5个为Pending状态。结合当前业务正常的情况猜测节点亲和性设置为每个节点只能运行一个coredns,于是有5个pod在其节点上由于已经有运行的coredns pod,无法运行,只能为Pending状态。查看节点亲和性。

集群中node节点是17个,为什么coredns设置为22个?只好先看下副本管理器中coredns设置的副本数。查看旧版本的k8s副本管理器用 kubectl get rc -n kube-system ,而比较新的版本用rs代替rc。

看到副本管理器中确实设定了副本数位22,先将副本数改为17,观察Pending状态的pod是否会被删除。

但是保存此配置后,删除Pending状态的pod,还是会自动启动一个,总数并没有改变。使用命令修改副本数:

提示修改成功,但coredns pod数量还是没有改变。
尝试修改deployments

保存退出后,发现pod数量依然是22个。
使用patch修改deployment副本数,结果pod数量还是不变。

由此可以推测coredns数量由某个进程或配置管理,不受rs、deployments管理。
这时注意到dns-autoscaler这个deployment,然后联想到cluster-autoscaler。CA(cluster-autoscaler)是用来弹性伸缩kubernetes集群的,dns-autoscaler应该是弹性伸缩coredns这个pod集群的。

为了验证猜想,先停掉dns-autoscaler,再将pod数量调整为17个。

再查看coredns pod数量,已经变为17个, 而且全都是running状态,问题解决。后续再研究下dns-autoscaler为什么会把coredns pod目标数量设定为22个,怎么修改这个预设数量。

以上是关于电脑的平均无故障运行时间是怎么测量的的主要内容,如果未能解决你的问题,请参考以下文章

平均无故障时间的计算方法及公式?

性能测量 - 获取每个函数的平均调用时间。英特尔 Vtune 放大器

在 Python 中测量脚本运行时间 [重复]

如何实现ABAP程序连续自动运行?

若服务器系统可用性达到99.99%,那么系统平均无故障时间约为多少

Matlab:沿列绘制平均值,通过运行索引进行子集化