云原生 | 混沌工程工具 ChaosBlade Operator 入门篇(文末赠书)
Posted RadonDB 开源社区
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了云原生 | 混沌工程工具 ChaosBlade Operator 入门篇(文末赠书)相关的知识,希望对你有一定的参考价值。
负责 RadonDB 云数据库、容器化数据库的质量性能测试,迭代验证。对包括云数据库以及容器化数据库性能和高可用方案有深入研究。
近日,国内多家网站同时发生短期服务不可用现象,一夜冲上圈内热搜。据官方答复,是由于部分服务器机房发生故障,导致网站无法访问。为了避免这种情况,提高系统架构的可靠性,保障业务的连续性,希望能在故障之前找到导致 “崩盘” 的缺口。
十多年前,国外的互联网公司就已经在云化、分布式、微服务等前沿技术的使用过程中,遇到了类似的问题,并由此诞生了 混沌工程。
| 什么是混沌工程?
混沌工程即 Chaos Engineering[1],被定义为 在分布式系统上进行实验的学科,目的是建立对系统抵御生产环境中失控条件的能力以及信心。混沌工程属于一门新兴的技术学科,是一种提高技术架构弹性能力的复杂技术手段。最早由 Netflix 技术部门创建了名为 Chaos Monkey 的项目,通过随机性测试,来检测系统架构的健康情况,并设计足够的预案来应对可能到来的新一轮故障。
随着云化技术的发展和云原生(Cloud Native)的概念的提出,混沌工程的反脆弱哲学思想,也引入了云原生体系,可简单高效地为系统提高容错能力。
| 什么是 ChaosBlade Operator?
ChaosBlade[2] 是阿里巴巴开源的一款遵循混沌工程原理和混沌实验模型的实验注入工具,帮助企业提升分布式系统的容错能力,并且在企业上云或往云原生系统迁移过程中业务连续性保障。
而ChaosBlade Operator[3] 是 Kubernetes 平台实验场景的实现,将混沌实验通过 Kubernetes 标准的 CRD 方式定义,很方便的使用 Kubernetes 资源操作的方式来创建、更新、删除实验场景,包括使用 kubectl、client-go 等方式执行,而且还可以使用上述的 chaosblade cli 工具执行。
把实验定义为 Kubernetes CRD 资源,将实验模型中的四部分映射为 Kubernetes 资源属性,完美将混沌实验模型与 Kubernetes 声明式设计结合在一起(依靠混沌实验模型便捷开发场景,并结合 Kubernetes 设计理念)。
-
通过 kubectl 或者编写代码直接调用 Kubernetes API 来创建、更新、删除混沌实验,可清晰获取资源模拟实验的执行状态,实现 Kubernetes 故障注入的标准化。 -
通过 Chaosblade cli 方式 可非常方便的执行 Kubernetes 实验场景,查询实验状态等。 -
ChaosBlade 混沌实验模型与 Kubernetes CRD 的结合,实现 基础资源、应用服务、Docker 容器 等场景复用,方便 Kubernetes 场景的扩展。
支持的场景
目前支持的实验场景有以下三大类(持续更新中):
分类 | 资源种类 | 详细场景 |
---|---|---|
Node | CPU | 指定 CPU 使用率 |
网络 | 指定网卡、端口、IP 包延迟、丢包、包阻塞、包重复、包乱序、包损坏等。 | |
进程 | 指定进程 Hang、强杀指定进程等 | |
磁盘 | 指定目录磁盘填充、磁盘 IO 读写负载等 | |
内存 | 指定内存使用率 | |
Pod | 网络 | 指定网卡、端口、IP 等包延迟、丢包、包阻塞、包重复、包乱序、包损坏等 |
磁盘 | 指定目录磁盘填充、磁盘 IO 读写负载等 | |
内存 | 指定内存使用率 | |
Pod | 杀 Pod | |
Container | CPU | 指定 CPU 使用率 |
网络 | 指定网卡、端口、IP 等包延迟、丢包、包阻塞、包重复、包乱序、包损坏等 | |
进程 | 指定进程 Hang、强杀指定进程等 | |
磁盘 | 指定目录磁盘填充、磁盘 IO 读写负载等 | |
内存 | 指定内存使用率 | |
Container | 杀 Container |
| 部署 ChaosBlade Operator
执行 Kubernetes 实验场景前,需 提前部署 ChaosBlade Operator。
注意:需要新建一个 namespace !
部署指令:
helm install kube-system/chaosblade-operator-1.2.0-v3.tgz
helm install chaosblade-operator chaosblade-operator-1.2.0-v3.tgz --namespace chaosblade
回显示例:
ChaosBlade Operator 启动后,将在每个节点分别部署 chaosblade-tool
和 chaosblade-operator
Pod。通过如下指令查看部署结果,若 Pod 都处于 Running 状态,则部署成功。
kubectl get pod -n chaosblade -o wide | grep chaosblade
查询部署结果示例:
关于部署失败的常见原因,请关注后续 混沌工程工具系列 专题介绍。
| 实验环境
本系列文章将使用在 KubeSphere 上安装的 ChaosBlade Operator,对 RadonDB 系列容器化产品进行测试。
KubeSphere 环境参数:
规格 8 核 16G
磁盘大小 500GB
节点数 4
在 KubeSphere 环境部署成功后,控制台状态如下图所示。
下期预告
本篇为混沌工程工具 ChaosBlade Opeator 系列的入门篇,主要介绍混动工程以及实验工具 ChaosBlade Operator。
下一期,我们将使用部署的 ChaosBlade Opeator 工具,针对 Node 类资源各种场景进行测试。同时也会介绍在不同场景下混沌工程是如何帮助开发者发现系统中的问题,并达到逐渐建设高可用的韧性系统的目的。
[1]. 混沌工程原则:https://principlesofchaos.org
[2]. ChaosBlade:https://github.com/chaosblade-io/chaosblade
[3]. ChaosBlade Operator:https://github.com/chaosblade-io/chaosblade-operator
[4]. Kubernetes 中文文档:https://chaosblade-io.gitbook.io/chaosblade-help-zh-cn/blade
抽奖活动
参与抽奖活动,价值 119 元的《混沌工程:复杂系统韧性实现之道》等你拿。
奖品介绍
混沌工程开创者撰写,通过谷歌、微软等行业专家的真实故事,系统阐释混沌工程的核心实践,提供实践建议。
抽奖说明
奖品:技术图书《混沌工程》 1 份
活动自动开奖后,请于 48 小时内联系社区微信 radondb,留下领奖信息。
活动规则
-
参与活动需关注社区公众号 -
关注后扫描活动小程序码参与抽奖 -
开奖后 48 小时内领取,超时视为放弃 -
邀请好友助力增加中奖概率
本次抽奖活动最终解释权归 RadonDB开源社区 所有。
关于 RadonDB
RadonDB开源社区 是一个面向云原生、容器化的数据库开源社区。为数据库技术爱好者提供围绕主流开源数据库(mysql、PostgreSQL、Redis、MongoDB、ClickHouse 等)的技术分享平台,并提供企业级 RadonDB 开源产品及服务。
目前 RadonDB 开源数据库系列产品已被 光大银行、浦发硅谷银行、哈密银行、泰康保险、太平保险、安盛保险、阳光保险、百年人寿、安吉物流、安畅物流、蓝月亮、天财商龙、罗克佳华、升哲科技、无锡汇跑体育、北京电信、江苏交通控股、四川航空、昆明航空、国控生物 等上千家企业及社区用户采用。
RadonDB 可基于云平台与 Kubernetes 容器平台交付,不仅提供覆盖多场景的数据库产品解决方案,而且提供专业的集群管理和自动化运维能力,主要功能特性包括:高可用主从切换、数据强一致性、读写分离、一键安装部署、多维指标监控&告警、弹性扩容&缩容、横向自由扩展、自动备份&恢复、同城多活、异地灾备 等。RadonDB 仅需企业及社区用户专注于业务层逻辑开发,无需关注集群高可用选型、管理和运维等复杂问题,帮助企业及社区用户大幅度提升业务开发与价值创新的效率!
GitHub:
https://github.com/radondb
— FIN —
以上是关于云原生 | 混沌工程工具 ChaosBlade Operator 入门篇(文末赠书)的主要内容,如果未能解决你的问题,请参考以下文章
云原生 | 混沌工程工具 ChaosBlade Operator 入门篇