OneAlert助力车行易提升事件响应效率,保障服务稳定性

Posted OneAPM官方技术

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了OneAlert助力车行易提升事件响应效率,保障服务稳定性相关的知识,希望对你有一定的参考价值。

权威数据显示,目前国内汽车后服务市场的规模已达万亿级别。而在车主日常用车的多种生活场景中,与车辆违章相关的细分业务使用频度仅次于导航、停车、洗车等三项车后服务,这也是极具发展潜力的一个细分市场。「车行天下,快易人生」的车行易,已经成为众多服务厂商中的佼佼者。

客户背景

成立于2011年的广州车行易科技股份有限公司(简称车行易),是一家为车主提供一站式车生活服务的移动互联网服务企业。车行易以庞大的车务数据为基础,整合线上线下车务等资源,向广大车主提供包括政策法规宣传解读、汽车资讯、新车导购、车务办理、用车常识、维修保养、金融保险、出行规划、休闲娱乐、车品选购等在内的车主日常所需服务。

依托海量数据资源和具备自主知识产权的人工智能算法,车行易的智能车务已经占据国内车务处理商用市场份额 80% 以上。车行易 CEO 尹剑表示,「车主通常最在意汽车服务的效率,在过去八年,通过车行易提供的服务累计为车主节省的时间总和已经超过百亿分钟。但是,随着云计算、大数据行业发展,客户对车易行IT基础服务的要求越来越高。」

而车易行也致力于为用户提供稳定、高效、便捷的服务。但是由于国内IT架构异常复杂,无论是网络还是软件服务都存在很多潜在的不稳定因素,所以能够及时发现问题,并快速反馈给IT人员解决,已经成为很多企业的核心诉求。
面临挑战
随着车行易数字平台的不断发展和数据产品的创新,整个业务运营面临了很大的挑战。在以往,车易行的运维人员主要是自己写代码、发邮件、发短信,或者使用钉钉接口来进行事故的报警与处理,不仅仅效率低下,而且缺乏对应的流程制度管理,相关人员有无认领任务无法进行确认,还容易出现各种推卸责任的现象。

此外,在业务高速发展过程中,维护一个稳定、高效的运营平台相对比较困难,所以对车行易的运维团队来说,在出现问题时能够做出响应,发挥出更多的主动性更显为重要。经过对市面相关产品的综合对比后,车行易部署了一站式告警管理平台 OneAlert ,通过OneAlert服务平台来构建基于事件驱动的流程管理制度。

为什么选择 OneAlert ?

作为目前国内领先的SaaS云告警平台,OneAlert 能够实现简单快捷接入,无需复杂配置,或者开发介入,就能够帮助车易行节省人力资源和研发成本。OneAlert 也帮助车易行在管理事件响应方面提高了灵活性,也全方位确保了运维团队能够在出现事件时及时受到报警,并立即着手解决事件,为用户体验「保驾护航」。

跨团队提供统一的事件接入接口

目前,OneAlert 能够接入十几种常见的监控工具,同时也是一个开放平台,支持通过 API 调用方式接入告警,将告警全部在一个平台处理,更加全面,也更便于进行管理。

没有告警丢失或者延迟

OneAlert 提供多种灵活的通知方式,包括电话、短信、微信、邮件、APP 等五种告警通知方式。并且多通道的告警通知,能控制告警延迟在秒级,保障告警的及时率和到达率,这样车行易的运维人员,即使不在办公司,也能实时了解到平台的运行情况,同时也能对系统问题实时进行处理。

规范业务运营过程中的问责制

OneAlert 提供告警分析的功能,能够根据应用、团队、成员三个维度进行告警内容的分析,清晰的了解到团队处理告警的平均响应时间,告警数量等指标,清晰认识车易行运维团队整体的工作情况。并且 OneAlert 的个性化通知和分派,明确区分每个成员的职责。不同时间、不同级别、不同主机组、不同内容的告警个性分派,帮助车行易运维团队提升了运维效率和精神状态。

客户反馈

据悉,车行易目前通过多种渠道接入 OneAlert ,支持了包括 Promethus、Zabbix、Graylog 及基于 OneAlert RestAPI 自开发的等多种告警模块。根据业务需要,分派策略基于告警接收对象划分为主,涉及到公司多个部门,包括商务、运营、开发、运维等等。比如对于商务人员而言,他们接收到的通知包括客户到期、余额不足等;对于运营人员来说,订单量异常、第三方服务异常等是他们所关心的,而对开发中心的同学而言,他们希望能够及时了解 Log 中的异常消息等。

而作为运维人员,他们时刻需要关注服务器、数据库、服务模块、nginx 等告警信息。而通过 OneAlert 平台,他们就可以根据微信、辅助钉钉机器人、邮件、短信来进行紧急事件的处理。在工作流程方面,车易行的运维团队规定,接收告警方需要及时认领,并进行考核,全面保障了IT服务的稳定性和高可用性,同时也赢得用户的口碑和好评。

另外,车易行还定制了 OneAlert 的高级应用,根据告警情况,通过 OneAlert 外接 POST 接口,将消息推送到具体的模块,根据模块判断,可以直接进行后续的处理,比如关闭某项服务或重启某项服务等等。

车行易的运维团队负责人王鹏感言:「我们通过 OneAlert 这款 SaaS 产品,将很多数据的整理工作放在线上就可以完成,同时让我们评估团队的工作有据可依,让各种业务运维工作有了 KPI 考核。对车易行运维团队而言,OneAlert 不仅仅是通知平台,也是一个分析、管理平台。更为重要的是,使用 OneAlert 后,我们可以随时随地了解系统告警情况,再也无需担心老板的罚款啦。」

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,提供有效的事件管理流程,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。

以上是关于OneAlert助力车行易提升事件响应效率,保障服务稳定性的主要内容,如果未能解决你的问题,请参考以下文章

详解 OneAlert 排班可以帮你做什么

2021 Google 开发者大会丨 助力优质应用构建,多维度提升开发效率

OneAlert 携手 BearyChat(倍洽)快速构建 IT 运维 on-call 机制

云狐工作易SAAS平台链接场景,助力企业消除痛点

数字化升级农产品行业,数字化供应链系统助力农产品企业提升供应链响应效率

慧聚 . 海克斯康商业智能系统助力AHS提升工作绩效