未通过 Marathon 健康检查的应用程序警报

Posted

技术标签:

【中文标题】未通过 Marathon 健康检查的应用程序警报【英文标题】:Alerts for apps failing Marathon healthchecks 【发布时间】:2019-04-12 17:54:32 【问题描述】:

我一直在为我在 marathon 中运行良好的所有应用程序配置 http 健康检查,问题是 marathon 会不断介入并重新启动容器,但它的健康检查失败,除非我碰巧在查看马拉松用户界面。

有没有办法检索所有健康检查失败的应用,以便我可以发送电子邮件警报或类似信息?

【问题讨论】:

【参考方案1】:

Marathon 使用 event bus 公开有关未通过健康检查的信息,因此您可以编写一个简单的服务来使用 Marathons HealthChecks 事件 ("eventType": "instance_health_changed_event") 并将其转换为指标,提醒您命名。

作为参考,我可以推荐allegro/appcop。这是缩减不健康应用程序的服务。它的代码可以很容易地修改来做你想做的事情。

【讨论】:

谢谢,在此期间我编写了按计划调用马拉松 api 的代码,我不知道这个事件总线

以上是关于未通过 Marathon 健康检查的应用程序警报的主要内容,如果未能解决你的问题,请参考以下文章

聊聊Mesos原生健康检查(Native Health Check)

黑马项目公开:传智健康移动端开发-体健预约

微服务Nacos 健康检查机制

关注丨打造粤港澳大湾区国际智慧健康城 GIMP Project

黑马程序员项目传智健康移动端开发-2

终于对探针下手了