美文网首页AWS
OneAlert 入门(三)——事件分析

OneAlert 入门(三)——事件分析

作者: OneAPM | 来源:发表于2016-01-22 16:35 被阅读174次

OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第三篇,将帮助你快速了解和配置 OneAlert,从而挖掘该平台的最大价值。

OneAlert 入门(三)——事件分析

事件分析

你此前用过的大多数工单系统或问题追踪系统都会要求你手动分类或联结工单。OneAlert 可不一样。OneAlert 事件流中的每个事件都是自动创建的,且以监控栈中实时产生的告警为基础。ZabbixNagios ,Solarwinds ,AWS CloudWatch ,阿里云 ,监控宝,腾讯云等国内外主流监控工具都能支持,而且新的应用正在快速集成。只要该工具会给 IT 和 DevOps(运维开发团队)产生告警,我们都会想办法与之集成。OneAlert 除了可以做一名合格的告警搬运工,还提供事件分析功能,目前包括总览、告警 Top 分析、告警压缩、应用,即将上线的还有面向 Team Leader 的团队分析、成员分析、通知分析功能。

OneAlert 入门(三)——事件分析

Top分析----对告警内容和对象进行深入分析

OneAlert 提供两种 Top 分析,一种是根据告警内容产生告警的频繁次数进行排名分析;一种是根据告警对象产生告警的频繁次数进行排名分析。我们可以直观的看到哪些事件发生故障的次数排名,这样我们可以有针对的排除发生故障的原因,预防下次还频繁发生故障。我们还可以看相应告警的持续时间和 MTTA / MTTR,可以查看团队的工作效率,从而继续优化团队排班和升级策略。

OneAlert 入门(三)——事件分析

告警压缩----减少噪音

生产环境中的一个问题可能导致多个告警。例如,一个磁盘问题可能会先导致磁盘 IO 告警。后者又很可能迅速触发一些列的 CPU,内存,数据库及应用告警。当然,在这种情况下,你可不想分开管理二十多个问题。实际上,它们都是同一个原因导致的。因此,OneAlert 会自动进行分组,将相关的告警整合为高级事件。OneAlert 的分组算法会使用主机名、集群和应用等信息,确保所有相关告警都分到同一组内。未来还会根据集群、应用和团队职责等进行分组。此外,算法还会考虑告警出现的时间顺序,使你对事件的了解更加深入。

OneAlert 入门(三)——事件分析

前沿分享

以上事件分析功能主要面向运营团队的一线人员,未来我们将推出面向 Team Leader 的团队分析、成员分析、通知分析功能。让 Team Leader 可以直观看出团队设置的排版和升级策略是否需要继续优化,也可以看出每个人的确认告警的时间和解决故障的时间,查看整个团队和成员的工作效率。更多功能敬请期待。

OneAlert 能够实时地自动整合告警,并且通过多链路多种通知方式让告警最有效率的通知到相关人员,极大的缩短 MTTR,最后事件分析功能让团队价值最大化。这使 OneAlert 成为国内 IT 与 DevOps 团队管理并解决问题的最佳平台。在第四部分,我们会介绍如何在整个团队中使用该工具,从而最大限度地提高协作效率。

本文转自 OneAPM 官方博客

相关文章

  • OneAlert 入门(三)——事件分析

    OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有...

  • OneAlert 入门(一)——事件流

    OneAlert 入门(一)——事件流 OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监...

  • 软件漏洞分析入门(一)

    软件漏洞分析入门(一) 未被公开的漏洞称为 0 day。 软件漏洞分析入门(二) 软件漏洞分析入门(三)

  • EventBus源码解析

    一、概述 在上篇文章中,讲解了EventBus的入门,并在文章中提到了同步事件模式和异步事件模型,下面将具体分析两...

  • 《Oracle Java SE编程指南》23-08:事件监听

    内容导航: 前言 2、事件处理快速入门 Swing事件监听快速入门 GUI事件监听器 解释Java中的事件授权处理...

  • “三秒吃西瓜”事件策划方案 分析 根据需求及提供素材资料,分析如下: 1.本次事件无新闻性, 2.本次事件无社会现...

  • 解密大数据专栏文章分类【转】

    数据分析入门数据分析入门常见问题汇总Python初学者们 - Anaconda入门使用指南Python学习利器——...

  • 解密大数据专栏文章分类

    数据分析入门 数据分析入门常见问题汇总 Python初学者们 - Anaconda入门使用指南 Python学习利...

  • 逆向入门分析实战(四)

    9/14 文章共计1836个词 是逆向入门分析实战系列的第四篇 是逆向入门分析实战系列的第四篇 逆向入门分析实战(...

  • 编程实战综合

    生信编程很简单[1] 编程语言系统入门 生信分析人员如何系统入门python? 生信分析人员如何系统入门perl?...

网友评论

  • sarlleny:可以用腾讯云进行监控连接,因为腾讯云的流畅性比其他同产品快
  • b8eceb9f3fa4:腾讯云服务器,相较其他云服务器,都是比较好的
  • 89250c3445ff:我们公司就是用的腾讯云的监控工具,有实时告警功能。很棒。

本文标题:OneAlert 入门(三)——事件分析

本文链接:https://www.haomeiwen.com/subject/rgxrkttx.html