运维告警管理—多渠道的通知必达

心不动则不痛 提交于 2020-07-28 11:30:46

睿象云智能告警平台CA中通知策略实现了被分派人接收告警的通知方式,确保告警发生/认领/关闭时,能以用户习惯的接收告警的方式,实时收到告警通知,同时,尽可能减少告警遗漏。

如果你想实现电话、短信、微信、邮件、APP,5种通知方式,您需要:

个人信息中,填写正确的电话号码;点击右上角 个人中心可修改手机号

个人信息中,填写正确的邮箱地址;点击右上角 个人中心可修改邮箱

个人信息中,绑定并关注 Cloud Alert 微信公众号;

扫描下方二维码,下载APP,安装,登陆。

为满足大部分客户的个性化通知需求,通知策略包含6个部分:

1.告警状态;

2.通知时间;

3.告警级别;

4.延迟策略;

5.通知方式;

6.通知人。

告警状态

发生时:告警发生/trigger时,如果被分派人想收到告警通知,可以设置发生时通知;

确认时:在CA平台 PC端、微信端、APP端点击 认领 按钮告警后,意味有人认领/ack告警了,如果被分派人想收到确认告警信息,可以设置确认时通知;

关闭时:告警解决/resolve后,如果被分派人想收到告警关闭信息,可以设置关闭时通知;

通知时间

可以根据用户实际工作时间,设置不同的通知策略,可设置告警在任何时间发生,均通知;可设置告警在工作时间发生,才通知;可设置告警在非工作时间,才通知。例如,在工作时间时刻在电脑前,设置个邮件通知就够了,但是非工作时间,不在电脑前,可以设置电话/短信通知。

例如:

• 工作时间为:周一-周五的9:30-18:30;

• 非工作时间:周一-周五18:31-9:29及双休日全天;

• 自定义工作时间如下所示。

自定义工作时间

操作路径:管理员(admin)可在【通知策略】的右上角自定义工作时间;成员(user)仅可查看不能编辑;

 

设置工作时间:起始日期(包含)- 结束日期(包含);起始时间(包含)- 结束时间(包含);

告警级别

CA平台支持3个级别:严重、警告、提醒。如果您的监控工具有多个级别,也会默认转换成这三个级别。

其他监控工具告警级别对应关系如下:

 

Grafana 所有告警默认严重级别 | status=ok 为恢复告警;

Aliyun 所有告警默认严重级别 | alertState=OK 为恢复告警;

AWS 所有告警默认提醒级别 | NewStateValue=ok 为恢复告警;

Cacti 所有告警默认严重级别 | subject包含NORMAL或是包含

normal或是包含Restored 为恢复告警;

Site24x7 所有告警默认严重级别 | status=up 为恢复告警;

邮件集成 所有告警默认警告级别。

延迟策略

CA平台支持告警状态变化立刻通知,也支持多样化的延迟通知设置,以下场景时建议您使用延迟策略:

• 不重要的告警,如提醒级别,在非工作时间,无需立刻通知,设置延迟12小时,在工作时间处理即可;

• 重要的告警,如严重级别,设置立刻通知,可能有漏看信息错过告警,可以设置延迟5分钟再次通知;

• 重要但不紧急的告警,如警告级别,设置延迟2小时再通知。

通知方式

CA平台支持5种通知方式:电话、短信、微信、邮件、APP。

通知人

admin 可以统一管理(新增、编辑、删除、查看)所有人的通知策略,user 仅能管理自己的通知策略。所以通知人处,user默认选择本人,admin可以一次性配置多人。

功能详情见视频:http://video.aiops.com/CA.notice.mp4

或扫描二维码观看视频:

更多功能欢迎访问睿象云官网~

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!