OneAlert

Nagios 安装及微信短信提醒

孤街浪徒 提交于 2020-03-29 22:48:24
引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法;这一点是 Nagios‘er 们非常喜欢的。 当服务或主机问题产生与解决时将告警发送给联系人(通过 EMail、短信、用户定义方式);需要配套的邮件服务器和短信网关对接。 另外还支持 Cacti 、 Ganglia、OpenTSDB 告警接入,强大的 Nagios 还有什么做不到的?作为一个告警平台,Nagios 已经是很强大了,然而在通知方面,特别是微信、短信、电话提醒通知方面还是短板,下面以目前最新版Nagios4.0.8+OneAlert 实现监控和微信提醒。 安装说明 如果你从来没有接触过 Nagios,请按照以下步骤安装 Nagios,如果你对 Nagios 非常熟悉或者机器中有 Nagios,请跳过安装步骤,直接进入 OneAlert 的报警设置。 也可以参考 Nagios 官网 。 Nagios 服务器: 10.128.6.38 CentOS 6.5 64bit 被监控机器: 10.128.14.102 CentOS 6.7 64bit 安装 Nagios 和 Nagios 插件(安装过程中标红的操作为安装 Apache,方便我们后面的调试

五大理由分配你的告警

ぃ、小莉子 提交于 2020-02-29 03:07:47
OneAlert 是应用性能管理领军企业 OneAPM 公司旗下产品,也是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。想了解更多信息,请访问 OneAlert 官网 。 本文转自 OneAPM 官方博客 来源: https://www.cnblogs.com/oneapm/p/5085326.html

Nagios 安装及微信短信提醒

只谈情不闲聊 提交于 2019-12-07 00:45:32
##引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服务的检测方法;这一点是 Nagios‘er 们非常喜欢的。 当服务或主机问题产生与解决时将告警发送给联系人(通过 EMail、短信、用户定义方式);需要配套的邮件服务器和短信网关对接。 另外还支持 Cacti 、 Ganglia、OpenTSDB 告警接入,强大的 Nagios 还有什么做不到的?作为一个告警平台,Nagios 已经是很强大了,然而在通知方面,特别是微信、短信、电话提醒通知方面还是短板,下面以目前最新版Nagios4.0.8+OneAlert 实现监控和微信提醒。 ##安装说明 如果你从来没有接触过 Nagios,请按照以下步骤安装 Nagios,如果你对 Nagios 非常熟悉或者机器中有 Nagios,请跳过安装步骤,直接进入 OneAlert 的报警设置。 也可以参考 Nagios 官网 。 Nagios 服务器: 10.128.6.38 CentOS 6.5 64bit 被监控机器: 10.128.14.102 CentOS 6.7 64bit 安装 Nagios 和 Nagios 插件(安装过程中标红的操作为安装 Apache

OneAPM 云监控部署与试用体验

久未见 提交于 2019-12-04 23:17:54
作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市场的火爆,我决定「放下身段」试用一次,并且会总结出它与开源监控之间差别在哪里。 ##运维经历的磨难 虽然都在不同的公司,做着不同的业务,但是大多运维总会经历相同的故事,以及背着类似的黑锅。运维们大多有如下经历: 网站或者业务访问不了,服务器问题,运维的责任 昨天还好好的,今天就出现的问题,运维的责任 部分地区用户反馈网站/App 无法试用,运维查查服务器。而且这种问题大多出现在事后。 各种程序都需要监控,常见的 MongoDB 、 Redis 、 Nginx ,还会出现各种不常见的应用。任何一种软件都要熟悉,运维总是在不停的学习,待遇缺一直比不上研发! 服务器出现问题,老板找运维、领导找运维、开发也找运维,运维并不知道代码逻辑,看日志,各种排错。 初识 OneAPM OneAPM 是一家为企业和开发者提供 APM 解决方案的服务商,支持 Java、.NET、PHP、Ruby、Python、Node.js、HTML5、iOS、Android 等语言和操作系统。 ##什么是 APM ? 既然试用 APM ,我觉得很有必要给大家解释一下这个名词。应用性能管理(Application Performance

OneAPM大讲堂 | 监控数据的可视化分析神器 Grafana 的告警实践

你说的曾经没有我的故事 提交于 2019-11-29 07:42:51
文章系国内领先的 ITOM 管理平台供应商 OneAPM 编译呈现。 概览 Grafana 是一个开源的监控数据分析和可视化套件。最常用于对基础设施和应用数据分析的时间序列数据进行可视化分析,也可以用于其他需要数据可视化分析的领域。Grafana 可以帮助你查询、可视化、告警、分析你所在意的指标和数据。可以与整个团队共享,有助于培养团队的数据驱动文化。 Grafana 有强大的社区支持,有丰富的模板插件,足够满足需要的功能特性。几乎可以集成任何数据源、监控工具和告警平台。可谓是不可多得的神器。也有很多国内国外的知名公司在使用。 接下来,小编从 Grafana 的重要特性展开来说,最后附上部分示例实践,仅供参考。 可视化 ,酷炫,灵活易用的可视化组件 统一 ,同时集成多个数据源 开源 ,活跃强大的社区 告警 ,定义告警并集成其他告警平台 通知 ,可扩展,模板和插件机制 一、可视化(Visualize) Grafana 提供了丰富的图标、图形和其他可视化选项,经过简单的界面操作就能通过分析来更好的理解数据。并且大部分情况下你只需要使用社区提供的模板和插件就足够了,并不需要自己过多的配置。 二、统一(Unify) 可以把所有数据源的数据同时集成到 Grafana,因此可以获取更好的上下文。Grafana 原生支持超过30个开源和商业的数据源,在统一的仪表板中将它们的数据混合在一起分析

zabbix3.0 安装方法

喜夏-厌秋 提交于 2019-11-28 19:34:28
菜单 引言 免费开源监控工具 Zabbix 因其强大的监控功能得到各大互联网公司的广泛认可,具体功能不再详细介绍,在之前发布的 Zabbix 2.4.1 安装及微信短信提醒 已经做了详细介绍,本篇主要对 Zabbix 3.0.1 的安装进行详细指导,并且详细介绍了 OneAlert 一键集成 Zabbix ,一分钟实现电话、短信和邮件通知。 安装说明 从 0 开始安装 Zabbix 如果你从来没有接触过 Zabbix,请按照以下步骤安装 Zabbix,下面以 Zabbix 3.0.1 + OneAlert 实现监控 Zabbix 服务器: 192.168.0.218 CentOS 7 64bit 被监控机器: 192.168.0.219 CentOS 7 64bit 也可以参考 官网 安装 安装过程目录 开始安装zabbix 3.0 安装Zabbix-Server服务器 安装Zabbix-Agent端 添加主机 最后介绍 OneAlert 一键集成 Zabbix 步骤,一分钟实现电话、短信和邮件通知。 一.开始安装zabbix 3.0 主机192.168.0.218,要先装mysql 1.解压 [root@opentsdb ~]# tar zxvf zabbix-3.0.1.tar.gz 2.跳转到mysql的目录 [root@opentsdb ~]# cd zabbix-3.0

OneAlert 入门(二)——事件分析

守給你的承諾、 提交于 2019-11-28 03:07:16
OneAlert 是国内首个 SaaS 模式的云告警平台,集成国内外主流监控/支撑系统,实现一个平台上集中处理所有 IT 事件,提升 IT 可靠性。有了 OneAlert,你可以更快更合理地为事件划分优先级、分配路径,从而极大地提高团队的协作能力、优化协作流程。本文是 OneAlert 入门系列文章的第二篇,帮助你快速了解和配置 OneAlert,从而尽早解决系统宕机或 404 错误。 事件分类 正如本系列第一篇文章所述,OneAlert 会自动根据主机、集群或自定义的标签将告警分组。分组完成之后,最重要的任务便是决定事件的优先级。这一过程被称为事件分类(incident triage),能确保团队合理地分配时间与资源。 OneAlert 暂时提供一种简单的方法,提高团队协作能力:转发。 通过转发团队协作处理告警 当新告警产生时,首先先确定自己是否能够解决该告警。譬如,磁盘容量不足,而自己无释放容量的权限时,我们可以通过转发该告警给相关人员处理,将团队每个人的能力和权限价值最大化。OneAlert 提供的协作转发方式包括工单、客服、及时通讯等团队协作应用,确保告警能够通过适合的渠道发送给最佳处理人,提高团队协作能力。 本篇除了介绍 OneAlert 的协作功能,还将介绍两个即将上线的新功能:非紧急事件告警再提醒功能和重要事件标星功能。 非紧急事件告警再提醒 当需要处理的告警很多时

OneAlert告警通知必达

这一生的挚爱 提交于 2019-11-28 02:51:24
随着互联网行业的高速发展,企业 IT 应用环境日趋复杂。几分钟的故障就会严重到 用户体验 ,那么如何有效降低IT故障带来的影响呢?权威数据表明,86%的企业认为建立有效的监控系统和告警系统、提升 IT 的可见性是最佳的方式。 9月1日,国内第一个 SaaS 模式的云告警平台 OneAlert 宣布上线,该平台集成了国内外多种主流的监控和支撑系统,实现一个平台上集中处理所有 IT 事件,从真正意义上提升了 IT 可靠性。 OneAlert 是国内应用性能管理领军企业 OneAPM 旗下的产品。 研发背景 其实,在 IT 运维 支撑工作中,大多同学都使用了 Zabbix 、 Nagios 等开源监控工具或者是其他监控工具,他们经常面临着如何配置提醒通知的问题。 邮件通知,各工具配置都比较复杂,自建的邮件服务器还可能不太靠谱,而且邮件通知太慢了,主要是邮件客户端的接收延迟。 短信通知,复杂度太高,对接运营商短信网关,或者是使用短信猫方式,都需要开发配合。使用短信猫还面临在机房里面信号极其不稳定的问题。 其他??想想而已~ OneAlert 是如何解决该问题的呢?在这之前,我们先说一个典故: 典故 1815年6月18日的滑铁卢战役,是拿破仑和威灵顿两国军队之间的生死交锋,一旦英国取胜,英国公债必然迅猛增长。拿破仑军队在傍晚时分败局已定,罗斯柴尔德法国家族收到现场情报反馈后

部署onealert云告警平台

怎甘沉沦 提交于 2019-11-27 16:06:59
一、注册云告警账号 1.登录云告警系统www.onealert.com,注册一个账号,注册过程不再这里介绍,点击CA进入平台 2.进入平台后,点击个人信息,绑定微信号,用于接收告警信息 3.点击配置---->通知策略,可以看到任何时间所有告警会以微信通知 4.获取应用key,点击配置—>应用---->添加应用—>zabbix 二、配置服务 1.解压告警软件到zabbix的监控告警目录下(必须在该路径下,否则会报错,告警不能及时送达) [root@server1 ~]# tar zxf oneitsm_zabbix_release-1.2.0.tar.gz -C /usr/lib/zabbix/alertscripts/ 2.切换到/usr/lib/zabbix/alertscripts/目录下,查看有解压软件 [root@server1 ~]# cd /usr/lib/zabbix/alertscripts/ [root@server1 alertscripts]# ls oneitsm 3.进入/oneitsm/bin/下,利用应用key安装 [root@server1 alertscripts]# cd oneitsm/ [root@server1 oneitsm]# ls bin logs release update [root@server1 oneitsm]# cd

如何让运维指标变得更有价值?

六月ゝ 毕业季﹏ 提交于 2019-11-27 13:40:59
这是 《运维不容错过的4个关键指标》 的姐妹篇,上篇文章介绍了优秀运维团队需要关注的4个关键指标,我们分享了平均恢复时间 MTTR、平均响应时间 MTTA 等概念。这篇是介绍一些实践方法,更好的使用工具进行优化以上指标。 ##以 MTTA 为指导原则 MTTA 是衡量响应一个告警事件的关键性指标。为了掌握你的告警事件响应时间,在你已经开始处理告警时,强烈建议及时响应(认领),例如通过移动端、微信、页面、移动 APP 等方式及时认领。特别是如果有多人运维、并且设置了升级处理的策略,该实践会非常有用,你可以知道现在是谁在处理,处理进展怎样,你就不用担心告警没通知到位或者是没有处理了。 大多数优秀的运维团队,往往会将 MTTA 作为最关键的指标之一,因为这是可控和可操作的。有故障时,我们很难控制最终的恢复时间,毕竟涉及问题较多;但是至少可以保证响应及时率。优秀的运维告警平台很容易就能够能够跟踪整个团队的 MTTA ,包括现状、历史趋势,团队是否可以达到响应标准。 可能有同学会质疑,因为大家经常是第一时间就开始处理告警,往往忽略掉响应(认领),平时如果多个人协作同学坐一起,会吼一句「放着我来!」就能搞定,需要这么复杂么。 没有数据记录,就没有优化基础。比如如果人员不集中的话,或者是事情多了,就容易沟通不畅或遗漏,使用工具能够避免该问题。 很多告警工具需要同学们在 PC