ganglia

【过关斩将】运维老鸟带教你如何精通运维

梦想与她 提交于 2020-08-12 07:00:27
文章目录 前言 一. 你的困惑在哪里? 1. 关于学习与公司的区别 2. 这么多我该学哪一个? 二. 如何才能学精通运维 三. 最核心的问题来了 总结 前言 我经常说一句话: 运维行业入门容易,精通难。 为什么? 因为运维学的东西又多又杂; 需要了解网络,学习系统基础操作,熟悉数据库,熟悉基础服务,熟悉自动化工具,虚拟化,容器,监控,故障排查等等。 而且随便一个点都有无数的工具需要掌握,比如监控: zabbix,grafana, cacti,天兔,prometheus,nagios,monit,ganglia,zenoss,open-falcon等等。 每一个工具又有无数的插件和模块,比如prometheus,与grafana结合,与微信结合,与邮件结合,与钉钉结合,单机模式,分布式,与数据库结合,与存储结合,与硬件结合,太多了,多到不想写。 很多人学着学着就放弃了,所以今天我们就一起来探讨下,运维到底该如何学。 一. 你的困惑在哪里? 这个问题比较好,你的困惑在哪里呢? 我调查了数百名小伙伴,大家普遍的困惑就是: 学的在公司能用上吗? 来源: oschina 链接: https://my.oschina.net/u/4349274/blog/4463621

网络监控系统七大开源工具分析

馋奶兔 提交于 2020-08-11 17:58:36
不断提升企业形象及服务质量、节约成本是所有企业的需求。数字化进程的加速,企业基本都会面临线上办公、线上提供产品服务的情况。运维部门为确保企业中所有业务稳定运行,并满足业务不断扩张的发展需求,时刻肩负着极大的挑战。如何节省成本,提升运维工作效率,实现精准监控? 当下,部分企业倾向于用开源软件节约成本,开源产品如何选型?如何达到企业级效果?我们测试了七个开源产品:Zabbix、Nagios、Prometheus、SugarNMS、Ganglia、Open-Falcon和Cacti,这些产品都有稳固的用户基础且均有更新。我们重点测试了操作,管理工具、接口以及每个产品的监控能力,自动发现、应用场景等情况。 我们在Windows上测试了这七款产品,当然并不是这些产品不能在Linux上运行。 Zabbix 商业开源软件。一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。用户群体主要面向泛物联网企业,主要监控集群。 支持告警功能,具备扩展能力,可自定义监控指标,其主要采用mysql/postgresql存储监控数据,监控规模1000+左右。但缺少数据汇总功能,使用上不太方便。而且由于缺少中文资料,服务支持有限,学习成本和定制模板比较大。 Nagios Nagios是一款开源网络监视工具,适合监视大量服务器计算环境,集成了很多功能。可监控主机状态及网络设备等

ganglia分布式监控部署

懵懂的女人 提交于 2020-04-20 18:20:32
一.介绍 Ganglia是由UC Berkeley发起的一个开源监控项目,设计用于监控数以千几的节点。每台服务器都运行一个收集和发送监控数据名为gmond的守护进程。它将从操作系统和指定主机中收集。接收所有监控数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次架构模式,使ganglia可以实现良好的扩展。Gmond带来的系统负载非常小,这使得它成为集群中各个服务器上运行一段代码而不会影响用户性能。 Ganglia主要用来监控系统性能的软件,通过曲线很容易见到每个节点的工作状态,对合理调整,分配系统资源,提高系统整体性能起到重要作用,支持浏览器方式访问,但不能监控节点硬件技术指标。Ganglia是分布式的监控系统。 Ganglia的组件: Ganglia包括如下程序,它们之间通过xml格式传递监控数据。 服务端ganglia meta daemon(gmetad):负责收集各个cluster的数据,并更新到rrd数据库中 客户端ganglia monitoring daemon(gmond):收集本机的监控数据,发送到其他服务器上,收集其他服务器的监控数据,供gmetad读取。 基于web的动态访问方式ganglia PHP web Frontend:一个基于web的监控界面,需要和gmetad安装在同一个节点上,从gmetad取数据

05 架构高可用

二次信任 提交于 2020-04-13 11:43:34
【今日推荐】:为什么一到面试就懵逼!>>> process available 99.9% (1 - 网站不可用时间/年度总时间)* 100% 分层 不同层,关注点不一样 服务层 / 应用层: 集群, 解决高并发问题 数据层: 数据的安全, 数据不丢失, 数据访问服务不中断. 数据备份 失效转移 失效转移:若 数据服务器 集群中任何一台服务器宕机,那么应用程序针对这台服务器的所有读写操作都需要重新路由到其他服务器,保证数据访问不失败. 失效转移步骤: 失效确认,访问转移,数据恢复. 实际上现在很多数据库有相关的保护机制. 发布 网站发布,同时还在运行. 自动化测试 自动化测试工具 Selenium. 预发布验收 大型网站并非直接发布到生产(因为开发环境和生产环境不同),而是先发布到验收服务器,看情况,没问题再发布到正式服务器。 当然,现在有 docker 和 K8S 相对好一些了。 代码控制 SVN / GitHub 目前有两种方式: 主干开发,分支发布:代码修改都在主干上, 需要发布时,从主干上拉出一个分支发布, 该分支即成为一个发布版本,如果发现bug,继续在该分支上修改,并将修改合并回主干,直到下次主干发布。 分支开发,主干发布:任何修改都不在主干上进行,需要开发新功能或修复Bug时,从主干拉一个分支进行开发,开发完测试通过后,合并回主干,然后从主干发布

ganglia监控搭建

二次信任 提交于 2020-04-06 13:50:42
环境: CentOS release 6.2 (Final) 首先要下载ganglia http://sourceforge.net/projects/ganglia/files/ganglia%20monitoring%20core/3.6.0/ganglia-3.6.0.tar.gz/download?use_mirror=nchc 目前最新的为ganglia-3.7.2.tar.gz 同时要下载ganglia-web-3.71.tar.gz 下载httd http://archive.apache.org/dist/httpd/httpd-2.2.23.tar.gz php-5.4.10.tar.gz http://cn2.php.net/distributions/php-5.4.10.tar.gz 目前最新版本为:php-5.6.13.tar.gz confuse-2.7 http://www.nongnu.org/confuse/ 安装路径规划:软件名称 路径 ganglia安装路径 /usr/local/ganglia php安装路径 /usr/local/php apache安装路径 /usr/local/apache2 ganglia-web安装路径 /opt/monitor/ganglia/ganglia-web-3.5.12 rrds数据路径 /opt

Ganglia安装

对着背影说爱祢 提交于 2020-03-23 20:33:54
需要安装httpd和php 一. 安装监控端 0. 安装依赖库 1)apr, apr-util 2)安装rrdtool-1.4.7 # tar zxvf rrdtool-1.4.7.tar.gz # cd rrdtool-1.4.7 # ./configure --prefix=/opt/ rrdtool-1.4.7 # make # make install 3) 安装confuse(confuse-2.7.tar.gz) #tar zxvf confuse-2.7.tar.gz #cd confuse-2.7 #./configure CFLAGS=-fPIC #make #make install 4)安装libexpat #yum install expat-devel.x86_64 5)安装libpcre #yum install pcre-devel.x86_64 1. 编译安装ganglia 下载ganglia-3.4.0.tar #tar zxvf ganglia-3.4.0.tar.gz #cd ganglia-3.4.0 #./configure --prefix=/opt/ganglia-3.4.0 \ --sysconfdir=/etc/ganglia \ --with-libapr=/opt/apr-1.3.2/bin/apr-1-config \ -

Ganglia 原理

谁都会走 提交于 2020-03-21 04:54:12
原理 Ganglia 项目是由加州大学发起的,现在已经成为一个应用非常广泛集群监控软件。可以监视和显示集群中的节点的各种状态信息,比如如:cpu 、mem、硬盘利用率, I/O负载、网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现。同时具有很好的扩展性,允许用户加入自己所要监控的状态信息。 2.1 ganglia工作原理 图 1 Ganglia整体结构图 Ganglia 包括如下几个程序,他们之间通过XDL(xml的压缩格式)或者XML格式传递监控数据,达到监控效果。集群内的节点,通过运行gmond收集发布节点状 态信息,然后gmetad周期性的轮询gmond收集到的信息,然后存入rrd数据库,通过web服务器可以对其进行查询展示。 Gmetad 这个程序负责周期性的到各个datasource收集各个cluster的数据,并更新到rrd数据库中。 可以把它理解为服务端。 Gmond 收集本机的监控数据,发送到其他机器上,收集其他机器的监控数据,gmond之间通过udp通信,传递文件格式为xdl。收集的数据供Gmetad读取,默认监听端口8649 ,监听到gmetad请求后发送xml格式的文件。可以把它理解为客户端。 web front-end 一个基于web的监控界面,通常和Gmetad安装在同一个节点上(还需确认是否可以不在一个节点上

大脑基底神经节

我们两清 提交于 2020-01-30 13:20:44
大脑基底神经节 basal ganglia存在于由大脑深层至脑干的灰质团块,由尾状核(nucleus caudatus),核壳(putamen),苍白球(globus pallidus),丘脑下核(nucleus subtha-micus)及黑质(substantia nigra)所成,也有把屏状核(claustrum)加到这里的。这些核互相连成一个大的功能系统。 caudate:有尾的,有尾状附属物的 大脑基底神经节 basal ganglia到底是用putamen的坐标,还是用caudate的坐标??? caudate 来源: https://www.cnblogs.com/pangairu/p/4432474.html

How to integrate Ganglia for Spark 2.1 Job metrics, Spark ignoring Ganglia metrics

让人想犯罪 __ 提交于 2020-01-17 08:00:12
问题 I am trying to integrate Spark 2.1 job's metrics to Ganglia. My spark-default.conf looks like *.sink.ganglia.class org.apache.spark.metrics.sink.GangliaSink *.sink.ganglia.name Name *.sink.ganglia.host $MASTERIP *.sink.ganglia.port $PORT *.sink.ganglia.mode unicast *.sink.ganglia.period 10 *.sink.ganglia.unit seconds When i submit my job i can see the warn Warning: Ignoring non-spark config property: *.sink.ganglia.host=host Warning: Ignoring non-spark config property: *.sink.ganglia.name

Ganglia - gmetad - process is getting terminated by SIGSEGV

我们两清 提交于 2019-12-25 08:14:35
问题 I have started seeing this issue in the last couple of days. Ganglia gemtad process gets terminated within 5 min of its start with SIGSEGV (segfault) This was stable since last few months..so not sure what changed. Version - gmetad 3.7.1 I don't see any core dump or anything specific to gmetad in /var/log/messages or /var/log/secure either . System snap (from top) at the time of this event load average: 1.97, 0.99, 0.42 Memory also looks fairly Ok free -m total used free shared buffers cached