系统监控

Docker 网络基础介绍

人盡茶涼 提交于 2020-04-17 02:16:49
【推荐阅读】微服务还能火多久?>>> 【编者按】本文作者为 Mesos phere 开发大使 Michael Hausenblas,主要介绍配置 Docker 单主机网络的基本知识。文章系国内 ITOM 管理平台 OneAPM 编译呈现。 想要了解有关 Docker 网络的更多信息,包括多主机网络介绍,请查看本文作者 Michael Hausenblas 撰写的报告——《Docker 网络与服务探索》, 点此下载该报告 。 当你开始扩大 Docker 的应用范围时,忽然发现,你需要了解很多关于网络的知识。作为 Docker 网络的入门介绍,本文将从小处着手,首先你要考虑如何管理容器之间的连接。Docker 容器需要有个主机才能运行,该主机既可以是实体机器(例如:企业数据中心的裸机服务器),也可以是 on-prem 或云中的虚拟机。如图一所示,主机上会运行 Docker 后台程序与 Docker 客户端。一方面,你可以与 Docker 注册表交互(pull 或 push Docker 图片);另一方面,也可以启动、停止或监视容器。 图片1. 简化版 Docker 架构(单主机) 主机与容器之间的关系为 1:N 。也就是说,一个主机上通常会运行着多个容器。例如,Facebook 报告称,取决于机器的规模,每个主机上平均运行着10到40个容器。此外,Mesosphere

系统监控

扶醉桌前 提交于 2020-03-20 18:27:16
说明 对于系统监控这块我们推荐使用OpManager进行系统监控,这块目前浦东用的就是这个,效果不错。在网上有相应的试用版下载,并且可以让他们来做相关的介绍。 简单介绍 OpManager可以对网络流量、服务器、应用程序等进行性能监控。比如用户报现在使用系统特别缓慢,就可以马上查一下网络是否正常,如果正常就是应用程序或数据库问题。对于Oracle数据库发生异常或者网络流量的异常也可通过配置,将异常通过短信的方式发送到手机,这样就可以随时的知道当前系统的状态。 OpManager网站地址: http://www.zohocorp.com.cn/manageengine/products/opmanager/features.html 来源: https://www.cnblogs.com/zyizyizyi/archive/2012/09/03/2669220.html

java性能监控常用的几个命令

假如想象 提交于 2020-01-07 17:48:18
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 找到性能问题的第一步是监控应用的行为,通过监控提供的线索,我们可以将性能问题进行归类并分析。 1、CPU使用率:大多数操作系统的CPU使用率分为用户态CPU使用率和系统态CPU使用率。用户态CPU使用率是指执行应用程序代码的时间占总CPU时间的百分比,相比而言,系统态CPU使用率是指应用执行操作系统调用的时间占总CPU时间的百分比。系统态CPU使用率高意味着共享资源有竞争或者I/O设备之间有大量的交互。理想情况下,应用达到最高性能和扩展时,它的系统态CPU使用率为0%,所以提高应用性能和扩展性的一个目标是尽可能降低系统态CPU使用率。 CPU停滞通常会浪费几百个时钟周期,因此提高计算密集型应用性能的策略是减少停滞或者改善CPU高速缓存使用率,从而减少CPU在等待内存数据时浪费的时钟周期。 Linux命令行监控CPU使用率的有vmstat或者top(或者htop,需要自行安装,但查看效果更好): vmstat 采集间隔(秒) 采集次数 当一直监控时,可以省去采集次数,即 vmstat 2,每隔2秒采集一次,一直持续。 命令介绍完毕,现在开始实战讲解每个参数的意思,后面还会使用到: r 表示运行队列的长度,值是运行队列中轻量级进程的实际数量,即当内核线程已经准备好运行只是还没有可用的处理器执行时,运行队列就会有值。

Linux常用的系统监控shell脚本

给你一囗甜甜゛ 提交于 2019-12-17 21:50:39
Linux常用的系统监控shell脚本 下面是我常用的几个 Linux 系统监控的脚本,大家可以根据自己的情况在进行修改,希望能给大家一点帮助。 1、查看主机网卡流量 #!/bin/bash #network #Mike.Xu while : ; do time=’date +%m”-“%d” “%k”:”%M’ day=’date +%m”-“%d’ rx_before=’ifconfig eth0|sed -n “8”p|awk ‘{print $2}’|cut -c7-‘ tx_before=’ifconfig eth0|sed -n “8”p|awk ‘{print $6}’|cut -c7-‘ sleep 2 rx_after=’ifconfig eth0|sed -n “8”p|awk ‘{print $2}’|cut -c7-‘ tx_after=’ifconfig eth0|sed -n “8”p|awk ‘{print $6}’|cut -c7-‘ rx_result=$[(rx_after-rx_before)/256] tx_result=$[(tx_after-tx_before)/256] echo “$time Now_In_Speed: “$rx_result”kbps Now_OUt_Speed: “$tx_result”kbps” sleep 2

企业建立成功 DevOps 模式所需应对的5个挑战

社会主义新天地 提交于 2019-12-10 01:49:31
【编者按】本文作者为 Kevin Goldberg,主要介绍要想成功部署 DevOps 模式,企业所需应对的5大挑战与问题。文章系国内 ITOM 管理平台 OneAPM 编译呈现。 要给 DevOps 下个简明、准确而又恰当的定义真不是件容易的事儿。不过,以前看到过一句话,似乎能较好地解释什么是 DevOps——“DevOps 是一种文化、运动或者实践,它强调软件开发人员和其他 IT 专业技术人员之间的沟通与协作,以共同促进软件交付流程和基础设施变更的自动化。” 现在,你明白了什么是 DevOps,什么不是 DevOps,那么你又要思考,为什么你的企业应该使用 DevOps?除了打破两个分散部门之间独立的工作模式,你还可以期待怎样的显著变化和成果?根据 Puppet 最新的《DevOps 现状报告》,他们发现“高效能的IT组织比低效能的IT组织经历的故障要少 60 倍,故障恢复速度要快 168 倍。而且,他们的部署时间要短 200 倍但部署频率却高出 30 倍。”简单地说就是,成功的 DevOps 组织能在更短的时间内实现更快的产品发布频率,而且出现的问题更少。 要实现更具有协作性的 DevOps 转变,在开始前,必须搞清楚公司可能会面临哪些潜在的挑战。 ##1. 切记不要由上而下发起 这是很多企业试图在内部实现 DevOps 时最常遇到的问题之一。在实际过程中

关于 Hyperic HQ 的 SSL 连接配置

瘦欲@ 提交于 2019-12-06 08:14:51
Hyperic 支持 server-agent 和 agent-server的双向 SSL通信。采用SSL是最佳实践。 Server-agent 通信通常采用 SSL. Agent-Server的通信可以配置为SSL。 如果产品插件支持SSL,Hyperic Agent就可在SSL上管理这些产品。 当Hyperic Server和 Hyperic Agent 基于SSL通信时,每个组件都会验证其他SSL证书的有效性。 Hyperic 证书处理 在安装完成后,当Hyperic Agent第一次向Hyperic Server发起连接时,HQ Server向 HQ Agent出示其SSL证书,如果Agent信任此证书,那么Agent将把该证书导入到自己的 Keystore。 Hyperic Agent信任某个Server证书的条件是: ■ 如果该证书已经在Agent的Keystore中存在; ■如果该证书具有与Agent证书相同的CA; 默认情况下,如果Agent不信任Server出示的证书,Agent将发出警告。用户可以中断配置过程,然后设置SSL. Hyperic Server和Hyperic Agent不会导入不信任的证书,除非用户在提示警告时回答Yes。 当然,用户也可以配置组件自动接受不信任的证书,而不提示警告。考虑到安全性,非常不建议这种做法。可查看 agent.setup

仪表盘 hostmap 新玩法让运维工作越玩越 high

做~自己de王妃 提交于 2019-12-01 06:27:25
Cloud Insight 第13次新品发布会现在开始,首先非常感谢大家前来看我们的新功能发布会,下面我先给大家介绍一下新功能,之后有什么问题大家尽管问😊。 新功能 Cloud Insight 发布 4.4.0 版本,主要增加以及修复以下功能: 增加仪表盘标记线 增加仪表盘数据表现形式 增加仪表盘 rate 指标 增加 hostmap 无限分组功能 增加端口监控,进程监控 修复 Windows 平台显示问题 仪表盘是什么? 天啊,互联网时代有人连这个都不知道,好吧,既然这样那我来解(an)释(li)一下,仪表盘就是汽车上显示转速表,里程表,机油,,,,balabala。😠不开玩笑,我们是一个严肃的产品,仪表盘其实是将你关心的所有数据用图表这种更直观的形势展现出来的一种表现形式。 再说简单点,就是你今天想统计一下敲了多少下键盘,点击了多少下鼠标,看下面这个图就明白啦! 这个仪表盘和运维有什么关系? 好问题,这个问题问的很有水平嘛!举一个最简单的场景:5 台 MySQL 数据库平常 5000 连接,如果突然间整体访问量剧增,这个时候你需要知道每台服务器数据库访问情况,整体访问情况,整体增长情况。 用仪表盘可以设2个表盘,一个是显示5台服务器各自访问连接情况,一个显示总体访问连接情况,当然要想更全面的确认访问量剧增是出现攻击还是真的有很多用户访问,还要加上其他数据库操作的监控指标。

如何监控业务的响应速度?Cloud Insight SDK 实践分享

与世无争的帅哥 提交于 2019-12-01 06:27:07
一直在说 Cloud Insight 是数据聚合平台,可以用 SDK 和 API 实现业务监控,如今不拿出点实践人们恐怕是不能信服。那今天本文就先简单介绍一下 SDK 可以应用在哪些方面,再举个真实用户场景来让大家看看。 首先说一点,通过 SDK 你可以把你想看的任何数据都接在 Cloud Insight 平台上,例如运营可以把涉及到的用户数据放上去,让开发,运维,boss 随时都可以看到自己产品的用户,如果涉及到多个层次的指标数据(日活,增长,转化,留存。。。)都有相应的简单操作;开发可以把自己 build 代码的次数,提交的次数放上去;销售也可以把用户签单数,签单额放上去(如果允许的话啊);运维就更不用说了,所有服务器监控指标都可以放上来。 下面介绍一个业务场景的监控,本实例来自真实用户场景。 用户需求 监控可用性和响应速度,运营的需求要求每次接口响应控制在0.1-0.5s内。如果超出这个时间就要找到问题,进行优化。 以前的做法 在后端添加 serverId 和处理时间并放到 http header 中,通过 curl 去获得后端信息和处理时间,采样后生成报表。 后来改成通过 nginx 记录 upstream 的 response time,采样生成可视化数据。但由于 nginx 日志分布于不同的机器中,收集数据相对来讲还是比较麻烦的。 现在的监控手段 配置 通过 Cloud

极客范:如何使用 Cloud Insight 来监控闭路电视?

自闭症网瘾萝莉.ら 提交于 2019-11-30 01:23:19
最近新上线支持 Windows 系统及其组件 监控功能的 Cloud Insight,在系统监控领域基本囊括了对所有主流和部分非主流平台的支持。但是这还不够, Cloud Insight 可不仅仅是一个服务运维的监控工具,还是一个 Geek 范儿的数据管理可视化平台。 这不,有人用 Cloud Insight 实现了对闭路电视系统磁盘数据的可视化,下面我们来看看他是怎么做的。 GitHub 地址 以 HIKVision 产品为例,登录管理界面,查看 磁盘信息。 1.配置闭路电视系统 打开闭路电视系统的 SNMP 功能 2.下载监控脚本 目前只实现了 Node.JS 的监控脚本,欢迎其他各种语言的 PR。 git clone git@github.com:wyvernnot/monitor-harddisk.gitcd monitor-harddisk npm install 3.修改配置文件 配置文件是 config.js,主要配置 ip 和 community,和闭路电视系统的配置一致即可。 node index.js 4.登录 CloudInsight 配置仪表盘 新建仪表盘 为下面的指标创建对应的仪表盘 hikvision.system.timetics hikvision.disk.free hikvision.disk.total 查看数据 这样