Prometheus

How to persist data in Prometheus running in a Docker container?

眉间皱痕 提交于 2020-12-01 08:23:11
问题 I'm developing something that needs Prometheus to persist its data between restarts. Having followed the instructions $ docker volume create a-new-volume $ docker run \ --publish 9090:9090 \ --volume a-new-volume:/prometheus-data \ --volume "$(pwd)"/prometheus.yml:/etc/prometheus/prometheus.yml \ prom/prometheus I have a valid prometheus.yml in the right directory on the host machine and it's being read by Prometheus from within the container. I'm just scraping a couple of HTTP endpoints for

How to persist data in Prometheus running in a Docker container?

倾然丶 夕夏残阳落幕 提交于 2020-12-01 08:21:33
问题 I'm developing something that needs Prometheus to persist its data between restarts. Having followed the instructions $ docker volume create a-new-volume $ docker run \ --publish 9090:9090 \ --volume a-new-volume:/prometheus-data \ --volume "$(pwd)"/prometheus.yml:/etc/prometheus/prometheus.yml \ prom/prometheus I have a valid prometheus.yml in the right directory on the host machine and it's being read by Prometheus from within the container. I'm just scraping a couple of HTTP endpoints for

Istio 1.1部署实践

眉间皱痕 提交于 2020-11-29 11:25:21
前提条件 正确安装配置Kubernetes集群 CentOS Linux release 7.5.1804 安装 下载istio 1.1版本 [root@vm157 ~]# wget https://github.com/istio/istio/releases/download/1.1.1/istio-1.1.1-linux.tar.gz …… 2019-03-26 09:39:06 (483 KB/s) - ‘istio-1.1.1-linux.tar.gz’ saved [15736205/15736205] Istio安装有多种方式,本文根据helm template生成istio部署的配置文件,其他部署方式请参考官方文档。 [root@vm157 ~]# cd istio-1.1.1/ [root@ruffy istio-1.1.1]# helm template ../install/kubernetes/helm/istio-init --name istio-init --namespace istio-system > istio-init.yaml [root@ruffy istio-1.1.1]# kubectl get crds | grep 'istio.io\|certmanager.k8s.io' | wc -l [root@ruffy istio-1

使用Prometheus+grafana打造高逼格监控平台(赠书)

拈花ヽ惹草 提交于 2020-11-27 09:58:38
点击上方 “ 民工哥技术之路 ” 选择“星标” 每天 10点 为你 分享 不一样的干货 读者福利!多达 2048G 各种资源免费赠送 作者:又耳笔记 原文:https://blog.51cto.com/youerning/2050543 前言: 笔者看来, 监控不应该只是监控,除了及时有效的报警,更应该”好看”,因为视觉上的感受更能给我们直观的感受,更能从绚丽的走势中发现异常, 如果你觉得监控就应该像老牌监控nagios,cacti一样,我想也没什么不对的,因为也许那是你们最适合的,但,你还是可以瞧瞧这个监控能给你带来什么。 效果图 为了你能有更多的动力看下去,这里放一部分通过Prometheus + grafana打造出来的监控平台,效果图如下。 如果你觉得不错可以继续看下去,上面主要是kvm宿主机, ceph集群, 物理机监控,以及ping, 最后一张的监控图没有展开是为了让你可以瞥一眼所能监控的指标条目。 Prometheus架构图 参考:https://prometheus.io/docs/introduction/overview/ 如果你对Prometheus没有接触过,也许会看不懂上面说什么,但是没关系,如果你看完之后,在回过头来瞧瞧,也许就了解这个架构了,也会对Prometheus有一个更深的认识。 这里简单说一下Prometheus的各个部分。

2020 年上半年互联网公司"死亡"名单!

﹥>﹥吖頭↗ 提交于 2020-11-26 13:46:06
2020 年上半年互联网公司"死亡"名单! 收录于话题 #乘风破浪的职场,人心险恶的江湖! 17个 点击上方“民工哥技术之路”,选择“设为星标” 回复“1024”获取独家整理的学习资料! 2019年年底的疫情,一直持续到2020年,全国的企业受其影响不小,特别是餐饮与旅游业,冲击更是巨大的。 民工哥,也在老家呆到了3月10号,才回霸都正式复工上班,其它时间都是在家远程办公,因环境、地点的限制多多少少都会影响工作效率。 老家邻居一见到我都调侃道:这个假放的够长的吧,着急了吧!!!!你说能不急吗?上有老下有小,中间还有房贷,三座大山压着,对于一个普通人来说,都是很大的压力,那么对于一个企业(无论大小)压力更是巨大的。 如果说2019年是互联网行业的"寒冬",那么2020年对互联网行业来说,算不算是"至暗时刻"呢????或许只有身处互联网行业的人才能懂得。 从IT桔子官方数据显示来看,截止2020年9月3日,今年总关闭/停业/倒闭的企业963家。从列表数据中可以看出,有的企业刚刚创立几个月的时间就走向了关闭、停业,也有长达几年时间的老牌企业。 在这份列表数据中,有很多名气比较大,或者我们都比较熟悉的企业,比如:OFO小黄车、巢客公寓、友客公寓、万达网络、百程旅行、美团云、兄弟连教育、钱牛牛、人人聚财网、美利金融、美利车金融、铜掌柜、爱贝信息、鼎有财、淘集集等。 更完整的数据

Prometheus监控实战(二)

人走茶凉 提交于 2020-11-26 11:26:55
Prometheus监控实战(二) 标签(空格分隔): Prometheus系列 [toc] 一、Prometheus的度量类型(metric types) 在学习Prometheus的常用函数前,我们得先知道Prometheus的几度量类型,然后才能使用 相应的函数来进行计算。不知道大家有没有注意到,Prometheus从exporter抓取的每一个指 标均是有注释度量类型的,例如,我们来查看node_exporter的度量指标,curl http://xxx.xxx.xxx.xxx:9100/metrics。 1.1 Counter(计数器类型) Counter类型的指标代表的是一种计数器,是随时间只增不减永远不会减少(除非系统或者服 务发生了重置)的。Counter一般用于累计值,例如记录请求次数,任务完成数、错误发生次 数;还可以计算其在一段时间范围内的增量和变化速率,如果是counter类型的数据,首先应 该想到是否要使用rate()或者increase()函数来计算其变化速率。 不是Counter类型的度量却当做Counter类型来计算,会得到一个错误的结果。例如,使用计 数器来计算当前正在运行的进程的数量;应该使用Gauge。 1.2 Gauge(仪表测量类型) Gauge类型的指标值是可增可减的,可以用于反应当前应用的状态。比如在监控主机时,主机 当前的内存大小

为什么美国程序员不用加班,而中国程序员就只能996?

与世无争的帅哥 提交于 2020-11-26 03:10:26
梅宁航 发自 凹非寺 量子位 报道 | 公众号 QbitAI 按惯例,先问是不是,再问为什么。 从知乎回答浏览量看,是的。 那么为什么美国程序员就可以到点下班回家,而中国程序员就要每天“主动”、“无偿”加班呢? 仔细看了群众们热情的回答之后,大概可以分为几派: 1、产品经理不够通情达理,导致效率低下 2、表演性加班,太早回家会被认为不努力工作 3、不尊重技术人才,35岁警告⚠️ 4、中国处于后发追赶,不加班是追不上的 一起来看看具体的吐槽内容: 开发和PM的斗争 瑟瑟发抖只敢吐槽,毕竟现实碰一碰风险太大了。 产品经理的回击: 都怪你太闲了👆.jpg 怒火还会从PM烧到煞笔客户上,不是客户压榨,催催催,PM怎么舍得压榨程序员! 也有人认为,现在是痛苦的必经阶段,熬过去了,一切都会好的👌。 静待头发掉光之前遇见合格的老板,合格的PM,合格的客户。 加班文化已然形成? 也有大佬指出,多年996,国内公司已经形成加班的“文化”,谁早下班谁就是不努力。 △ 引用链接见文末 你投错胎了,建议下次重投一遍。 大家都觉得理所当然,也就没人在乎劳动法是咋写的了,加,使劲加。 △ 引用链接见文末 轮子哥指出,这都是因为人太多了。 内卷的必然结果,建议出去当蓝领,修修路,修修水管什么的。 管理层不行 老板们就是这么出来的,“兄弟”们也得跟上节奏,跟不上那就是你人不行。 △ 引用链接见文末

CERN如何用OpenStack、Kubernetes、Helm、Prometheus和CoreDNS加速

梦想的初衷 提交于 2020-11-25 14:40:50
CERN(欧洲核子研究所)是欧洲核研究组织,以其粒子加速器和对亚原子粒子、反物质和其他粒子物理相关研究的性质进行实验和分析而闻名。CERN也是万维网(WWW)被创建的地方。 CERN的研究员Ricardo Rocha说,总的来说,CERN现在管理着超过500个PB,并且10年后,随着一个新的加速器的上线,这个数字预计将达到5000个PB。Rocha还介绍了CERN如何在未来几年内适应管理10倍于现在的数据。 Kubernetes在CERN的基础设施中扮演着重要的角色。对于集群的管理,CERN利用了OpenStack提供的私有云内部部署服务。Rocha说,通过在OpenStack上部署Kubernetes集群,CERN拥有“与公共云提供的非常相似的体验”。这包括将其Kubernetes集群与用于自动缩放的云提供商及其存储系统集成。OpenStack还帮助CERN管理其遗留系统。 Rocha说:“我们为用户提供的是Kubernetes-as-a-service的体验。” 虽然允许用户按照自己的意愿使用工具和脚本迁移到Kubernetes可能很诱人,但是Helm可以为过程添加规则和更严格的控制。Rocha解释说,CERN为用户提供内部培训,帮助他们将工作负载迁移到Helm。 “当我们第一次向人们介绍Kubernetes的时候,仅仅是让事情运转起来就很有诱惑力

史上最长最全!围绕故障管理谈SRE体系建设

自古美人都是妖i 提交于 2020-11-25 10:49:34
本文根据石鹏老师在〖deeplus直播第227期〗线上分享演讲内容整理而成。 (文末有获取本期PPT&回放的方式,不要错过) 我们都知道SRE是一个体系化的工程,SRE体系的建设涉及的内容繁多,比如日常需求处理、容量规划、资源部署、监控告警、预案梳理、灾备演练、OnCall值班、应急事件响应、故障处理、运维自动化建设等等;其中「故障」可以算作是这众多事项的一个交汇点。 故障处理是一个特别符合“台上一分钟,台下十年功”这句俗语的场景,一次故障就是一次考试。SRE团队的响应速度、对服务的掌控能力、监控告警的覆盖是否完整、配置是否合理,灾备预案的体系是否完善、是否做了充分的灾备演练、应急预案是否有效....这些都是用于考核SRE体系建设水平的一些指标,都会在「故障处理」的过程中得到淋漓尽致的体现。不管你是研发、测试、运维,或其他“工种”,只要你身处IT行业,「故障」怕都是大家避之唯恐不及却无法绕开的一个梦魇和话题。 我将围绕「故障管理」这个点跟大家聊一聊SRE的工作范畴,跟大家共同探讨SRE体系的建设。希望可以通过分享让大家对故障管理有一个宏观的框架,可以更从容淡定、有章可循地做服务稳定性建设。 本次分享将按照如下的顺序展开: 先聊一聊SRE的工作职责,聊一下我所理解的SRE的核心目标; 初步看一下稳定性建设的工作范畴,看一看从宏观上如何划分我们的工作内容; 然后我们由此进入今天的主题

nacos的mysql独立部署

生来就可爱ヽ(ⅴ<●) 提交于 2020-11-23 22:44:51
1. 相关资料 官网部署资料 2. 独立mysql部署 mysql版本 5.7+ 2.1 初始化数据库 独立安装mysql, 创建数据库nacos, 执行脚本 nacos-db.sql 2.2 docker部署 nacos-server docker run -d \ -v /standalone-logs/:/home/nacos/logs -v ./custom.properties:/home/nacos/init.d/custom.properties -e PREFER_HOST_MODE=ip \ -e MODE=standalone \ -e SPRING_DATASOURCE_PLATFORM=mysql \ -e MYSQL_MASTER_SERVICE_HOST=10.5.96.32 \ -e MYSQL_MASTER_SERVICE_PORT=3306 \ -e MYSQL_MASTER_SERVICE_USER=root \ -e MYSQL_MASTER_SERVICE_PASSWORD=123456 \ -e MYSQL_MASTER_SERVICE_DB_NAME=nacos \ -e MYSQL_SLAVE_SERVICE_HOST=从数据库ip \ -p 7110:8848 \ -p 7111:9555 \ --name nacos1 \