Prometheus

K8s Deployment ymal文件详解

淺唱寂寞╮ 提交于 2020-12-18 07:47:08
Deployment部署文件详解 apiVersion: extensions/ v1beta1 #接口版本 kind: Deployment #接口类型 metadata: name: cango - demo #Deployment名称 namespace: cango - prd #命名空间 labels: app: cango - demo #标签 spec: replicas: 3 strategy: rollingUpdate: ##由于replicas为3,则整个升级,pod个数在2 - 4个之间 maxSurge: 1 #滚动升级时会先启动1个pod maxUnavailable: 1 #滚动升级时允许的最大Unavailable的pod个数 template: metadata: labels: app: cango - demo #模板名称必填 sepc: #定义容器模板,该模板可以包含多个容器 containers: - name: cango- demo #镜像名称 image: swr.cn -east- 2 .myhuaweicloud.com/cango-prd/cango-demo: 0.0 . 1 - SNAPSHOT #镜像地址 command: [ " /bin/sh " , " -c " , " cat /etc/config/path/to

Serverless 如何落地?揭秘阿里核心业务大规模落地实现

走远了吗. 提交于 2020-12-15 12:00:37
简介: 2020 年,新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天,几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。 来源| 阿里巴巴云原生公众号 2020 年,新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天,几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。 Serverless 将开发者从繁重的手动资源管理和性能优化中解放出来,正在引发云计算生产力的新变革。 然而,Serverless 的落地问题却往往很棘手,例如传统项目如何迁移到 Serverless,同时保障迁移过程业务连续性,在 Serverless 架构下如何提供完善的开发工具、有效的调试诊断工具,如何利用 Serverless 做更好的节约成本等,每一个都是难题。 尤其涉及到在主流场景大规模的落地 Serverless ,更是并非易事。正因为这样,业界对于 Serverless 核心场景规模化落地最佳实践的呼唤更加迫切。 总交易额 4982 亿元,订单创建峰值 58.3 万笔/秒,2020 年天猫 双11 又一次创造记录。对于阿里云来说,今年的 双11 还有另一个意义: 阿里云实现了国内首例 Serverless 在核心业务场景下的大规模落地

小米路由器3-R3 刷固件

只谈情不闲聊 提交于 2020-12-15 09:49:44
1.刷机前的路由器升级准备 1-1、首先进入路由器原声后台:miwifi.com 1-2、在右上角,点击系统升级、在系统版本下边选择手动升级,选择资源包里的:“miwifi_r3_all_55ac7_2.11.20.bin” 文件(如下图所示) 1-3、升级完成后,设置路由器后台密码,这里随意即可。 2.开始刷机 2-1、将资源包里的:“PROMETHEUS-64.7z” 解压到某一个目录,使用VMware打开这个文件夹里的运行文件。(注:VMware下载地址 http://www.tayi.me/1184.html ) 2-2、打开以后你会看到如下界面,在键盘输入:“0” (如下图) 2-3、在进入的页面按照是输入你的小米路由器后台管理密码(获得 ssh 权限)一路回车,在需要确认的时候按“y” 如下图: 2-4、完成后会返回“2-2”界面,这时候再输入数字“4”,在新打开的页面中再次输入“4”,如下图: 2-5、提示是否需要备份,输入“n”,就开始刷机了,等待完成后,提示是否reboot(重启)输入“y” 3.汉化操作 3-1、重启完成后,在浏览器输入:192.168.1.1 默认账号和密码均为:admin 3-2、在如下图界面,分别点击,选择资源包里的文件:“MI-3_3.4.3.9-0991.trx” 升级即可。 3-3、大功告成,实测:带机12台,内存占用100MB

PromQL query to find the duration of each firing alert

给你一囗甜甜゛ 提交于 2020-12-15 06:09:34
问题 I am creating a Grafana dashboard to see the total alert count for each firing alert and the duration ( means it should capture how long alerts have been firing state). PromQL query used to capture the total alert count is as follows, count by (alertname,customerName) (changes(customer_ALERTS[24h])) Idea is to add two more column in the Grafana table panel having the alert count and the duration Now i need to get the query to capture the duration for each alerts. Can somebody please share

PromQL query to find the duration of each firing alert

佐手、 提交于 2020-12-15 06:09:27
问题 I am creating a Grafana dashboard to see the total alert count for each firing alert and the duration ( means it should capture how long alerts have been firing state). PromQL query used to capture the total alert count is as follows, count by (alertname,customerName) (changes(customer_ALERTS[24h])) Idea is to add two more column in the Grafana table panel having the alert count and the duration Now i need to get the query to capture the duration for each alerts. Can somebody please share

Serverless如何落地?揭秘阿里核心业务大规模落地实现

烈酒焚心 提交于 2020-12-14 12:28:21
2020 年,新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天,几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。 Serverless 将开发者从繁重的手动资源管理和性能优化中解放出来,正在引发云计算生产力的新变革。 然而,Serverless 的落地问题却往往很棘手,例如传统项目如何迁移到 Serverless,同时保障迁移过程业务连续性,在 Serverless 架构下如何提供完善的开发工具、有效的调试诊断工具,如何利用 Serverless 做更好的节约成本等,每一个都是难题。 尤其涉及到在主流场景大规模的落地 Serverless ,更是并非易事。正因为这样,业界对于 Serverless 核心场景规模化落地最佳实践的呼唤更加迫切。 总交易额 4982 亿元,订单创建峰值 58.3 万笔/秒,2020 年天猫 双11 又一次创造记录。对于阿里云来说,今年的 双11 还有另一个意义: 阿里云实现了国内首例 Serverless 在核心业务场景下的大规模落地,扛住了全球最大规模的流量洪峰,创造了 Serverless 落地应用的里程碑 。 Serverless 落地之痛 挑战一:冷启动耗时长 快弹是 Serverless 天然自带的属性,但是快弹的条件是要有极致的冷启动速度去支撑。在非核心的业务上

How to snooze prometheus alert for specific time

北战南征 提交于 2020-12-12 11:43:46
问题 I have faced some issues with Prometheus memory alert. If I take the backup of Gitlab then memory usage going up to 95%. I want to snooze memory alert for a specific time. e.g. If I am taking a backup at 2 AM then I need to snooze Prometheus memory alert. Is it possible? 回答1: As Marcelo said, there is no way to schedule a silence but if the backup is made at regular interval (say every night from 2am to 3am), you can include that in the alert expression. - alert: OutOfMemory expr: node_memory

CNCF宣布TiKV毕业

爷,独闯天下 提交于 2020-12-12 07:15:26
云原生键值数据库项目在全球拥有近1000家生产用户 旧金山,加利福尼亚州-2020年9月2日- CNCF®(Cloud Native Computing Foundation®,云原生计算基金会)为云原生软件构建可持续的生态系统,今天宣布TiKV是第12个毕业的项目。从孵化阶段到毕业阶段,TiKV被越来越多的人采用,拥有一个开放的治理过程,特性成熟,以及对社区、可持续性和包容性的坚定承诺。 TiKV是一个以Rust编写的开源分布式事务键值数据库。它提供具有ACID保证的事务性键值API。项目为需要数据持久性、水平可伸缩性、分布式事务、高可用性和强一致性的应用程序提供了统一的分布式存储层,使其成为下一代云原生基础设施的理想数据库。 “TiKV是我们第一个基于Rust的项目,它是一个真正灵活和可扩展的云原生键值存储。”CNCF CTO/COO Chris Aniszczyk说:“自项目加入CNCF以来,我们对项目的成长及培育全球开源社区的愿望印象深刻。” 自2018年8月加入CNCF以来,在生产中采用TiKV的公司增加了一倍,达到了1000家,横跨多个行业,核心仓库的贡献者从78位增加到226位。维护团队目前有7人,所代表的企业分布健康,包括PingCAP、知乎、京东云、一点资讯等。 PingCAP 首席工程师、TiKV 项目负责人唐刘表示:“开源已经成为全球基础软件发展的重要方向

Prometheus queries to get CPU and Memory usage in kubernetes pods

♀尐吖头ヾ 提交于 2020-12-12 04:03:05
问题 I need to get CPU and Memory usage in kubernetes pods with prometheus queries. Can someone plz help? 回答1: Do you use prometheus-operator to collect data from kubernetes? If yes, you can use something like this: sum(container_memory_usage_bytes) sum(container_cpu_usage_seconds_total) Just for example. 回答2: For CPU percentage avg((sum (rate (container_cpu_usage_seconds_total {container_name!="" ,pod="<Pod name>" } [5m])) by (namespace , pod, container ) / on (container , pod , namespace) ((kube

Prometheus queries to get CPU and Memory usage in kubernetes pods

坚强是说给别人听的谎言 提交于 2020-12-12 04:02:46
问题 I need to get CPU and Memory usage in kubernetes pods with prometheus queries. Can someone plz help? 回答1: Do you use prometheus-operator to collect data from kubernetes? If yes, you can use something like this: sum(container_memory_usage_bytes) sum(container_cpu_usage_seconds_total) Just for example. 回答2: For CPU percentage avg((sum (rate (container_cpu_usage_seconds_total {container_name!="" ,pod="<Pod name>" } [5m])) by (namespace , pod, container ) / on (container , pod , namespace) ((kube