Prometheus | 易学教程

K8s Deployment ymal文件详解

阅读更多关于 K8s Deployment ymal文件详解

Deployment部署文件详解 apiVersion: extensions/ v1beta1 #接口版本 kind: Deployment #接口类型 metadata: name: cango - demo #Deployment名称 namespace: cango - prd #命名空间 labels: app: cango - demo #标签 spec: replicas: 3 strategy: rollingUpdate: ##由于replicas为3,则整个升级,pod个数在2 - 4个之间 maxSurge: 1 #滚动升级时会先启动1个pod maxUnavailable: 1 #滚动升级时允许的最大Unavailable的pod个数 template: metadata: labels: app: cango - demo #模板名称必填 sepc: #定义容器模板，该模板可以包含多个容器 containers: - name: cango- demo #镜像名称 image: swr.cn -east- 2 .myhuaweicloud.com/cango-prd/cango-demo: 0.0 . 1 - SNAPSHOT #镜像地址 command: [ " /bin/sh " , " -c " , " cat /etc/config/path/to

Serverless 如何落地？揭秘阿里核心业务大规模落地实现

阅读更多关于 Serverless 如何落地？揭秘阿里核心业务大规模落地实现

简介： 2020 年，新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天，几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。来源| 阿里巴巴云原生公众号 2020 年，新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天，几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。 Serverless 将开发者从繁重的手动资源管理和性能优化中解放出来，正在引发云计算生产力的新变革。然而，Serverless 的落地问题却往往很棘手，例如传统项目如何迁移到 Serverless，同时保障迁移过程业务连续性，在 Serverless 架构下如何提供完善的开发工具、有效的调试诊断工具，如何利用 Serverless 做更好的节约成本等，每一个都是难题。尤其涉及到在主流场景大规模的落地 Serverless ，更是并非易事。正因为这样，业界对于 Serverless 核心场景规模化落地最佳实践的呼唤更加迫切。总交易额 4982 亿元，订单创建峰值 58.3 万笔/秒，2020 年天猫双11 又一次创造记录。对于阿里云来说，今年的双11 还有另一个意义：阿里云实现了国内首例 Serverless 在核心业务场景下的大规模落地

小米路由器3-R3 刷固件

阅读更多关于小米路由器3-R3 刷固件

1.刷机前的路由器升级准备 1-1、首先进入路由器原声后台：miwifi.com 1-2、在右上角，点击系统升级、在系统版本下边选择手动升级，选择资源包里的：“miwifi_r3_all_55ac7_2.11.20.bin” 文件（如下图所示） 1-3、升级完成后，设置路由器后台密码，这里随意即可。 2.开始刷机 2-1、将资源包里的：“PROMETHEUS-64.7z” 解压到某一个目录，使用VMware打开这个文件夹里的运行文件。（注：VMware下载地址 http://www.tayi.me/1184.html ） 2-2、打开以后你会看到如下界面，在键盘输入：“0” （如下图） 2-3、在进入的页面按照是输入你的小米路由器后台管理密码（获得 ssh 权限）一路回车，在需要确认的时候按“y” 如下图： 2-4、完成后会返回“2-2”界面，这时候再输入数字“4”，在新打开的页面中再次输入“4”，如下图： 2-5、提示是否需要备份，输入“n”，就开始刷机了，等待完成后，提示是否reboot（重启）输入“y” 3.汉化操作 3-1、重启完成后，在浏览器输入：192.168.1.1 默认账号和密码均为：admin 3-2、在如下图界面，分别点击，选择资源包里的文件：“MI-3_3.4.3.9-0991.trx” 升级即可。 3-3、大功告成，实测：带机12台，内存占用100MB

PromQL query to find the duration of each firing alert

阅读更多关于 PromQL query to find the duration of each firing alert

问题 I am creating a Grafana dashboard to see the total alert count for each firing alert and the duration ( means it should capture how long alerts have been firing state). PromQL query used to capture the total alert count is as follows, count by (alertname,customerName) (changes(customer_ALERTS[24h])) Idea is to add two more column in the Grafana table panel having the alert count and the duration Now i need to get the query to capture the duration for each alerts. Can somebody please share

PromQL query to find the duration of each firing alert

阅读更多关于 PromQL query to find the duration of each firing alert

Serverless如何落地？揭秘阿里核心业务大规模落地实现

阅读更多关于 Serverless如何落地？揭秘阿里核心业务大规模落地实现

2020 年，新冠肺炎疫情催化数字化生活方式渐成常态。在企业积极进行数字化转型、全面提升效率的今天，几乎无人否认背负“降本增效”使命诞生的 Serverless 即将成为云时代新的计算范式。 Serverless 将开发者从繁重的手动资源管理和性能优化中解放出来，正在引发云计算生产力的新变革。然而，Serverless 的落地问题却往往很棘手，例如传统项目如何迁移到 Serverless，同时保障迁移过程业务连续性，在 Serverless 架构下如何提供完善的开发工具、有效的调试诊断工具，如何利用 Serverless 做更好的节约成本等，每一个都是难题。尤其涉及到在主流场景大规模的落地 Serverless ，更是并非易事。正因为这样，业界对于 Serverless 核心场景规模化落地最佳实践的呼唤更加迫切。总交易额 4982 亿元，订单创建峰值 58.3 万笔/秒，2020 年天猫双11 又一次创造记录。对于阿里云来说，今年的双11 还有另一个意义：阿里云实现了国内首例 Serverless 在核心业务场景下的大规模落地，扛住了全球最大规模的流量洪峰，创造了 Serverless 落地应用的里程碑。 Serverless 落地之痛挑战一：冷启动耗时长快弹是 Serverless 天然自带的属性，但是快弹的条件是要有极致的冷启动速度去支撑。在非核心的业务上

How to snooze prometheus alert for specific time

阅读更多关于 How to snooze prometheus alert for specific time

问题 I have faced some issues with Prometheus memory alert. If I take the backup of Gitlab then memory usage going up to 95%. I want to snooze memory alert for a specific time. e.g. If I am taking a backup at 2 AM then I need to snooze Prometheus memory alert. Is it possible? 回答1: As Marcelo said, there is no way to schedule a silence but if the backup is made at regular interval (say every night from 2am to 3am), you can include that in the alert expression. - alert: OutOfMemory expr: node_memory

CNCF宣布TiKV毕业

阅读更多关于 CNCF宣布TiKV毕业

云原生键值数据库项目在全球拥有近1000家生产用户旧金山，加利福尼亚州-2020年9月2日- CNCF®（Cloud Native Computing Foundation®，云原生计算基金会）为云原生软件构建可持续的生态系统，今天宣布TiKV是第12个毕业的项目。从孵化阶段到毕业阶段，TiKV被越来越多的人采用，拥有一个开放的治理过程，特性成熟，以及对社区、可持续性和包容性的坚定承诺。 TiKV是一个以Rust编写的开源分布式事务键值数据库。它提供具有ACID保证的事务性键值API。项目为需要数据持久性、水平可伸缩性、分布式事务、高可用性和强一致性的应用程序提供了统一的分布式存储层，使其成为下一代云原生基础设施的理想数据库。 “TiKV是我们第一个基于Rust的项目，它是一个真正灵活和可扩展的云原生键值存储。”CNCF CTO/COO Chris Aniszczyk说：“自项目加入CNCF以来，我们对项目的成长及培育全球开源社区的愿望印象深刻。” 自2018年8月加入CNCF以来，在生产中采用TiKV的公司增加了一倍，达到了1000家，横跨多个行业，核心仓库的贡献者从78位增加到226位。维护团队目前有7人，所代表的企业分布健康，包括PingCAP、知乎、京东云、一点资讯等。 PingCAP 首席工程师、TiKV 项目负责人唐刘表示：“开源已经成为全球基础软件发展的重要方向

Prometheus queries to get CPU and Memory usage in kubernetes pods

阅读更多关于 Prometheus queries to get CPU and Memory usage in kubernetes pods

问题 I need to get CPU and Memory usage in kubernetes pods with prometheus queries. Can someone plz help? 回答1: Do you use prometheus-operator to collect data from kubernetes? If yes, you can use something like this: sum(container_memory_usage_bytes) sum(container_cpu_usage_seconds_total) Just for example. 回答2: For CPU percentage avg((sum (rate (container_cpu_usage_seconds_total {container_name!="" ,pod="<Pod name>" } [5m])) by (namespace , pod, container ) / on (container , pod , namespace) ((kube

Prometheus queries to get CPU and Memory usage in kubernetes pods

阅读更多关于 Prometheus queries to get CPU and Memory usage in kubernetes pods

订阅 Prometheus