腾讯云CES自动化运维架构及最佳实践

大兔子大兔子 提交于 2020-12-10 10:52:07

主题:腾讯云CES自动化运维架构及最佳实践

大纲:

1. 如何看待“运维”在公司的定位和未来的发展方向
2. 做好自动化运维架构需要关注哪些方面
3. 运维岗位必备技能
4. 提效处理故障方面的建议
5. 腾讯云CES方面的运维架构有哪些独到之处




听说3306π要搞事情了

是啊,马上要搞3306π深圳站了

啊,是吗?哪天啊,在哪里办,怎么报名?

12月19日,就在深圳南山区海岸城,点文末的原文链接或者扫描二维码就可以报名了,一起来吹吹牛逼。

嘉宾自我介绍

李明  高级运维工程师 曾先后在携程、华为云等公司从事多年MySQL DBA的工作,目前在腾讯负责腾讯云Elasticsearch,CTSDB产品的运维工作。对于ES、CTSDB在日志分析、大数据搜索、时序分析等场景的使用有丰富的实践经验。

01

李老师,很多人都在谈脱离传统运维模式,更好的帮助业务前行。您是如何看待“运维”在公司的定位和未来的发展方向呢?

运维作为一个比较传统的岗位,在当前大量中小企业都拥抱上云或自动化程度越来越高的背景下,其工作的定位的却是受到了一些影响,以前需要专业运维来部署的一些环境,现在并不是那么需要了,但这并不意味着运维岗位的生存将受到很大的影响。

只是对运维人员提出了更高的要求,一方面需要运维人员对所服务的产品本身的特性,要相对开发人员有更深的认识,从而指导其更开发出更专业的产品;另一方面要快速需要新兴技术,例如熟练掌握云产品的运维手段。

02

请问李老师,做好自动化运维架构,我们都需要关注哪些方面呢?

一个好的自动化运维架构,应该是在完成自动化工作的同时,要具备低耦合性,低失败率,高效率等特点。局部功能的失效,不能波及面过大;每个环节的成功率要保持在一个很高的水平,减少人工干预的耗时;面向用户时,要整体且简易,能让运维同学快速上手,且快速安全的完成任务。

03

李老师,您看待运维岗位,哪些技能是必备的呢?                  

需要熟练具备所运维的数据库产品的理论知识、操作系统及数据库运维技能以及一定的开发能力。

04

很多企业为了提升故障处理效率,更关注发现故障后的触发流程部分,李老师在提效处理故障方面有什么建议吗?

故障发生后的复盘分析,并找到触发问题的根因加以规避是必须的,但我认为低的故障率,应该在产品设计的前期,就应该尽量规避,否则到了后期,往往修复的代价很大,且不彻底。

05

请问李老师,腾讯云CES方面的运维架构有哪些独到之处呢?    

1)整个架构在设计之初,就尽量考虑了,后期多机型,多地域的适配问题,所以很多环节都是配置化,减少后期多样化的需求带来的工作量。

2)每个组件低耦合,避免单个组件的升级影响较大。

3)整个架构所使用的技术,都是当前的主流技术,且架构简单,适合新人快速学习上手。

扫码报名

点击文末“阅读原文”链接亦可报名

参与活动

学习新技能

赢取罗小波新书《MySQL复制技术和生产实践》和爱可生精美杯子

活动规则

《年轻人不讲武德?12月19日来3306π深圳站学点真本事》下方留言

写下您对本次活动的建议

或是想向嘉宾提出的问题

有效留言被选中后,点赞数超过30

按点赞数排名取前10名

赠送礼品

二者任选其一

关于「3306π」社区


围绕 MySQL 核心技术,将互联网行业中最重要的数据化解决方案带到传统行业中;囊括其他开源技术RadonDB、ClickHouse、Redis、MongoDB、Hbase、Hadoop、ElasticSearch、Storm、Spark等;分享干货知识,即便是赞助商,也要求如此,拒绝放水

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!