运维工程师

OneAPM 云监控部署与试用体验

久未见 提交于 2019-12-04 23:17:54
作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市场的火爆,我决定「放下身段」试用一次,并且会总结出它与开源监控之间差别在哪里。 ##运维经历的磨难 虽然都在不同的公司,做着不同的业务,但是大多运维总会经历相同的故事,以及背着类似的黑锅。运维们大多有如下经历: 网站或者业务访问不了,服务器问题,运维的责任 昨天还好好的,今天就出现的问题,运维的责任 部分地区用户反馈网站/App 无法试用,运维查查服务器。而且这种问题大多出现在事后。 各种程序都需要监控,常见的 MongoDB 、 Redis 、 Nginx ,还会出现各种不常见的应用。任何一种软件都要熟悉,运维总是在不停的学习,待遇缺一直比不上研发! 服务器出现问题,老板找运维、领导找运维、开发也找运维,运维并不知道代码逻辑,看日志,各种排错。 初识 OneAPM OneAPM 是一家为企业和开发者提供 APM 解决方案的服务商,支持 Java、.NET、PHP、Ruby、Python、Node.js、HTML5、iOS、Android 等语言和操作系统。 ##什么是 APM ? 既然试用 APM ,我觉得很有必要给大家解释一下这个名词。应用性能管理(Application Performance

腾讯运维10年,我斩获了这5把“杀手锏”

时光毁灭记忆、已成空白 提交于 2019-12-04 13:45:26
赵建春,腾讯社交网络运营部助理总经理、技术运营通道会长、专家工程师。04年加入腾讯,先后从事过研发、运维、数据方面的建设和管理工作,在海量技术运营方面积累了丰富的实战经验。 加入腾讯已十年的运维老兵,回顾这十年: 2004年:加入腾讯,做贺卡开发; 2005年:加入QQ空间开发团队,负责留言版模块; 2006年~至今:公司组织架构调整,接触运维工作。 期间,他带领运维团队负责QQ延伸出来的各种社群的运维和维护,包括QQ空间、QQ音乐、QQ会员、QQ秀等一系列的QQ产品。团队89个人,维护了10万家服务器。经历的大事件有: 红米在QQ空间首发时,90 秒卖出 10 万台设备,获得1亿点赞; 天津大爆炸事件,把天津 2 亿多活跃用户,从天津快速调到深圳以及上海; 春节红包准备工作,2016年比2015年的红包访问量增长了10倍+,快速的扩充了 5000 台设备,最高访问量达到 477 万次/秒。 作为运维,最重要的是先保证自己做的系统可靠、不会轻易出错,不要让自己变成一个救火队员。可靠之后,就要用更多时间去解决效率问题,让工作变得更加高效,追求更高的目标。 对团队工作帮助最大的是什么? 资源管理:把写出来的程序和代码,进行清晰划分和分类,对每个资源采用不同形式进行搭建; 容错方案:在维护海量服务、运维过程中出现故障时,确保不能影响项目服务,服务器要做到及时处理; 统一架构 CMDBA

做好一名linux运维工程师

妖精的绣舞 提交于 2019-12-04 10:38:53
如何做好一个合格的运工程师, 运维 工程师前景怎么样呢?就这些问题,与大家交流一下。首先对于 运维工程师 的要求是十分严苛的了,运维 工程师不但 要针对不同的问题做出响应,而且需要不断的补充自己的知识面,并不继提高自己的。与时俱进,不断学习新的技术。 在 运维工程师 初级阶段,合格优秀运维人员 要 休现出积极的主动性 与 责任心,在面对陌生的业务时,要主动快速的学习业务对认识,并拓展相应的知识范畴,以便能够足够胜任并 做 支独立维护。在这个阶段基础知识要十分炸实,并不断充实自己的。形成自己的知识体系。 在 运维 逐步的发展阶段中, 运维工程师 要注重总结反省, 并 逐渐成长为高阶运维 工程 师,高级运维工程师,他们都会有自己比较体系化的运维理解。这也是也有一部分运维工程师,由于出色的项目管理方方面面的能力,逐渐成长为项目经理的原因。 随着再进一步的发展,高阶的运维工作 工程师 ,对于产品的方方面面理解将会十分的透彻,因此在这种情况下,高阶运维 工程 师,甚至可以成为优秀的产品的产品经理 , 并在产品功能的设计、开发中起到 十分 重要的角色。 合格的运维工程师,要负责维护并确保整个服务系统的高可用性,同时要不断优化系统架构,并不断提升部署效率、优化资源利用率、进面提高整体系统的 ROI 。 说起来很容易,这需要很多的知识积累。 随着技术的日新月异, 运维工程师面临的最大挑战,越来越多

高级运维工程师打怪升级之路

匿名 (未验证) 提交于 2019-12-03 00:22:01
1、Linux基础 Linux/Windows操作系统安装,目录结构、启动流程等。 2、系统管理 Linux系统,生产环境中基本都在字符界面完成工作,所以要掌握常用的几十个基本管理命令,包括用户管理、磁盘分区、软件包管理、文件权限、文本处理、进程管理、性能分析工具等。 3、网络基础 OSI和TCP/IP模型一定要熟悉。基本的交换机、路由器概念及实现原理要知道。 4、Shell脚本编程基础 Shell基本语法结构,能编写简单的脚本即可。 1、网络服务 vsftp、nfs、samba等。 SVN和GIT,能部署和简单使用就可以了。 rsync和scp。 inotify/sersync。 Linux下的定时任务服务crond。 2、Web服务 Web服务平台了。 PHP语言开发的,通常搭建LAMP、LNMP网站平台,这是一个技术名词组合的拼写,分开讲就是得会部署Apache、Nginx、MySQL和PHP。 JAVA语言开发的,通常使用Tomcat运行项目,为了提高访问速度,可以使用Nginx反向代理Tomcat,Nginx处理静态页面,Tomcat处理动态页面,实现动静分离。 3、数据库 MySQL,它是世界上使用最为广泛的开源数据库。学它准没错! SQL语句、用户管理、常用存储引擎、数据库备份与恢复。 MHA、MGR等。 4、安全 iptables限制只允许信任源IP访问

作为一个运维工程师应有的素养

匿名 (未验证) 提交于 2019-12-03 00:17:01
安全 运维人员的权限很大,一定要保证账号/私钥的安全 使用加密工具存储,给ssh私钥加密码,基于本地存储;稳定安全是运维的最高责任。 责任心 遇到报警要第一时间进行处理,不用等着别人去处理;如无法处理,应该第一时间让同事协助帮忙, 细心 自己的任何一个操作都要谨慎,都有可能造成系统的损害、业务出问题等。敲命令一定细心、再三确认,再快的手速也就省下几秒钟,但是出了问题就是大事 推进及改善 如果代码有问题,造成系统的开销很大,比如负载、io等,应该第一时间和开发联系,优化代码。 进取心 运维知识广泛、要不断的学习。遇到问题,做好分析及记录,事后可以在部门内部进行分享和交流。 懂网络、懂系统、懂数据库、还要懂业务逻辑。 抗压能力 拥有良好的心态。 永远不要只有一个方案 解决问题不要只想一个方案,多想几个方案,多几手准备反正不会有坏处~ 沟通能力 描述问题: 你需要描述清楚在工作中遇到的问题,及时寻求帮助。 解释不能实现的功能: 当你向客户解释某个产品的功能时,哪些是可以展现出来,哪些是不能实现,那不能实现的功能有没有替代方案,都需要描述清楚。 来源:51CTO 作者: 链接:https://blog.51cto.com/13870640/2448453

高级运维工程师的必备技术

匿名 (未验证) 提交于 2019-12-02 23:34:01
技术方案: 基础网络架构方案 负载均衡方案 页面缓存方案 反向代理方案 Php集群方案 Java应用集群方案 对象缓存方案 海量图片存储方案 Web安全方案 数据库集群方案 监控平台方案 消息队列方案 数据备份方案 脚本语言: Shell Python Perl Go语言 Java 基本操作命令: 文件操作 磁盘管理 用户管理 软件安装 压缩解压 文件编辑 常用系统: Centos Debian Suses Oracl enterprise linux Ubuntu linux 网络常用命令: Iftop nload Nstat Netstat Ss 进程: Strace Pidstat Mpstat 系统: Sar Perf Dtrace Ps 磁盘: iotop Iostat Blktrace Web服务: Apache Nginx Tengine Openresty Java容器: tomcat Resin Jetty Wildfly Weblogic 负载均衡器: nginx、tengine,openresty Lvs Haproxy Keeplive 分布式文件系统: Moosefs tfs Fastdfs glusterfs ceph Nosql数据库: Memcached Redis Couchbase 关系数据库: Mysql Perocona Mariadb

linux 运维工程师发展路线

匿名 (未验证) 提交于 2019-12-02 21:59:42
linux运维发展常见的就是下面两条路线: 第一条:运维应用-->系统架构-->运维开发-->系统开发 第二条:运维应用-->应用dba-->架构dba-->开发DBA 下面详细每个阶段的职位说明(以北上广为例): 01. 运维应用级别: 这个阶段就是玩别人的软件,例如:linux,nginx,mysql,php,nagios 大多数的linux运维工程师,网络工程师,系统工程师都是这个阶段。 这个阶段的工资平均3-10K。处在这个阶段的伙伴们要注意了。 这里属于金字塔的底端,工资是相对比较低的。 02. 系统架构级别: 这个阶段就是用已知软件架构大规模集群方案以及实现各种技术方案 这个就是所谓的系统架构师,如果是程序开发就是程序架构师。 这个阶段的工资平均10K-30K,属于运维应用上层,需要靠技术, 沟通,思想三条线通力配合才能达到这个水平。 03. 运维开发级别: 这个阶段就是利用已知语言,开发基本的应用层工具,例如:web管理系统 这个阶段的平均工资大概10-30K,如果具备前两个运维应用和系统架构的积淀, 那么工资30-60K很轻松。 04. 系统开发级别: 这个阶段就是修改开源的软件,或者开发新的服务软件(例如:也开发一个web软件,存储软件)与底层软件(例如:OS) 这个阶段的平均工资大概20-60K,如果具备前两个运维应用和系统架构的积淀,工资更高! 05.

普通运维人员就是秋后的蚂蚱!

ⅰ亾dé卋堺 提交于 2019-12-02 19:04:51
我虽是一个 IT 屌丝,但特别喜欢关注整个大行业的动态,干 IT 运维相关工作到现在也快8年了,企业对运维人员的专业能力要求确实提高了不少,现在再去面个运维工程师的职位都要求会个开发语言啥的,这在 2007 是不可想象的,那个时候,运维和开发是经纬分明,两个完全不同的工种,大多数运维人员只需要会配置常用服务、简单的调优、再会写个 SHELL 脚本处理一些日常事务 ( 比如监控应用、数据备份等 )  的话就能算是一个合格的运维工程师了(虽然现在依然有很多运维人员也还只是这种水平)。以上这些要求其实也算蛮简单的,那些年市场上充斥青鸟毕业生,稍微带一下就能干上面讲的这些事情。所以在那时,干运维还是蛮好混的,只不过工资确实是比开发人员要低一个档次的,当然行业地位也是,好多企业运维部门算是最边缘的一个技术部门了,在人们眼中,与运维最相近的字眼就是网管,我当时特别不喜欢别人说我是网管,总感觉是在网吧修机器的。 擦,一转眼快8年过去了,我习惯每年最后一天写篇文章,之前都是在北京过元旦,一个人孤独的写下一年来的酸甜,今天这篇文章却写在纽约,身边还陪着美好的姑娘,估计好多年前自己英语还很烂时也想不到今天就会站在美帝的土地上,就像刚做运维时,想不到自己日后会走向开发这条路。不过我想我这也算是顺应了行业的大趋势吧,因为风来了,相信已入行的运维伙伴们都已看到,普通的运维人员已是秋后的蚂蚱,蹦跶不了几天了

IT运维大会精华回顾 等保2.0时代掌控万物互联

前提是你 提交于 2019-12-02 18:31:08
10月24日,由《网络安全和信息化》杂志社、IT运维网联合主办的“2019(第十届)IT运维大会”在北京新世纪日航酒店成功举行。 随着大数据、云计算、物联网、互联网+等快速发展,IT系统架构日益复杂,业务需求的多样化,海量数据激增且无法及时分析并有效利用,企业面临着前所未有的IT运维挑战,传统的运维手段已经无法满足如今业务系统运维管理的需求。而伴随着 AI 技术的崛起,基于大数据和算法的智能运维应运而生,并逐渐成为一种新的发展趋势。 本届大会以“智能+时代的新运维”为主题,邀请了政府、制造、金融、互联网、能源、教育、交通、医疗等各行业运维主管、企业代表、业内专家,共同解读在智能+时代背景下中国IT运维发展的趋势,以及IT运维市场的发展方向。 以下是大会演讲观点摘录: 北塔软件技术总监 魏玉雄 智慧( AI )运维初探 随着人工智能在信息技术发展中扮演的角色越来越重要,它与运维的结合已是必然。北塔软件技术总监魏玉雄认为人工智能进入运维领域,不应是炒概念,要将概念落地,从定框架到改进系统,实实在在地改善运维工作。魏玉雄还认为智能是通过学习得到知识,而智慧是不通过学习就可得到知识。因此智慧运维是智能运维的深化。 汉得信息技术总经理 孙帆 泛服务运维与企业运营自动化融合 由于汉得信息早年是做高端ERP业务的,近些年才逐步转向做数字化工作。所以积累了很多管理服务的经验

运维未来的发展方向是智能运维(AIops)

ε祈祈猫儿з 提交于 2019-12-02 14:15:06
近年来运维技术飞速发展,运维团队大多建设好了各种系统:虚拟化、容器化、持续集成等等。但是如何有效的利用这些系统最终实现站点的高可用、高性能和高可扩展?随着智能化技术的发展,为了解决上述运维领域的问题,智能运维的呼声越来越高。 br/>在**日志易**产品总监饶琛琳(**@三斗室**)看来,目前国内智能运维发展还处于一个探索阶段,要想尽快在智能运维领域有所突破,首先要重点做好监控系统和告警系统,并利用机器学习算法进行快速监控和排障。 本文就将饶琛琳对智能运维发展的一些早期观点和看法整理出来,和大家一起探讨下运维未来的发展方向。 1、对国内运维领域现状的看法 简单来讲,目前国内运维界在自动化方面已经达到了一定的水平,就现阶段而言,自动化和监控两部分还是有一定距离。例如,你拿到了监控类的报警,可能不能立即清楚去做哪一项自动化的部署。如果能把自动化和监控这两部分有机的结合起来,运维的工作会更加便捷。 2、移动端和微服务给运维工作带来的挑战 在 PC 端的时代,运维的很多工作受限于浏览器,在运维人员拿不到用户端真实数据的情况下,大家普遍会去采购一些第三方服务,尝试获取终端数据。而在移动端时期,我们都有自己的客户端,可以把一些采点的逻辑放在自己的客户端里,然后获取到更准确、更真实的客户数据。相对于挑战来说,这其实是移动端带来的好处。 微服务的出现给运维工作带来一些难题。没有出现微服务之前