linux运维工程师

运维监控介绍

泄露秘密 提交于 2020-03-09 13:38:29
监控 文章目录 监控 0 监控目标 1 监控方法 2 监控核心 3 监控工具 4 监控流程 5 监控指标 5.1 硬件监控 5.2 系统监控 5.3 应用监控 5.4 网络监控 5.5 流量分析 5.6 日志监控 5.7 安全监控 5.8 API监控 5.9 性能监控 5.10 业务监控 6 监控报警 7 报警处理 8 面试监控 9 监控总结 0 监控目标 我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同、公司不同、业务不同、岗位不同、对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用。 对系统不间断实时监控:实际上是对系统不间断的实时监控(这就是监控)。 实时反馈系统当前状态:我们监控某个硬件、或者某个系统,都是需要能实时看到当前系统的状态,是正常、异常、或者故障。 保证服务可靠性安全性:我们监控的目的就是要保证系统、服务、业务正常运行。 保证业务持续稳定运行:如果我们的监控做得很完善,即使出现故障,能第一时间接收到故障报警,在第一时间处理解决,从而保证业务持续性的稳定运行。 1 监控方法 既然我们了解到了监控的重要性、以及监控的目的,那么下面我们需要了解下监控有哪些方法。 了解监控对象:我们要监控的对象你是否了解呢?比如CPU到底是如何工作的? 性能基准指标:我们要监控这个东西的什么属性

一份360的运维面试题

只愿长相守 提交于 2020-03-02 09:16:46
公司名称:奇虎360 招聘职位:运维工程师 职位需求: 1、精通FreeBSD/Linux系统安装配置和系统参数优化设置。 2、三年以上IDC、服务器运维经验。 3、精通apache、nginx等web服务器和参数的配置优化。 4、熟悉MySQL数据库优化者佳。 5、熟悉cisco、H3C路由器和交换机配置者佳。 6、工作有条理,工作习惯良好,有一定的故障处理能力。 7、可承受较大的工作压力,对待工作认真负责,有较强的工作责任心。 以下是面试题: 1、写一个脚本查找最后创建时间是3天前,后缀是*.log的文件并删除。 2、写一个脚本将某目录下大于100k的文件移动至/tmp下。 3、写一个脚本将数据库备份并打包至远程服务器192.168.1.1 /backup目录下。 4、写一个防火墙配置脚本,只允许远程主机访问本机的80端口。 5、写一个脚本进行nginx日志统计,得到访问ip最多的前10个(nginx日志路径:/home/logs/nginx/default/access.log)。 6、写出下列命令的含义 (1)MaxKeepAliveRequests 100 (2)Options FollowSymLinks Order Deny Allow Deny from all Allow from 192.168.1.1 7、写一个脚本把指定文件里的/usr

性能调优概述,这是一篇最通俗易懂性能调优的总结!

拈花ヽ惹草 提交于 2020-02-07 21:51:44
1. 作者概述 2. 什么是性能调优?(what) 3. 为什么需要性能调优?(why) 4. 什么时候需要性能调优?(when) 5. 什么地方需要性能调优?(where) 6. 什么人来进行性能调优?(who) 7. 怎么样进行性能调优?(How) 8. 总结 硬件配置:CUP Xeon E5620 x 2 8核心, 内存 16G , 硬盘 RAID 10,操作系统: CentOS 6.4 x86_64(64位)。 概述 在这篇博文中,我不想用一些抽象的概念去说性能调优的问题,只想用最通俗的语言尽量来准确的表达我的想法。 由于本人小平有限,有什么不对或者不清楚的地方欢迎大家交流指正。为了更能通俗易懂的理解我们即将要的性能调优的话题,我在这里简单的和大家说一下我写这篇文章的写作方法 5w+1h方法。 注,5w+1h就是对所做工作进行科学的分析,对某一工作在调查研究的基础上: · 就其工作内容(What) · 责任者(Who) · 工作岗位(Where) · 工作时间(When · 怎样操作(How · 以及为何这样做(Why) 即”5W”、”1H”进行书面描述,并按此描述进行操作,达到完成职务任务的目标。(来源“百度百科”) 哈哈听过马哥课程的一定不陌生! 二、什么是性能调优?(what) 在说什么是性能调优之前我们先来说一下,计算机的体系结构。 如上图,简单来说包括三块:硬件

Linux运维工程师有钱途吗?

大城市里の小女人 提交于 2020-01-03 18:53:52
  Linux是免费开源的操作系统,从整体情况来说Linux操作系统是非常受欢迎的,具有非常不错的作用,使用Linux系统的人也非常多。那么Linux运维工程师发展前景如何?今天跟大家聊聊吧。   Linux运维岗位做什么?简单的来说就是维护Linux操作系统以及系统之上的相关软件服务、程序代码和企业数据,让其变得更加高效、优质、快速,可以为企业提供服务,从而盈利,近些年随着企业增长,服务器和服务数量、要求也增加了,对运维要求也就越来越高了。   Linux运维行业的发展前景如何?   从就业机会、企业需求以及Linux应用为大家详细的介绍一下。   流程化、标准化的工作越来越受到信息系统各企业发展的所需,信息系统开发和运维也创造了很多的工作岗位。到目前为止,我们了解到的互联网信息化基础设备中,我们的操作系统、软件底层架构很多都是在Linux系统上的。   Linux系统以安全、稳定、免费、高效、可自由更改代码的特点在一二线城市使用率非常高,有90%以上互联网企业以及移动互联网企业都在应用。   同时围绕着Linux运维方向,可以从事很多的领域,比如说Linux系统运维工程师、应用运维工程师、运维开发工程师、大数据运维工程师、云计算运维工程师、系统运维架构师。   总体来说,Linux还是非常具有发展前景的技术,晋升岗位多,薪资待遇好,应用率广泛。 来源: 51CTO 作者:

背锅侠逆袭之路

倖福魔咒の 提交于 2019-12-26 18:51:02
小张,3年网工一枚,常常抱怨:薪资不高,琐事一堆,常常背锅。 眼看一把年纪了,发现不能再这样下去了,向我讨教一条逆袭之路! 既然要说,那就和大家一起分享下吧,顺便总结下十几年的Linux运维经验。 聊聊:自己吧! 最早接触Linux是在2000年,那时,我还在上大学。一个从荷兰归来的同学,带回一个Linux的拷贝版,版本还是个人版Redhat6.2。 为安装这个系统,我们挑灯夜战,不亦乐乎。那时Linux的学习资料还很少,能够学习的书籍也不多,网上Linux技术社区更不多,便凭着Redhat6.2自带的几页使用说明开始了Linux学习生涯。 这算是我学Linux的起点吧。其实学Linux门槛很低,只要你想学,有热情,有学习能力,几个月时间就能轻松上手干活。 Linux:快速入门? 那么通过什么学习方法,能够快速入门Linux呢?我这么多年的工作和学习,总结出了下面一套方法,希望对大家有用。 1>多动手实践,理论结合实际 这个太重要了,我见过太多的人,懒于动手,觉得能看懂,能听懂,就不去实践练习,结果觉得什么都懂的人,在真正干活的时候傻眼了。 很多Linux知识,例如每个命令的参数含义,在书本上说得很清楚,看起来也很容易理解,但是组合起来使用,却并不那么容易,没有多次的动手练习,其中的技巧是无法完全掌握的。 2>一定要习惯命令行方式工作 Linux下90%的操作都是在命令行下完成的

云计算,拼的就是运维

爷,独闯天下 提交于 2019-12-13 11:57:18
本文根据 InfoQ 中文站跟陈皓(@左耳朵耗子)在 2014 年 3 月的一次聊天内容整理而成。 在沟通中,陈皓分享了自己对云计算的理解,包括云计算为什么会分三层,实现一个云平台的难点在什么地方,运维之于云计算的重要性,电商云为什么有价值等。 对云计算的定义 云计算其实跟 PC 机有一样的概念,有 CPU、硬盘、操作系统、应用软件。 云计算的计算节点(虚拟机)就是 PC 中的 CPU,数据缓存服务就是 PC 的内存,存储节点就是 PC 的硬盘,提供数据服务,让数据不丢、高可用,PC 中的控制器就是云计算的控制系统。PC 机的硬件上面要有操作系统。 操作系统很大一块是给开发人员提供系统的 API 接口,提供系统监控以看运行情况,并且还要有系统管理——如用户账号的权限管理、备份恢复等等。操作系统上面要有应用软件,这样才能服务于最终用户,应用软件就是真正落地的业务,这样才会有用户;有了用户,整个体系就运转起来了。 这就是工程师说的 stack,也就是我们听到的 IaaS、PaaS、SaaS 三个层。 IaaS 层就像 PC 机的基础硬件加驱动程序,PaaS 层就像 PC 机上的操作系统——把基础硬件抽象、包起来并屏蔽硬件和硬件驱动细节、调度基础硬件,而 SaaS 层就是 PC 机里的应用软件。 另外,我们还得给开发人员提供各种开发框架、类库和开发环境,这就是为什么 AWS 还做通知

01: Linux运维介绍

时光总嘲笑我的痴心妄想 提交于 2019-12-05 14:03:25
1.1 inux运维的主要工作内容   1. 什么是linux运维       1. 互联网Linux运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够7×24小时为用户提供高质量的服务。       2. 运维的职责覆盖了产品从设计到发布、运行维护、变更升级及至下线的生命周期。       3. 运维工程师们的职责不仅限于这部分工作,还需要总结工作中遇到的问题,抽取出相关的技术方向。       4. 研发相关的工具和平台以支持/优化业务的发展并提高运维的效率   2、基础运维常见工作内容       1. 服务监控技术: 包括监控平台的研发、应用,服务监控准确性、实时性、全面性的保障       2. 服务故障管理: 包括服务的故障预案设计,预案的自动化执行,故障的总结并反馈到产品/系统的设计层面进行优化以提高产品的稳定性       3. 服务容量管理: 测量服务的容量,规划服务的机房建设,扩容、迁移等工作       4. 服务性能优化: 从各个方向,包括网络优化、操作系统优化、应用优化、客户端优化等,提高服务的性能和响应速度,改善用户体验       5. 服务全局流量调度: 接入服务的流量,根据容量和服务状态在各个机房间分配流量       6. 服务安全保障: 包括服务的访问安全、防攻击、权限控制等       7. 服务自动发布部署:

你不知道的是

廉价感情. 提交于 2019-12-05 01:49:52
Linux运维跳槽必备的40道面试精华题 1、 什么是运维?什么是游戏运维? 1)运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常, 在他运转的过程中,对他进行维护,他集合了网络、系统、数据库、开发、安全、监控于一身的技术 运维又包括很多种,有 DBA运维、网站运维、虚拟化运维、监控运维、游戏运维等等 2)游戏运维又有分工,分为开发运维、应用运维(业务运维)和系统运维 开发运维:是给应用运维开发运维工具和运维平台的 应用运维:是给业务上线、维护和做故障排除的,用开发运维开发出来的工具给业务上线、维护、做故障排查 系统运维:是给应用运维提供业务上的基础设施,比如:系统、网络、监控、硬件等等 总结:开发运维和系统运维给应用运维提供了 “工具”和“基础设施”上的支撑开发运维、应用运维 和系统运维他们的工作是环环相扣的 2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的? 游戏运营要做的一个事情除了协调工作以外还需要与各平台沟通,做好开服的时间、开服数、用户导量、活动等计划 3、现在给你三百台服务器,你怎么对他们进行管理? 管理 3百台服务器的方式: 1)设定跳板机,使用统一账号登录,便于安全与登录的考量。 2)使用salt、ansiable、puppet进行系统的统一调度与配置的统一管理。 3)建立简单的服务器的系统、配置

Linux分区

﹥>﹥吖頭↗ 提交于 2019-12-03 10:22:35
分区方案: 实验环境 原则:想怎么分就怎么分 方案一:最简 (如果你生命只剩下最后一天) windows :C Linux : / 方案二:相对规范 / (如果你生命中只剩一天) swap (如果你生命还有一天) 交换分区,虚拟内存,当内存耗尽时,把硬盘当内存使用 教材(内存的1.5-2倍);生产环境(8G,16G) /boot (如果你生面还有一天)存放启动文件 例如内核 kernel 一般1024MB /home (如果你生面还有一天) /data (如果你生面还有一天) 业务环境: 原则:严格按照运维规范 某公司,某业务线 面试题: Linux至少应该有那两个分区? 错误 Linux至少应该有哪一个分区? 正确 软件选择: 方案一:最小安装 方案二:严格按照运维规范,定制安装 KDUMP:黑匣子,划分一部分记录系统崩溃时的数据,共系统人员进行分析,确定问题所在,,CentOS建议关闭 网络: 1000Mb/s 每秒1000Mbit 1000/8=125M/s 业务环境: IP:网络工程师分配,固定 主机名:严格按照运维规范, 例如出现位置(IDC机房),业务 用户: 业务环境: root:密码满足复杂强度, yAng5678web!@#$ 防止黑客暴力破解 穷举 尽量每个业务线使用不同的密码, 不建议的密码:自己生日 女朋友生日 手机号 姓名拼音 密码不随意卸载纸上 来源:

Linux面试题

蓝咒 提交于 2019-12-01 07:04:02
1、什么是运维?什么是游戏运维? 1)运维是指大型组织已经建立好的网络软硬件的维护,就是要保证业务的上线与运作的正常, 在他运转的过程中,对他进行维护,他集合了网络、系统、数据库、开发、安全、监控于一身的技术 运维又包括很多种,有DBA运维、网站运维、虚拟化运维、监控运维、游戏运维等等 2)游戏运维又有分工,分为开发运维、应用运维(业务运维)和系统运维 开发运维:是给应用运维开发运维工具和运维平台的 应用运维:是给业务上线、维护和做故障排除的,用开发运维开发出来的工具给业务上线、维护、做故障排查 系统运维:是给应用运维提供业务上的基础设施,比如:系统、网络、监控、硬件等等 总结:开发运维和系统运维给应用运维提供了“工具”和“基础设施”上的支撑 开发运维、应用运维和系统运维他们的工作是环环相扣的 2、在工作中,运维人员经常需要跟运营人员打交道,请问运营人员是做什么工作的? 游戏运营要做的一个事情除了协调工作以外 还需要与各平台沟通,做好开服的时间、开服数、用户导量、活动等计划 3、现在给你三百台服务器,你怎么对他们进行管理? 管理3百台服务器的方式: 1)设定跳板机,使用统一账号登录,便于安全与登录的考量。 2)使用salt、ansiable、puppet进行系统的统一调度与配置的统一管理。 3)建立简单的服务器的系统、配置、应用的cmdb信息管理。便于查阅每台服务器上的各种信息记录