云翼

基于Jenkins的统一操作平台

旧街凉风 提交于 2020-01-15 02:52:01
作者:SUNNY 时间:2018-11-08 为什么要做统一操作平台? 根据实际数据统计,运维工作中,登陆服务器操作的操作,80%以上操作命令是查看之类操作(包括ls,cd,more等),还有一部分操作是文件编辑。 目标:运维人员的日常操作,均能通过统一平台来实现,减少琐事,提高质量、效率 有哪些需求? 日常操作简单分类为: 文件查看 线上配置变更 日志分析 重启服务 机器/系统级变更 各应用服务特有操作 其他 结合实际操作数据统计、走访调研,初步分析出数据云运维人员日常操作包括但不限于: 说明: 飘红框表示操作频率比较高 与服务相关的操作中,频率最大的是应用重启操作 解决思路是怎样的? 文件查看 这类操作暂时不细分,在线上服务器上开通dev开发账号(在线服务通过hadoop部署),运维人员通过dev来进行配置查看 线上配置变更 通过云翼包部署,不支持配置变更,这样对运维是一个很大麻烦,多次反馈,云翼表示不支持配置变更功能 变更频率比较高的任务,通过Jenkins Job来完成(基于Jenkins的统一操作平台来完成) 日志分析 通过ELK来实现 重启服务 基于Jenkins的统一操作平台来完成 机器/系统级变更 基于Jenkins的统一操作平台来完成 各应用服务特有操作 基于Jenkins的统一操作平台来完成 其他 基于Jenkins的统一操作平台 这是统一操作平台的重点

运维守护神——数十万线上机器的守护【门神】

北慕城南 提交于 2019-12-06 16:23:28
随着京东云业务的飞速发展,其需要管理的物理机、虚机以及各类容器已经达到了数十万之巨,在如此数量如此庞大资源机如何管理的课题面前,京东云意识到必须开发自己的高效、安全、稳定的资源机管理系统,为京东云乃至整个京东集团各项业务的发展提供坚实可靠的后盾,“门神”系统在这种情况下应运而生,并在经过多次京东618、11.11等诸多重大活动的检验后,变得愈发成熟稳定。 “门神”顾名思义,就是守护整个京东资源机云安全的守护神,是京东云平台自主研发的一套基于服务树角色授权的线上机器运维平台,该平台支持认证登录、系统运维和安全审计,可以对京东云平台所有的主机进行统一的访问控制、操作历史记录等,是符合4A的专业运维审计系统,构建统一、高效、安全运维通道,保障云端运维工作遵循法律法规要求、降低人为安全风险,提高运维效率。 设计目标 为了适应京东云业务快速发展、所需管理的物理机、虚机和容器数量指数级增加的现状,满足公司安全认证、高效运维、操作审计、职权管控的要求,门神设计初期就制定了如下目标: 安全认证 支持双因子认证机制,通过二维码、动态令牌等技术,控制账号密码泄露风险,防止运维人员身份冒用和复用。 高效运维 自研SSH交互界面,简洁易用,方便管理大量主机,简化运维和安全操作,提升运维效率;门神登录成功后支持资源机之间的无密码穿梭。 操作审计 全程记录运维人员的操作行为,操作内容支持各种维度信息查询

DevOps云翼日志服务实践

守給你的承諾、 提交于 2019-12-05 06:46:48
10月30日,全球权威数据调研机构IDC正式发布《IDCMarketScape: 中国DevOps云市场2019,厂商评估》报告。京东云凭借丰富的场景和实践能力,以及高质量的服务交付和平台稳定性,取得优异的成绩, 跻身“Major Players”(核心厂商)位置 。 京东云DevOps能力起源于自身的业务实践,针对京东集团的复杂业务场景打造并经受住多次618、11.11电商大促的严峻考验,保证了高效高质的交付和对变化的灵活应对。能够支持复杂场景的自动化运维需求、实现工具链产品与平台化产品结合,帮助客户根据不同的需求灵活定制方案。 前两次的专题内容中,我们分别与大家分享了 大型企业级监控系统的设计 以及 监控系统的可观测性与数据存储 。今天,我们将通过介绍京东云DevOps落地实践,和大家继续分享DevOps中另一个重要内容:日志查询服务。 日志查询服务,是构建软件项目的基石之一,是系统稳定运行必不可少的一部分,已然成为DevOps中的标配选项。这里,我们来聊一聊京东云翼DevOps平台的日志查询服务实践。 本着客户为先,全心全意为用户服务的原则,云翼日志查询服务的发展分以下几个阶段解决用户的日志需求: 场景一:用户需要查看自己的应用日志,以此来判断自己的应用程序当前运行是否正常,或者在遇到问题时,需要通过查看应用输出的日志信息来定位问题。 针对用户的这个需求,我们开发并提供了