蓝鲸智云功能剖析&介绍

随声附和 提交于 2019-12-06 09:28:46

蓝鲸功能剖析&介绍

概要: 简单看了一下蓝鲸平台的内容. 整个架构都是依赖了一个长连接的agent (tcp)能够通过这个agent来实现很多功能.如:

  1. push 脚本给collector 

  2. push 配置给collector

  3. pull collector 状态. 

简单来说. 这里的agent 非常强. 强到可以不需要在操作 物理机器. 只需要在远程操作就行了. 我猜他们整个平台也是依赖这个基础之上的. 

 

所有平台的参考文档:

http://bbs.bk.tencent.com/forum.php?gid=62

 

 

 

平台功能介绍

作业平台:

概要: 能够定义一些作业, 能够对作业做一些规范. 什么时候做什么作业. 同时也对作业做了一些实时监控. 

  1. 作业的声明和管理.(创建一个作业任务, 和调度这个作业任务)

  2. 还支持多种作业模式. SQL/ 定时的. 等等. 

  3. 对作业 的操作权限做了一些限制. 还有操作日志等等. 

 

 

 

配置平台:

概要: 能够定义非常复杂的配置管理. 能够分模块? 模块下面有子模块的不同层次的配置. 即能够概括所有现有的服务配置. 因为基于一个实时的collector . 所以修改配置是十分的方便. 

  1. 超级复杂的配置管理. organization 化的. 

  2. 能够在线编写 配置文件. 但是只是放在了 /usr/local 下面. 可能还需要做一个作业去分发..感觉挺复杂的. 

    1. 操作逻辑是. 比如我要修改一个配置. 先在配置平台上新增. 

    2. 然后跑到 作业平台 , 新建作业. 

    3. 然后执行作业. 完成部署一台机器的配置的事情. 

  3. 常见的 机器配置管理. 拓扑管理. 

  4. 进程管理. 这里还不太懂这个是干嘛的

 

 

 

鹰眼平台:

这个应该是一个BI 的产品, 但是感觉怪怪的. 针对的是舆论方面的监控, 就是 爬虫和对某些关键词热点的监控..

http://bbs.bk.tencent.com/forum.php?mod=viewthread&tid=207

 

具体操作没有看. 可以看看文档.

 

 

 

标准运维平台:

这个好像不是蓝鲸自己的. 

跟蓝鲸的作业平台有很多重合的地方. 但是可视化上面做的比较好, 就是能够可视化的操作, 第一步做什么作业(脚本) 第二步 做什么. 等等. 

另外的功能就跟作业平台和. 配置大同小异. 

 

 

故障治愈:

其实就是基于监控 和 作业平台两个东西而已. 

不难想到就是 报警了 然后自动执行某个程序而已. 没有别的. 然后给出历史 查看. 

 

 

总结:

  1. agent 很强. 说实话很多东西都是因为这个agent 才能够实现. 但是也仅仅就是agent 非常强了. 

    1. 这个也会有一定的安全问题.(因为是能够push, 我就可以随意push 一个 rm -rf )

    2. 操作不知道是否能够校验安全问题. 

    3. 另外不知道公有云用户是否能够接受这种做法.

  2. cmdb 方面我认为不够清晰. 主要是将所有平台分的很细. 这个从 交互就知道了 每个平台都是单独的一套. 开发是好开发, 但是很多逻辑都是重复的. 并且操作极其复杂. 也搞得非常的细, 这个都是cmdb 的通病了. 大而全但是没什么实际用处. 

    相比之下. easy ops 强很多. 清晰明了. 

  3. 监控方面的内容不够, 非常粗粒度的东西., 我能够肯定的说这个几乎等于没有监控.所以这个点可以好好针对一下. 

  4. 资产管理复杂. 三维家说要的资产管理. 这里导入的话非常复杂. 初始化可能需要做很多事情. 多加一台也麻烦. 也不知道是不是因为在腾讯云上看到的不一样. 

  5. 我看过他们的代码. 并不是那么的好, 如果好我就用他们的产品了. 我都不开发了. 

    1. php 写的. (我不是特别熟悉)

    2. mysql 表格设计 使用实体表. + N(>100) column 设计, 换句话说就是没用的column 查询很多.

    3. 部署不好用, 我当时部署了一会也没有部署成功, 有机器的问题. 也有他们代码的问题. 没有说的那么简单. 

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!