蓝鲸功能剖析&介绍
概要: 简单看了一下蓝鲸平台的内容. 整个架构都是依赖了一个长连接的agent (tcp)能够通过这个agent来实现很多功能.如:
-
push 脚本给collector
-
push 配置给collector
-
pull collector 状态.
简单来说. 这里的agent 非常强. 强到可以不需要在操作 物理机器. 只需要在远程操作就行了. 我猜他们整个平台也是依赖这个基础之上的.
所有平台的参考文档:
http://bbs.bk.tencent.com/forum.php?gid=62
平台功能介绍
作业平台:
概要: 能够定义一些作业, 能够对作业做一些规范. 什么时候做什么作业. 同时也对作业做了一些实时监控.
-
作业的声明和管理.(创建一个作业任务, 和调度这个作业任务)
-
还支持多种作业模式. SQL/ 定时的. 等等.
-
对作业 的操作权限做了一些限制. 还有操作日志等等.
配置平台:
概要: 能够定义非常复杂的配置管理. 能够分模块? 模块下面有子模块的不同层次的配置. 即能够概括所有现有的服务配置. 因为基于一个实时的collector . 所以修改配置是十分的方便.
-
超级复杂的配置管理. organization 化的.
-
能够在线编写 配置文件. 但是只是放在了 /usr/local 下面. 可能还需要做一个作业去分发..感觉挺复杂的.
-
-
操作逻辑是. 比如我要修改一个配置. 先在配置平台上新增.
-
然后跑到 作业平台 , 新建作业.
-
然后执行作业. 完成部署一台机器的配置的事情.
-
-
常见的 机器配置管理. 拓扑管理.
-
进程管理. 这里还不太懂这个是干嘛的
鹰眼平台:
这个应该是一个BI 的产品, 但是感觉怪怪的. 针对的是舆论方面的监控, 就是 爬虫和对某些关键词热点的监控..
http://bbs.bk.tencent.com/forum.php?mod=viewthread&tid=207
具体操作没有看. 可以看看文档.
标准运维平台:
这个好像不是蓝鲸自己的.
跟蓝鲸的作业平台有很多重合的地方. 但是可视化上面做的比较好, 就是能够可视化的操作, 第一步做什么作业(脚本) 第二步 做什么. 等等.
另外的功能就跟作业平台和. 配置大同小异.
故障治愈:
其实就是基于监控 和 作业平台两个东西而已.
不难想到就是 报警了 然后自动执行某个程序而已. 没有别的. 然后给出历史 查看.
总结:
-
agent 很强. 说实话很多东西都是因为这个agent 才能够实现. 但是也仅仅就是agent 非常强了.
-
-
这个也会有一定的安全问题.(因为是能够push, 我就可以随意push 一个 rm -rf )
-
操作不知道是否能够校验安全问题.
-
另外不知道公有云用户是否能够接受这种做法.
-
-
cmdb 方面我认为不够清晰. 主要是将所有平台分的很细. 这个从 交互就知道了 每个平台都是单独的一套. 开发是好开发, 但是很多逻辑都是重复的. 并且操作极其复杂. 也搞得非常的细, 这个都是cmdb 的通病了. 大而全但是没什么实际用处.
相比之下. easy ops 强很多. 清晰明了.
-
监控方面的内容不够, 非常粗粒度的东西., 我能够肯定的说这个几乎等于没有监控.所以这个点可以好好针对一下.
-
资产管理复杂. 三维家说要的资产管理. 这里导入的话非常复杂. 初始化可能需要做很多事情. 多加一台也麻烦. 也不知道是不是因为在腾讯云上看到的不一样.
-
我看过他们的代码. 并不是那么的好, 如果好我就用他们的产品了. 我都不开发了.
-
-
php 写的. (我不是特别熟悉)
-
mysql 表格设计 使用实体表. + N(>100) column 设计, 换句话说就是没用的column 查询很多.
-
部署不好用, 我当时部署了一会也没有部署成功, 有机器的问题. 也有他们代码的问题. 没有说的那么简单.
-
来源:CSDN
作者:10FeetTall
链接:https://blog.csdn.net/ioy84737634/article/details/89075280