昨天,我写的博客备份软件老矣?存储新风口——超融合第二存储来了阅读量还挺多,在业界引起了不少反响,很多人回帖说他们家的产品就是超融合第二存储,但也许可能就是一个备份一体机,虽然感觉像,但可能并不是,我把它叫形像和神不似。
今天,我就以Cohesity为例,来讲讲超融合第二存储有哪些典型特征,大家可以对号入座,看看你的产品是否具备这样的特性。
1、无限节点。真正的分布式节点,可以无限scale-out扩展,没有节点规模限制。Cohesity号称所有的数据和元数据都是分布式的,类似google file system,没有节点限制。哈哈,投标你写不死它。Nutanix也是这么宣传的,没有节点限制。但是很多SDS是有节点限制的,比如EMC SCALEIO,宣传好像是1000多个,华为的FusionStorage,宣传是2000多个。不过,有高人分析说Cohesity的集群节点数目其实最大只有256个,但是它通过集中管理方式,把这些集群统一进行管理,实现真正的无限扩展。虽然Cohesity怎么能吹,但目前部署的最大集群只有20多个节点。
2、无限高性能快照。Cohesity号称采用SnapTree专利技术,整体系统的快照数是无限的,和IBM的XIV宣传的口径类似。而很多的存储系统,整个系统的快照数是有一个上限的。并且,支持快照的快照(无限递归),并且中间任何一个快照删除,系统无限做数据合并,因为合并非常影响性能(vmware vsan就是这种架构)。Cohesity采用专利的快照树解决了vsan这样的快照的性能问题。
3、全局变长分布式重删压缩。这个很多备份一体机也有,但有些可能不是全局的。有些备份软件,如commvault采用是定长的重删,为了追求比较好的重删率,需要感知应用来调整重删长度。而变长重删采用滑动窗口技术,无需感知应用,EMC DATA DOMAIN也是变长重删,但是DD不是scale-out的,每个DD只是自己内部重删,因此没有全局的概念。
4、全局索引和搜索。这个在混合云环境非常重要,有了全局搜索,你可以很快定位都某个VM里面的文件。如果这个VM已经归档到公有云了,你可以从公有云上只下载这个文件,而不是整个VM,由于公有云带宽不高,这样大大节省了恢复的时间。没有全局搜索,就很难做的细粒度的管理和恢复。
5、采用分布式数据库NoSQL,支持map-reduce。只有采用开源的分布式数据库,才能使得元数据真正分布,而且降低用户成本。commvault采用windows操作系统和SQL SERVER数据库,这些都是需要购买的,而且SQL SERVER数据库不是分布式数据库,很难实现元数据正在分布。
6、均衡的高性能。Cohesity底层是一个类似google file system一样真正的分布式文件系统,加上其索引数据的全分布,使得负载可以均衡分布到所有的节点。比如你要直接拉起一个VM,或者采用vmotion进行数据恢复,所有的节点都可以帮助你并行处理,性能肯定比类似veeam那样只能在一个节点处理(如果只拉起一个vm的话,如果是多个vm,可以不同节点处理不同vm)要快很多。这也是原数据分布带来的好处。
7、QoS。必须能够智能识别备份流(顺序IO)和开发测试流(随机IO),并且采用QoS保障开发测试的性能。
8、file和object多协议支持。有了文件接口,第二存储可以单独做备份介质卖,和EMC DD竞争。有了对象接口,可以归档到冷存储或者公有云上。
以上八点,我认为是第二存储必须要具备特质。大家可以拿自己的产品对标一下,如果你能够做到,那么就是真正的超融合第二存储。
本文分享自微信公众号 - 高端存储知识(High-end_Storage)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4593692/blog/4466025