同城异地灾备

老子叫甜甜 提交于 2021-01-07 10:35:59
序言

     同城异地灾备,主要是用来进行备份容灾的,从而当一个数据中心挂了,另外一个数据中心经过切换之后,能让服务迅速的恢复。


    同城双活,则是基于多机房的情况下,流量经过双机房,一个机房挂掉,完全不影响业务。


    微风浮起,吹动星空一缕轻云

很正经的吹牛逼

     从网络的层面来说,单个机房的存在是一个单点故障,因为一个机房宕机,那么业务立刻中断,从而无法进行升级。


    云服务,最重要的就是可扩展性,而什么版本支持扩展。。。从集群的角度来进行扩展。。。


    从最开始,业务不断的发展,各种流量拥上来,导致业务的吞吐量的剧增,从而促使底层的技术要不断的进行扩展,从而云平台的版本是否支持,必须要进行升级。。。


    随着业务的进一步发展,需要提供高可用水平,从而需要从单机房扩展为多机房,从而也就有了同城容灾。。。


    对于运维来说,多一次升级,多一次变更,就会多一个故障,多一个锅。。。大家排排坐,每个人分一点。。。热升级了解一下,不可预知的中断了解一下


    同城异地最关键的点在于存储,存储如何跨机房使用,从而分为几个方面进行探讨:

    1、 DNS解析

    在业务大量使用DNS解耦的时候,而且使用双机房的时候,那么就必然需要DNS具有一定的智能化,从而就有anycast类型的DNS,所谓的anycast类型的DNS,也就是能返回客户端最短路径的IP地址,从而让用户使用更少的时间得到需要访问的IP地址。


    换一种解释的方法就是,anycast类型的DNS就是一种网络寻址和路由的方法,其中来自单个发送方的报文被路由到拓扑中最近的节点之上。


    使用anycast类型的DNS,能大大的增强可靠性,可用性,整体提高服务的SLA的水平。


    在DNS解析的时候修改的时候,一般是依赖于高可用的SLB服务,从而在切换的时候,一般是对DNS进行动态的修改。

    

     2、 数据库同步

      在数据库方面,主要是使用mysql,而mysql则主要是使用主备模式,从而主的在一个机房,而备库则在另外一个机房,在同步的时候,不可避免的情况就是如果一旦主机宕机,从而有可能是丢失数据的,因为mysql在数据同步的时候,是使用异步的方式进行,但是这种由于有操作日志的存在,从而数据也不会丢失,但是,有可能存在冲突的可能,从而需要有人为的介入进行修复。


    主备复制的延迟考虑,一般主机房和备机房之间使用万兆网络,从而对于一般的数据传输来说,延迟不是很高,基本上是可以忽略的。


    在使用redis的时候,由于目前版本使用的redis2.8版本,从而不能跨机房做成集群的模式,从而导致redis也只能做成主备的模式,而redis作为高性能的缓存,丢失数据就无所谓了,主要还是在于高可用性即可,况且业务可以在降级的情况下使用,从而无须担心。当使用redis3.0或者以上的版本的时候,可以直接跨机房使用redis的集群功能,性能和单机房的速度差不多。


    核心数据库,要想高可用,并且不存在数据丢失,从而可以使用分布式数据库,在数据写入的时候,采用强同步的方式写入数据,对于master节点,可以采用三机房三中心的模式,使用paxos算法进行选主,从而达到高可用的目标,并且在数据写入的时候,写入三个分片,从而一个分片的数据损坏,在后台进程中,数据能慢慢的自动弥补回来,从而达到强一致性的数据保存的效果。


    在数据库跨机房同步的时候,mysql可能出现脑裂的情况,也就是双机房互联网络出现中断,从而备机房检测到主机房不可用,但是在这个时候,是不能自动进行切换的,需要人工介入处理操作。


    3、 SLB高可用

    在每个机房中,流量的入口总是SLB,从而保证SLB高可用也是相当关键的,所有的VM的rs服务器都是挂接在SLB之后,一旦SLB不可用,那么所有的业务中断。。。SLB故障了解一下。。。劳资内心慌的一B。。。


    要保证SLB的高可用,好像是主要靠交换机来进行保证,使用什么OSPF动态路由协议,从而保证每个SLB的流量都是分摊的,并且SLB之间可以进行会话同步,从而无论是长连接或者是短连接都不会出现太大的问题,业务报错。。。那是必然的。


    在使用SLB的时候,可以使用分层的方式来做,第一层使用LVS进行四层负载均衡,第二层使用haproxy做成七层负载均衡,也可以再加上一层,使用nginx来进行证书的解析,也就是专门用来解析https的请求,穿透到后端全部是http的请求,从而保证证书都是放在同一个位置进行解析。


    4、 业务高可用

    所有以上的目标,其实都是为了业务的高可用,那么再进行保证业务高可用的时候,因为使用的都是VM,从而在创建的时候,需要同步在备用机房创建VM,并且在发布程序的时候,需要同步进行发布,也就是主机房发布一套程序,而备用机房也发布一套程序,资源浪费,当然,这种单纯为了计算而生的VM,其实可以进行负载均衡,或者灰度发布,或者蓝绿测试也不错。


    5.、网络

    网络分为两种,一种是虚拟网络vpc,一种则是经典网络,也就是物理机所在的网络。。。


    其实在创建VM的时候,就可以分配一个虚拟ip,一个是经典ip,从而都可以进行访问,而且也能起到隔离的作用。。。

疯言疯语

     快速迭代,快速变化,快速适应。。。


    无论是业务的发展,还是人的发展,感觉在更多的时候,技术都不是问题,而发展到最后一切都是人的问题。。。到底是人还是狗,WTF。。。


    快速的迭代的时候,其实最主要的就是心态。。。。稳住,不要浪。。。稳住,怎么可能。。。我们的宗旨是要浪的天际。。。


    一旦大招开启,怎么可能停的下来。。。完全停不下来,毋宁死。。。向死而生。。。如果撤退了,死的更惨,死的更凄凉,所以。。。不能退


    其实最可怕的不是事多,最可怕的是定位不准,最可怕的是职责不清晰。。。最可怕的该上的时候不上,不该上的时候死命的冲。。。。葫芦娃救爷爷,一个个送,最后。。。一个个怂。。。


    战事在不断的发展,如果你们都是优秀的,那么就不存在问题了。。。确认过眼神,都不是对的人。。。


    识别问题,解决问题。。。将问题抹杀在萌芽之中。。。怎么可能,临时解决的问题那么多,所谓的根源。。。不可能的。。。WTF


    突然意识到面试的重要性。。。面试太简单,说明未来的同事都是渣渣。。。面试越难,说明未来的同事的战斗力越来越强。。。从面试看待整体的战斗力了解一下。。。


    对一个人,要求越高,从而期望也越大。。。如果对你没有要求,你就是一滩烂泥,关我屁事。。。WTF


    从战略上的把控。。。退到全力辅助。。。再退到做好自己的本份。。。还能退到哪里?。。。我是谁,我在哪里,我在做什么。。。


    全军出击,还是全军溃败?并不是很懂,或许也懂。。。能观望到未来的发展,并没有一丝曙光。。。说好的蓝天白云呢???


    调和一下糟糕的心态。。。所以只能说,你们都很棒,你们都很优秀


    内耗消费的精力太多,导致都不能好好输出了。。。大招还在CD之中。。。内忧外患了解一下。。。


     where is your focus?what is your attention?I lost my mind。。。。WTF


    what is the best solution?talk each other?maybe。。。

    

    关注力可以放开一点点,全神贯注太让人疲倦。。。总是纠结在一些小事当中。。。偶尔或许也需要一点心灵鸡汤。。。毒鸡汤了解一下。。。


    关注什么?关注你的目标。。。最终的旅途。。。how to insist。。。没必要为了一个项目搭上了所有的时间,所有的精神,所有的关注力,所有的价值观。。。not worth of it。。。need some flow,fly my mind。。。


    

本文分享自微信公众号 - SRE运维实践(gh_319dd73ec076)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!