在互联网企业中,经常离不开的术语就是分布式架构和微服务相关的词汇,如果让你来设计一个分布式系统,你会以什么样的维度去构思我们的分布式系统呢?首先,我们需要明白为什么需要分布式系统,它的实现目标是什么;其次当我们对分布式目标清晰之后,那么我们实现可以从目标的维度思考可采取的技术手段有哪些;接着我们对技术栈知识有了一个基本认知之后,这个时候又要要求我们思考架构设计的不仅是全局宏观的技术栈视野,还要具备全局的业务服务视野来思考并落地我们的分布式架构的设计。因此对于分布式架构的学习是一个漫长的过程,先要清楚目标,然后弄明白实现目标的技术方案,最后结合我们的技术栈与业务体系从宏观以及微观上去思考并落地我们的分布式架构设计。
分布式设计目标
业务架构的演进
-
对于并发问题,我们知道处理共享资源可以通过加锁的方式来保证我们的线程安全,那么在有限的资源下又要如何提升我们的并发量,于是我们很容易想到hashmap是如何处理线程安全的,对此我们就会考虑到一个设计思想,那就是分而治之的策略,即是否可以将共享资源拆分成多份来缓解我们的压力,即集群. -
这个时候我们的流量压力通过集群分担到各个应用中,但是此时对数据库的压力反而增加了,于是我们会想到使用缓存策略来缓解我们的压力,对于缓存架构,我们也可以采用CPU高速缓存的策略来对我们现有的服务进行改进。 -
另外,随着业务的增长以及需求不断地调整变化,有时候为了提升我们的查询性能,还需要以不同的维度重新构建数据库表结构。比如订单服务,可以以用户维护进行数据异构产生用户与订单服务的数据库表结构来提升我们的查询性能。其实对于这种数据异构在编程设计中也是有体现的,比如表单的业务 bean 与数据库存储的业务 bean 多少存在一些冗余但可能是类型或者是状态显示不同,目的当然是简化字段信息同时也便于操作响应。 -
随着业务不断扩大,团队人员也在增加,考虑到快速交付产品需求,我们可以划分团队负责不同的业务线,于是便有了服务的垂直拆分,也就是我们的服务化架构,在分布式架构设计中引入服务化架构是我们根据团队以及业务进行拆分的结果,目的是为了更快速交付,同时也是为了更为专注业务开发的落地实现。
构建分布式系统的两个核心因素
-
增大系统容量: 我们的业务量越来越大,而要能应对越来越大的业务量,采取分而治之的设计思想,通过进行水平或是垂直拆分业务系统,让其变成一个分布式的架构。 -
保证系统服务的高可用: 为了增大系统容量,我们将业务进行拆分,彼此独立,但是每一块业务线都有其重要意义。因此我们就需要保证每一块业务线的服务不能存在单点故障,这样整个系统不会因为单点服务出故障而导致业务服务系统不可用,所以需要通过做节点冗余系统以消除单点故障,从而提高系统的可用性。
小结
分布式常用术语
节点
集群
副本
在分布式系统中提供数据抑或是服务的冗余来保证系统的高可用,数据副本是指在不同的节点上持久化存储一份相同的数据,服务副本是指在不同的节点上部署一套或一组提供相同业务处理逻辑的服务,一般形成主从来保证服务节点的高可用。
中间件
独立于应用服务,位于操作系统之上的一套为集群节点服务解决问题的通用方案的组件,简化开发人员的工作,让开发者更专注于业务上的开发。比如服务与服务之间通过消息中间件实现异步通信,实现服务解耦;为了加速数据访问速度,我们引入缓存中间件,为应用层与存储层提供一个缓存的过程,避免所有相同的数据查询操作的流量都落地到数据存储层;同时我们还看到接入层节点抑或是网关服务节点要实现高可用保证,需要引入负载均衡中间件实现高可用;再或者应用层与实现分片的数据存储层进行数据交互,为简化开发以及查询匹配等因素引入数据库中间件,从而对于应用层仍然可以透明地对数据存储层进行 CRUD 等操作,而无须关系数据匹配以及一致性等问题。
SOA 与微服务架构
SOA为面向服务的架构,是属于一种设计方法,每个服务之间都相互独立且通过网络进行服务调用来完成一次复杂的业务请求操作;微服务架构是在 SOA 的基础上演进而来,强调组件化与服务化,每个组件提供独立的服务可以实现可伸缩性的扩展。可以独立开发,设计,部署与优化而不影响微服务中其他的组件。
分布式协调
其一分布式的多个服务节点之间的业务处理逻辑仍然需要保证与单体架构执行的业务逻辑处理顺序一致,即保证服务节点处理业务请求的逻辑具备有序性;其二是对于共享资源的争用,在单体架构中我们通过加锁的方式来保证并发处理共享资源的安全性,同理对于分布式的多服务节点对共享资源进行事务操作的时候我们也需要协调各个服务节点的并发控制,保证系统服务中的共享资源的事务操作具备原子性以及数据一致性。因此,对于分布式协调我们可以理解一个是协调服务节点来保证业务处理的有序性,一个是协调服务节点来保证并发操作共享资源的原子性以及数据的一致性。
服务治理
对于服务治理的理解,我们需要切换一个维度,此时应该从分布式服务化的架构设计上来看待问题,那么服务与服务之间的通信流程如下:服务启动并注册到注册中心 - 调用方从注册中心获取被调用方的服务列表 - 调用方通过负责均衡的方式选择服务 - 调用选择的服务,此时通过网络传输的方式传递消息 - 被调用方接收到消息并执行调用返回, 这里涉及到业务拆分成独立服务,服务注册,服务发现,服务依赖以及服务调用链等关系,服务治理就是需要将服务之间的依赖与调用链全部梳理出来统一存储和管理,这样子我们就能够针对各个服务进行分析与优化等操作。
DevOps&自动化运维
利用 CI&CD 等持续集成工具来完成一系列业务服务的发布流程,即代码 review 后提交 - 测试-单元测试-打包-集成测试-UI测试-测试环境发布部署服务-预生产灰度发布服务-发布全网服务等一系列流程可以称为 DevOps 全流程,这对于我们做服务化架构能够实现快速迭代开发;有了 DevOps 之后,我们就可以针对我们的业务服务进行自动伸缩,故障转移,配置管理,状态管理等一系列自动化运维工作。
分布式架构设计
高性能设计
集群与负载均衡
缓存设计
在我们的上述服务进行水平抑或是垂直扩展的时候,这个时候我们的业务吞吐量也会增加,这个时候会把所有的流量压力打到数据存储系统上,为了缓解数据存储系统的压力,这个时候我们会考虑将数据进行冷热划分,对于热点数据集中在缓存系统服务以降低我们的数据存储压力。对于缓存的设计存在以下三种模式:
其一是 Cache Aside 更新模式,即失效 - 命中 - 更新策略;
其二是 Read/Write Through 更新模式,即缓存更新对应用程序透明,对于应用程序而言只有一个数据存储操作,由 Cache 负载更新数据操作;
其三是 Write Back 模型,类似于Linux下的 Page Cache 算法,应用程序直接将数据更新到 Cache中,由Cache异步批量更新到数据库中。
垂直拆分业务(服务化设计)
数据镜像与分区(读写分离/分库分表)
借助MQ中间件实现异步处理
数据异构设计
高可用设计
服务冗余与负载均衡技术
隔离技术
降级与限流技术
当系统承担的并发流量服务压力十分庞大的时候,这个时候我们需要采取保护措施,通过降级或者限流的技术来停用部分业务服务或者是拒绝部分用户的请求操作以确保整个系统不会被流量冲垮导致整体不可用。
超时重试与熔断
高可用架构设计
高可用的运维
缓存的高可用
-
缓存穿透 :即对于不存在的数据缓存始终都是没有命中会直接将流量打到数据存储层上。 -
缓存雪崩 :即在某一个时刻,所有的缓存都失效过期,这个时候流量都会打到数据存储层,很容易引起数据存储层的并发性能问题。 -
缓存击穿 :即针对某一个热点缓存在某一个时间点存在并发访问量请求并且当前时间点缓存时间已经过期需要刷新缓存,这样也会将流量打到数据存层上。
因此对于缓存的高可用不仅需要避免单点故障,同时还需要具备容错能力,比如增加布隆过滤器来控制缓存穿透,根据不同的业务场景可以采取随机时间段的缓存时间来避免同一个时间点缓存失效以及对于具备热点的共享资源缓存操作,需要借助中间件的协调者来管理和控制我们的应用服务的操作避免缓存击穿的产生。
切流量
可回滚
在分布式的服务化架构设计,我们需要对服务实施版本控制与管理,一旦新发布的服务节点产生测试不可预知的错误,为了减少服务不可用时长抑或是服务的覆盖面,我们需要对服务进行回滚到上一个稳定版本以保证线上服务可用。
业务设计
防重与幂等设计
当我们应用在单位时间内接收到相同并发的事务请求操作时,这个时候我们需要考虑事务请求操作处理不论多少次请求最终只能处理一次,这个时候可以通过设计防重key或者是防重表来保证我们只处理一次请求。比如下单支付操作,由于支付渠道是无法避免重复支付的,因此对于我们系统服务而言就需要根据业务场景设置防重 key 来保证订单服务抑或是将支付记录在数据表并通过数据表进行查询验证,如果并发量很大的话,我们可以考虑通过 MQ 来接收支付渠道回调的响应结果并通过鉴权验证之后提交到 MQ 消息队列中,再由 MQ 分发给消费者,这个时候就需要保证幂等,防止重复消息的消费。
事务补偿机制
状态机设计
后台系统可反馈
分布式服务指标监控
-
基础层:主要监控底层以及资源情况,如CPU/内存/网络/磁盘IO/带宽流量等。 -
组件层:主要监控我们引入的中间件,比如Redis/MQ等,都需要对组件的容量/io/内存/线程/服务节点健康状态等指标进行监控。 -
应用层:一般是我们的业务服务上的监控,这个时候我们更关注服务依赖,服务调用链,日志收集,QPS 或者 TPS 等指标监控。
分布式技术小结
分布式设计思考的维度
两个目标
-
提高系统的性能 -
保证系统服务的高可用
宏观的架构技术栈
-
全栈系统监控: 单机的基础监控 - 中间件服务监控 - 应用服务监控 -
服务/资源调度: 计算机资源调度 - 服务资源调度 - 架构调度 -
流量调度: 流量控制 - 流量管理 - 服务治理 -
状态/数据调度: 数据可用性 - 数据一致性 - 数据分片 -
DevOps 与自动化运维: 基于上述的基础完成一系列的开发 - 版本提交 - 单元测试 - 打包 - 集成测试 - UI 测试 - 发布测试环境 - 预生产环境发布 - 灰度发布 - 正式发布.
业务服务化设计
-
性能与可伸缩性设计 -
高可用设计以及消息投递保证高可靠 -
业务设计原则 -
全栈系统监控
分布式面临需要解决的问题
技术架构面临的问题
-
服务节点如何崩溃恢复 -
分布式缓存问题 -
共识问题 -
流量控制(降级限流等策略) -
整体架构的监控 -
自动化运维
服务化架构面临的问题
-
数据一致性与分布式事务 -
共享资源与分布式锁 -
服务治理 -
服务持续集成流程(DevOps) -
服务架构的垂直拆分粒度以及产生的数据一致性问题 -
不同团队协作完成服务的开发与管理等问题
分布式理论知识
分布式理论基础
共识问题
CAP & BASE 理论
ACID & 2PC & 3PC
分布式协议与算法
-
Paxos 算法 -
Raft 算法 -
一致性 hash 算法 -
Gossip 协议 -
Quorum NWP 算法 -
PBFT 算法 -
Zookeeper 的 ZAB 协议
老铁们关注走一走,不迷路
本文分享自微信公众号 - 疾风先生(Gale2Writing)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4225726/blog/4332525