系统架构:分布式ID那点事儿
原文: https://zhuanlan.zhihu.com/p/107592567 全局唯一 不能出现重复的ID号,既然是唯一标识,这是最基本的要求。 趋势递增 为什么要趋势递增呢? 第一,由于我们的分布式ID,是用来标识数据唯一性的,所以多数时候会被定义为主键或者唯一索引。 第二,大多数互联网公司使用的数据库是MySQL,存储引擎为innoDB,对于BTree索引来讲,数据以自增顺序来写入的话,b+tree的结构不会时常被打乱重塑,存取效率是最高的,在主键的选择上面我们应该尽量使用有序的主键保证写入性能。 单调递增:保证下一个ID一定大于上一个ID,例如事务版本号、IM增量消息、排序等特殊需求。 信息安全 由于数据是递增的,所以,恶意用户的可以根据当前ID推测出下一个,非常危险,所以,我们的分布式ID尽量做到不易被破解。如果ID是连续的,恶意用户的扒取工作就非常容易做了,直接按照顺序下载指定URL即可;如果是订单号就更危险了,竞对可以直接知道我们一天的单量。所以在一些应用场景下,会需要ID无规则、不规则。 数据库自增方案缺点: 1.高并发下性能不佳,主键产生的性能上限是数据库服务器单机的上限 2.水平扩展困难,严重依赖数据库,扩容需要停机 Flicker方案: [flicker算法原文] http://code.flickr.com/blog/2010/02/08/ticket