前沿 | VLDB论文解读:阿里云超大规模实时分析型数据库AnalyticDB
前言 一年一度的 数据库领域顶级会议VLDB 2019 于美国当地时间8月26日-8月30日在洛杉矶召开。在本届大会上,阿里云数据库产品团队多篇论文入选Research Track和Industrial Track。 本文将对入围Industrial Track的论文《AnalyticDB: Realtime OLAP Database System at Alibaba Cloud》进行深度解读。 1、背景 随着数据量的快速增长,越来越多的企业迎来业务数据化时代,数据成为了最重要的生产资料和业务升级依据。伴随着业务对海量数据实时分析的需求越来越多,数据分析技术这两年也迎来了一些新的挑战和变革: 1) 在线化和高可用、离线和在线的边界越来越模糊,一切数据皆服务化、一切分析皆在线化; 2) 高并发低延时,越来越多的数据系统直接服务终端客户,对系统的并发和处理延时提出了新的交互性挑战; 3) 混合负载,一套实时分析系统既要支持数据加工处理,又要支持高并发低延时的交互式查询; 4) 融合分析,随着对数据新的使用方式探索,需要解决结构化与非结构化数据融合场景下的数据检索和分析问题。 图1 阿里巴巴分析型数据库发展历史 阿里巴巴最初通过单节点Oracle进行准实时分析, 后来转到Oracle RAC。随着业务的飞速发展, 集中式的Shared Storage架构需要快速转向分布式