HBase的使用
前言 HBase是一个高可靠,高性能,面向列,可伸缩的分布式存储系统,适用于结构化的存储,底层依赖于Hadoop的HDSF,利用HBase可以在廉价PC server上搭建起大规模结构化存储集群。HBase被广泛应用于大数据存储解决方案中。 HBase 特点 HBase优点: 列可以动态增加,列为空不会存储数据,节省存储空间 自动切分数据,是的数据存储具有水平扩展性 可以提供高并发读写操作的支持 HBase缺点: 不支持条件查询,只支持按照Row Key来查询 不适合传统的事务处理或关联分析,不支持复杂查询 如果应用中的数据每行结构都有差别,可以适用于HBase存储松散数据。可以动态增加列,如果列为空不会存储数据,如果提供的数据存在一个主键,可以依靠HBase的rowkey提供高效查询。 HBase使用场景 卖家操作日志 用来记录商家操作的日志系统,保证商家可以精确查询自己各种操作。卖家无时无刻不再操作,所以卖家操作日志具有数据量大,实时性强,增多查少特点。 最初的设计是将操作日志放到ES中,操作日志数据量大,当时ES资源有限,所以将最近三个月的数据存储到ES中,而长期数据存储使用HBase进行。 消息日志存储 消息日志用来进行全链路追踪及消息的统计分析,每天有几千万消息量。消息追踪要求实时性,多维度精确查询,将最近一周消息日志存储在ES中,在定期将HBase中数据倒入数据集市中