【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>>
发展前景
随着互联网的发展,各种应用系统被广泛应用,近年来国家倡导的凡事可追溯,更是加快了数据的增长速度。海量的数据堆积在我们面前,于是聪明的人类开始从数据中发掘价值,研究已有数据成了一门新的学问。数据中究竟隐藏着哪些信息呢?首先是用户的习惯,通过数据分析我们可以发现用户的习惯,推测其喜好和意向,有目的性的进行推荐,既能相得益彰又能各取所需;第二个信息是发现存在的问题,通过整体统计分析,可以反观问题所在,规避风险。当然数据中隐藏的信息远不止如此,这些信息对于决策者来说都是宝贵的资料,是决策者做出决策的重要依据。
决策支持系统就是为决策者提供所需数据依据的系统,它最重要的是进行查询分析,即联机分析处理(OLAP)。我们知道,数据库进行查询时会上“读锁”,这意味着无论多少并发查询,相互之间不会造成影响,此时就非常考验数据库在联机分析处理方面的性能,为了保证系统的性能,数据库测试成为了必然。
基准介绍
TPC-DS基准就是基于决策支持系统的数据库性能测试基准,它以商品零售为蓝图,描述了店铺、网上、目录三种销售渠道的交易信息以及库存信息和促销活动,其数据经过提取、转换、加载三个步骤(简称ETL)注入并更新数据仓库,如下图:
TPC-DS基准的数据仓库包含7张事实表和17张维度表,数据仓库内部采用星型模型和雪花模型混合构建。基准构造的99条复杂SQL语句模拟决策者的查询,数据库处理后,返回结果并统计测试进行报告,从而衡量数据库的性能。
TPC-DS基准是一个全方位的基准,其过程约束性体现在测试流程上,如下图:
TPC-DS基准测试将吞吐率测试进行了两轮,一方面是基准始终不忘查询分析的重点,将其赋予相当的权重;另一方面,结果中的时间是按照木桶原理(最短的板子决定木桶的容量)进行计算的,取的是时间最长的情况,为了平衡测试的偶然性,更加准确的衡量数据库性能,所以进行两轮吞吐率测试。
吞吐率测试2结束后,查询任务就完成了,为何还要进行数据维护2?
TPC-DS基准是基于现实的基准,高度仿真不仅体现在数据和业务上,还体现在完备的流程上,它不单纯以测试为目的,还具有一定的现实意义,这一点在结果计算公式中也纳入一定权重。
来源:oschina
链接:https://my.oschina.net/u/4440548/blog/3155183