一、是什么
- 官方解释:面向主题的、集成的、相对稳定、反应历史变化,用于企业的管理决策分析。
- 开发者角度:通过接入各种数据源,打破数据壁垒,根据业务方的需求,设计方便使用和准确的数据模型,高效将结果输出给业务方。
- 业务方角度:能快速准确提供数据,给公司的日常运营和领导决策提供数据支持和指导。
二、如何建立
1、分析业务需求、确认仓库主题
例:领导想看各部门GMV、毛利情况。运营团队要了解各个渠道的订单转化率,商品、品牌、品类、销售情况。用户团队关注用户相关的销售、商家团队关注商家的销售…
通过业务需求分析,需要做一个销售交易相关的主题
2、确定总线矩阵
维度:用户维度、商品维度、商家维度、订单渠道维度
业务过程:用户下单、支付成功、确认收获
3、设计分层架构
一般是业务接入层、明细层、汇总层、应用层
A、业务接入层:同步订单、用户、商家、商品、订单渠道相关的业务表到仓库中,不做任何清洗操作。
B、一致性维度:目标是尽量丰富维度属性,但是又不要过度运算,保证核心维度模型的整洁性,做好维度属性的整合和拆分。(商品表:对于产出快且使用率高的维度属性,比如名称、品牌、品类等,可放在商品基础维度表。但对于产出慢且使用率低的维度属性,比如上市季节、上架时间等,可放在商品的扩展维度表)。
C、明细层:保证粒度最细,使用退化维度的方法,将常用的维度属性加入明细表中。
D、汇总层:对于业务常关注的维度,对明细表进行加工汇总。(用户团队关注用户维度的数据指标,比如每个用户的下单、支付的商品数量和对应金额。
E、应用层:比如在做用户画像时、对于下单支付这块:用户常用的收货地址、下单常见时间段、是否冲动性购买类型、购买偏好品牌品类。
4、规范约束
5、维度建模
6、任务调度、数据质量、元数据
7、BI、OLAP
来源:CSDN
作者:阿武z
链接:https://blog.csdn.net/xw514124202/article/details/104100480