数据仓库设计

好久不见. 提交于 2020-01-13 18:51:25

数仓设计

  • 维度建模

    以维度为标准 开展数据的分析需求

    适用于面向分析领域的理论。比如分析型数据库 数据仓库 数据集市(OLAP)

    • 事实表

      分析主题的客观事件度量  是分析主题的数据聚集  事实表中一条记录往往对应着客观的一个事件
      往往是一堆主键的聚集 
    • 维度表

      所谓的维度就是指看待问题的角度 可以通过不同的维度去分析同一个事实表 得出不同的分析结果
      维度表可以跟事实表进行关联查询
  • 多维度数据分析

    所谓的多维数据分析就是指通过不同维度的聚集计算出某种度量值。

    常见度量值:max min count sum avg topN

    举个栗子:统计来自于北京女性24岁未婚的过去三年购物金额最多的前三个。
    ​
    维度:地域  性别  年龄  婚姻  时间
    度量值:sum(订单金额)--->top3
  • 维度建模的三种模式

    • 星型模式

      一个事实表多个维度表 维度表之间没有关系  维度表跟事实表进行关联  企业数仓发展初期常见的模型
    • 雪花模式

      一个事实表多个维度表  维度表可以继续关联维度表  不利于后期维护 企业中尽量避免演化成该种模型
    • 星座模式

      多个事实表 多个维度表   某些维度表可以共用  企业数仓发展中后期常见的模型
  • 维度建模
    	1、星型模式		重点
    		在项目初期会用到,表的数量较少
    	2、雪花模式
    		不推荐使用,关联复杂,不利于后期维护
    	3、星座模式		重点
    		在项目后期使用,可以找到相同的分析维度,建立关联,多个星型的模式
    多维度数据分析
    	时间维度、地理维度、内容维度、人群维度(男、女)

     

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!