银行数仓体系发展之路
银行的数据仓库往往汇聚了银行主要系统的客户、业务、财务等数据,为银行的日常运营分析、市场营销、风险控制、财务分析、内部审计、监管报送提供数据支持和服务。 银行的数字化实践必须建设好数仓体系。 数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库之父比尔在著作《B uilding the Data Warehouse 》中提出数据仓库的特征: 面向主题的 集成的 保留历史的 面向决策支持的 面向全企业的 最明细的数据存储 数据快照式的数据获取 数据集市和数据中台,是与数据仓库有关的两个概念。 数据集市是数据仓库的一个子集,用于从数据仓库获取相关的数据加工后提供给用户。数据集市通常面向特定的业务或者团队,如市场部门有对应的营销数据集市,运营部门有运营数据集市。 银行的数据集市包括财务、营销、风险集市等。这些集市为对应的数据系统提供数据加工,此外也为各业务部门数据分析人员提供分析集市,在数据仓库提供相关数据后,由业务人员自行进行数据探索分析。通常我们认为,银行的数据仓库体系一般包括了数据集市,数据集市其实是作为数据仓库体系的一部分。 另一个概念则是数据中台。 如今数据应用到业务场景里的需求大幅增加,需要和应用系统打通,并把数据应用于业务分析。这也要求数据仓库有数据中台的概念。但由于原来数据仓库的架构都打得很坚实,因此倘若想调整架构去支撑业务