医疗大数据解决方案
医疗大数据生命周期 在阿斯克医疗大数据方法论中,把医疗数据的生命周期分成下图的四个象限: 第一象限 :数据采集 在数据采集阶段,医院通常会使用关系型数据库(例如Oracle,DB2,MySQL……),其核心诉求是要保障数据的完整性和一致性,确保数据不会因为软硬件故障而遭到损失。此外,随着互联网流量的引入,数据的联机处理量级和效率也成为一个重要的考量。一些医院为提升联机事务的处理效率,引入分布式数据库以满足互联网流量下高并发访问的需求。 第二象限 :数据整理 每个医院有很多不同的业务系统,这些系统会采用相对独立的数据库来存储和处理不同的业务数据。通常系统使用的关系型数据设计容量有限,需要定期把历史数据清理到中心数据仓库,从而确保联机交易处理的快速高效。中心数据仓库是为了存储各个独立系统的历史全量数据,同时汇集各个系统的数据,因而在设计上会采用分布式可扩展的技术架构,通过例如Hadoop, Spark等技术保证可以用低廉的成本,对整个集群容量和处理能力进行无缝扩展。 第三象限 :数据分析 用户需要利用数据资产创造价值。首先,来自各个分立系统的历史全量数据可以进行关联查询,通过批量处理构建不同维度的数据分析表,驱动BI和报表展示。然后,基于全量数据的探索式分析,可以对各个系统的数据执行相关性分析,依赖先进的机器学习算法发掘新的商业规则,并利用数据规律影响指导决策。 第四象限 :数据决策