本篇博客用于记录本人听取IGAL九期班曹楠老师报告的学习记录。曹楠老师的报告主要讲述的是《可视化在医疗信息上的应用》(Visualization in Health Informatics)。在2011年的美国国家医学报告中指出:相比其他技术的发展,可视化在医疗领域的发展尤为落后。传统的医疗可视化的应用有X-Ray、CT、模拟手术(VR和AR)等,但可视化在医疗领域存在缺失,如电子病历、看一个人的精神是否正常可以通过他的社交信息来分析等,一些医疗领域的信息在可视化上没有很好的应用。进而,曹老师提到了由美国率先提出的具有跨时代意义Health 2.0的概念,从而进入本次课程的主题。
Health 2.0就是通过采集一个人的社交相关的数据、移动设备的数据、个人传感器的数据等与他健康所有相关的数据来帮助医生做辅助诊疗,帮助医生做医学上的判断,继而这些收集到的数据全部都可以用来做可视化,可视化的母的是帮助医生或帮助患者自身来判断他自身的情况。数据可视化如何在医疗2.0上应用可分为三个层面:
- 显示个人健康信息:如每天走了多少步、心跳次数是多少、血压值是多少等类似的个人信息。
- 显示临床健康信息:如用户看过什么病,看病后吃过什么药等信息
- 显示公共卫生信息:比如疾病是怎样的扩散的、怎样从一个地方扩散到另一个地方,起到一种信息汇总的作用。
针对这三个层面,曹楠老师在报告中主要讲解了第二个层面,少量涉及了第一和第三个层面。
一、展现用户的个体健康信息
对于用的个体信息展现一般都是给用户看的,这样的可视化图形要求简单明了和易懂。Patientslikeme 网站可以分享自己个人的生病信息数据,然后网站可以在信息库里用图表示和你有相同症状的病人信息及过程。
患者档案-用户输入的所有数据将以一种在一系列图表中显示其总体健康历史记录的方式反映回来。理想情况下,它会照亮事情进展顺利的地方以及原因。
同时将这些数据有偿的卖给医院和药厂分析。
二、展现电子病历数据的可视化
包括所有的文本信息、化验报告、拍片报告等任何在医院里收集的信息
这些数据分析上的问题
1、没有统计的规范及标准
2、数据多样性的异构数据
由于每个病历中不变的是时间,所以常见的电子病历信息会根据时间被建模成事件序列数据(由一个事件组成的时间序列数据)
出现的问题:时间长、数据量巨大
三个问题
1、怎样得到的模式:
- 疾病的发展的规律
- 诊疗方案所带来的结果
Event Flow事件流
由于该方法存在展现不清晰,数据流较大时难以辨认,于是曹楠老师与同事在此基础上做了改进的研究:
Care Flow
使用了桑基图,左侧板仍然代表一组病人,带的宽度代表病人的数量,线的连接代表有多少个人从上个阶段跳转到下一个阶段,根据下一阶段的状况把病人分成了若干组,接下来又根据每一组的不同状况继续往下分,最后绿色代表康复,红色代表死亡。
Decision Flow
由于不同的病人的Event Sequence的长度是不同的、同时发生事件的顺序和规律也是不一样的。如有些人是直接从A事件到达B事件,然而有些人的情况较为复杂会通过A事件到C事件再到达D事件然后再到达B事件,虽然符合同样的模式但过程不同。 为了把其中的小的事件过滤掉,曹老师又做了以下工作:
选取一些最关键的事件如M0和M1,同时还可以选择一些其他的事件如M2,,把直接从M0到M1的事件划为绿色的事件,高度代表病人数量d,代表平均经历的天
这个可视化存在的细节:丢失了细节信息,进而提出了EventThread V1.0通过无监督式学习的方法去做Summarization(概要)
每根线表示一个诊疗方案,事件通过圆形的点来表示,同时将诊疗方案切割成了若干个阶段,然后可以看到在每个阶段发生的信息。
研究过程:
- 找到最常见最关键的事件提取出来,把一些不关键的自动分析出来并且提出掉。(使用TF-IDF)
- 把事件序列进行对其(左对齐)
- 去切分他的阶段,阶段的信息由人为来切割
- Tensor Analysis
2、怎样做预测:预测下一个事件的概率由多大
相关工作:
1、研究并开发了一个为患者做预测的系统
使用可解释性的深度学习模型来做预测,并且通过可视化增强模型的可信度
2、心电图的预测分析
由于心点图的数据量的巨大,一秒十二次,使得这样的数据医生无法去读完,故此曹老师的研究通过深度学习的方法,将有问题的心电图从大量的数据中摘出来,然后用可视化的方法展现出来,让医生更好的去标记有问题的心电图的片段。
3、怎样分析因果关系分析,如吃药以后康复,想要知道到底是什么因素使得他康复,是因为某种药还是其他。
来源:https://blog.csdn.net/weixin_41784648/article/details/99556937