IGAL可视化讲习班-6:基于智能可视化的电子病历分析及辅助诊疗技术 – 曹楠

12月27日上午,来自同济大学的曹楠教授为大家带来了题目为《基于智能可视化的电子病历分析及辅助诊疗技术(Visualization in Health Informatics)》的讲座,详细阐述了可视化在医疗信息领域的应用。

图1 同济大学曹楠教授授课

曹教授首先向大家介绍了可视化技术在智能医疗领域的发展现状和挑战。美国国家医学院白皮书中指出,医疗领域的所有技术中,可视化尤为落后,需要大力发展来加强更新换代。而且传统的可视化工作多集中在X光、CT扫描、流渲染、外科手术、VR/AR等图形图像处理相关领域。针对非影像型数据的可视化工作存在较大的缺失,比如电子病例数据可视化;在精神医学研究中,患者的社交媒体信息也是医生们需要重点分析的数据。然而传统的可视化工作很少能够聚焦于这类数据。

为了解决上述问题,智能医疗领域提出了Health2.0的概念,如图2所示。Health2.0包括了个人健康信息(移动设备中的传感器)、诊断信息(电子病历)、公共健康信息(社交媒体数据)等可利用的数据,结合高级统计方法的大数据可视化分析,从而实现辅助医疗的效果。目前,Health2.0的可视化相关研究主要集中在三个方面:

  • 显示个人健康信息:面向没有技术背景的普通用户,可视化设计较为简单,可读性强。大多能够在移动设备上进行操作,操作时间较短;
  • 显示临床健康信息:面向具有一定技术基础的用户,往往涉及其他领域的技术,如机器学习、模式识别等等;
  • 显示公共卫生信息:面向经验丰富的统计人员,他们需要处理大量数据来测试复杂的假设,这些假设可能会导致公共卫生或医疗保健方面的大规模变革。这类研究多为统计类可视化,往往用来做宣传和演示。

图2 Health2.0:结合高级统计方法的大数据可视化分析,实现辅助医疗

接下来,曹教授就前两个方面进行了详细的介绍。对于显示个人健康信息的可视化工作,曹教授以patientslikeme网站为例进行了说明。患者可以将自身疾病状况分享到patientslikeme网站上,与其他患者交流。网站收集患者分享的数据并进行统计分析,发表研究报告,或有偿的卖给药厂或其他科研机构。用户输入的所有数据将以一种在一系列图表中显示其总健康历史的方式反映给他们。用户也可以直接从其他患者的第一手资料中查找有关疾病的大量的治疗,症状的报告。

对于显示临床健康信息的可视化工作,大多是针对电子病历数据的可视分析。然而,电子病历数据没有统一的标准,数据类型多样,同时包含结构化数据和非结构化数据,即异构数据。这些特性给可视化工作带来很大挑战。但同时,电子病历都包含了时间信息。因此,这类数据常被建模成事件序列数据,比如:得病 – 住院 – 治疗 – 康复。分析事件序列的集合可以揭示常见的或语义上重要的序列模式。对于大规模事件序列数据,由于其具有数量大、时间跨度长的特点,需要做数据汇总,曹教授给我们总结了目前的医疗可视分析的三大挑战:

  1. 模式提取:如疾病的发展规律、诊疗方案的结果等。不同人群使用不同的诊疗方案可能会有不同的结果,需要进行比较;
  2. 预测:根据历史模式,预测患者康复概率、并发症概率等,具有很大的临床意义;
  3. 因果关系分析:什么因素导致了患者的康复或疾病的恶化。

曹教授特别针对模式提取这一研究方向列举了几个研究工作:Event Flow [1] 工作把关注点放在事件发生的顺序,将事件分类,然后合并不同病人的相同的事件并左对齐,按照水平方向排列。再把所有个体按照垂直方向排列,把相同事件合并。但可视化结果在数据量大时尤为混乱,且可读性不强。Care Flow [2] 改进了Event Flow,这项工作能够帮助用户从事件结果回溯整个事件发展的过程。Decision Flow [3] 则是过滤掉了研究人员认为不重要的事件,只留下主要事件。并基于检索的方法选取了关键事件,支持在其中动态地加入其他事件,过滤出用户感兴趣的事件。缺点是丢失了太多的细节信息,但这些信息对医生是有意义的。

另外,他重点介绍了EventThread [4],这是一个基于事件序列数据进行可视化总结和阶段分析的工作,如图3所示。现有的方法侧重于通过统计分析来提取事件的明确匹配模式,以创建随时间变化的事件进程的阶段。然而,这些方法未能捕捉到相似但不完全相同的事件序列演化的潜在簇。EventThread引入了一个新的可视化系统,通过无监督式学习技术做总结,使用TF-IDF提取文本主题信息,形成事件序列。并把关键的事件过滤出来,把事件序列切分成若干阶段,按照事件发展将事件序列分类。通过用户与专家的访谈,在三个不同应用领域的使用场景证明了事件线程的有效性。

图3 EventThread:基于事件序列数据进行可视化总结和阶段分析的可视化

由于EventThread中对阶段的划分是人为的根据时间按年划分的,但实际上这是不合理的。因此结合挑战2,曹教授的团队后续还对该工作进行了改进[5],每个事件用一个向量表示,类似于word2vec的方式,通过深度学习来提取特征向量的相似度进行聚类,从而可以自动地划分出阶段,具有很大的实用价值。

图4 为曹楠教授颁发纪念牌

最后,来自北京工商大学的陈谊教授为曹楠教授颁发了纪念奖牌,感谢他带来的精彩演讲。

参考文献:

[1] Monroe M, Wongsuphasawat K, Plaisant C, et al. Exploring point and interval event patterns: Display methods and interactive visual query[J]. University of Maryland Technical Report, 2012.

[2] Perer A, Gotz D. Data-driven exploration of care plans for patients[C]//CHI’13 Extended Abstracts on Human Factors in Computing Systems. ACM, 2013: 439-444.

[3] Gotz D, Stavropoulos H. Decisionflow: Visual analytics for high-dimensional temporal event sequence data[J]. IEEE transactions on visualization and computer graphics, 2014, 20(12): 1783-1792.

[4] Guo S, Xu K, Zhao R, et al. EventThread: Visual Summarization and Stage Analysis of Event Sequence Data[J]. IEEE transactions on visualization and computer graphics, 2018, 24(1): 56-65.

[5] Guo S, Jin Z, Gotz D, et al. Visual Progression Analysis of Event Sequence Data[J]. IEEE transactions on visualization and computer graphics, 2019, 25(1): 417-426.

评论关闭。