Bio+Med+Vis Spring School Day 4

2021年5月20日,生物医学可视化春季学校的第四天的主要内容有生物医学时变数据可视化、有氧呼吸过程模拟和动画、视觉传达设计考虑的因素、优秀博士生养成经验分享、网络可视化和数据可视化的色彩基础。

生物学时变数据的可视化(Visualization of Biological Time-varying Data)

维也纳科技大学的Silvia Miksch教授介绍了医学时变数据的可视分析。医学数据形式多种多样,面对的用户和任务也不尽相同,此外,它们还可能具有时变的性质。在介绍了一些可视分析的内容后,Miksch教授通过例子带我们了解针对医学时变数据的可视分析工作。CareCruiser [Gschwandtner et al. PacificVis 2011]针对医学专家和医生用户,帮助他们分析病人数据和治疗方案,以探索临床行动对病人病情的影响。它将时间映射成二维的静态表示,使用线图和点图对病人的参数进行可视化,并使用分类方法来确定哪个值高于、等于、低于预期值范围。Gnaeus [Federico et al. EuroVA 2015]针对医学专家和医生用户,帮助他们分析患者组群和治疗方案,以检测时序模式(图1)。它使用树可视化由子计划和行动组成的临床指南(A),将选定子计划的程序性知识显示为一个节点-链接分层任务网络(B),使用箱形图展示与所选子计划相关参数原始数据在患者群中的汇总(C),以LifeLines [Plaisant et al. AMIA 1998]的形式显示原始数据根据子计划声明性知识的抽象化(D),整合临床行动执行及其与指南建议的符合性计算(E),使用堆叠条形图展示由组合镜头定义的抽象概念的分布(F),使用鱼眼视图展示病人的摘要(G)。EventFlow [Du et al. TVCG 2016]是一个用于分析事件序列的可视分析工具,它帮助可视化和检查来自单个记录和其事件序列的数据;搜索感兴趣的时序模式;总结所有事件序列并发现异常情况;进行数据转换以揭示有用的模式;选择感兴趣的群组进行进一步研究。In Search of Patient Zero [Baumgartl et al. TVCG 2021]是一个支持对传播途径、病人接触、疫情进展和病人住院期间时间线进行分析的可视分析工具(图2)。疫情曲线视图显示感染病人的数量(1)。接触网络视图显示病人接触者为一个网络(2)。传播途径视图显示联系人和感染状态(3)。追踪交互显示潜在的感染传播事件。患者事件细节显示在患者时间线视图中(4)。


图1:Gnaeus用户界面。

图2:In Search of Patient Zero用户界面。

Miksch教授在最后总结了可视分析在医疗保健方面的七个挑战,它们分别是1)面向时间和空间数据的规模和复杂性,2)将病人情况与治疗过程结合在一起,3)从单个病人到病人群组的可扩展分析,4)数据质量和不确定性,5)交互、用户界面和用户作用的设计,6)评估,7)指导。

马萨里克大学的Barbora Kozlikova教授介绍了生物化学中的时变数据的可视化。在生物化学领域中,分子动力学是很重要的一支,它的研究内容包括捕捉粒子的运动、分子的行为和一段时间内分子的交互行为,往往区分蛋白质的功能依靠的就是它们的序列、结构和动力学。分子动力学的主要挑战在于很多分子交互需要长时间的模拟运行,整个过程包含百万量级的帧,因而无法使用动画的形式来观察,现状是生物化学家选择使用统计信息分析,但缺乏空间表达理解分子运动的过程难度变得极大。有两种解决的方法,一种是聚集,用一张图来抽象概括动态的过程,优点是很好地体现了空间特点,但缺点是会遗漏可能有趣的细节。例如在[Lv et al., PLoS ONE, 2013]的工作中通过变化的半径和颜色来表达蛋白质柔性随时间的变化(图3),红色代表柔性更好。


图3:通过聚集的方法展示一段时间内蛋白质柔性的变化 。

另一种方法是做导航,只模拟感兴趣的部分,优点是可以无损地观察具体的过程,缺点是需要一个可靠的方式来帮助检测定位感兴趣的事件。一个有趣的事件,指的是当某一物理化学参数发生明显变化时,例如位置变化、蛋白质间的反应速率变化、能量变化等等。例如在[Duran et al., IEEE TVCG, 2019]的工作中通过多个折线图展现分子不用部分的速度、能量、距中心距离等参数随时间的变化,帮助用户快速观察定位到特定的事件,进而观察短时内具体的分子变化。


图4. 通过导航的方式让用户找到分子运动的特定事件 。

最后,Barbora Kozlikova教授总结到通过以上两种方法并没有完全解决帮助生物化学家理解分子性质随时间变化的整个过程,也许在将来可以使用机器学习的方法来帮助理解和检测分子参数的变化。

从葡萄糖到ATP的有氧呼吸的动态多酶途径(The Dynamic Multi-Enzyme Pathway of Aerobic Respiration, from Glucose to ATP)

来自澳大利亚墨尔本沃尔特和伊丽莎·霍尔医学研究所的Drew Berry研究员讲述了利用图像渲染和动画展示有氧呼吸生物过程的项目。主要展示柠檬酸循环(图5)、电子传输链和ATP的动态生成过程(图6)。此外,还介绍了在终端设备用AR展示生物结构,360度影院和COVID-19结构的图像和动画。youtube主页为:https://www.youtube.com/user/WEHImovies,上面有许多精彩的可视化动画,欢迎大家观看。


图5:柠檬酸循环 。

图6:ATP的动态生成过程,可调节生成速度 。

生物医学主题视觉传达中要考虑的因素(Factors to Consider in Visual Communication of Biomedical Topics)

来自卑尔根大学和莫恩大学医学影像与可视化中心的博士生Laura Garrison给我们讲述了在利用视觉传达生物医学主题时需要考虑的多方面因素。Laura Garrison曾经是一名生物医学艺术家,而后被健康数据的可视化解读深深吸引,现在的研究方向是生物医学的视觉编码和交互设计(图7)。


图7:Laura Garrison的研究工作的一些可视化结果 。

视觉传达生物医学主题的流水线包括理解、定义、设计(ideate)、开发和验证五个阶段。在理解阶段,需要思考设计的空间,受众已知的内容以及实现目标与前者的差距,而差距是在设计阶段要特别注意的。在定义阶段,要确定问题,潜在的受众以及为什么向这些人群传达这个问题是重要的。在设计阶段,要从叙事方式、情感等方面入手讲好整个故事,同时应该积极地和利益相关者(stakeholders)沟通,也要考虑时间和空间上的限制。在开发阶段,除了开发和确定早期的概念,还需要不断反思产品的功能与设想是否契合。在最后的验证阶段要验证产品是否支持目标,可以使用案例分析的方式,更好的是邀请受众来评估。

如何做一名成功的视觉计算博士(How to do a Successful PhD in Visual Computing)

来自维也纳工业大学的Eduard Gröller教授给包括视觉计算领域在内的博士研究生们带来了科研的经验分享。他提到博士研究的动机是科研兴趣而非未来挣更多的钱或者更好的工作机会,只有这样才能成就出色的工作并顺利毕业。

博士研究是一个非结构化的过程,具有任务不明确的特点。如何在非结构化的过程中找到相对结构化的模块是非常重要的一点。为此,Gröller教授给出三方面的建议。首先,要有分而治之的思想,将博士研究的几年时间划分阶段,设置里程碑并逐渐取得突破。其次,加入或构建研究兴趣小组,全身心地投入到科学研究中。需要经常性地和导师开会,与实验室同学分享讨论想法,多参加讲座和教程,也要多作报告。最后是要和国际的研究团队交流。要多阅读文献和参加国际学术会议,学会站在巨人的肩膀上。

而后是一些非常深刻的具有启发意义的科研准则(principal)。在光线的反射和折射(图8)的例子中,透明度(transparency)代表对自己所做的事情熟稔于心,以及能够向他人有效传达。而反射(reflection)则代表着自我反思和思考其他人提供的反馈。在科学图景(图8)的例子中,已知的科学图景是盘绕的(convoluted)的,是前人屡败屡战反复尝试的结果,而回过头来看都会觉得事情直接而简单。失败是成功之母,我们需要学会从错误中成长,无论是自己的还是他人的。此外,博士研究中最珍贵的资源是我么自己,需要集中精力投入,扮演问题解决者的角色。在研究的过程中,我们提出的解决方案会经历简单而不重要,到复杂,再到简洁的这样一个过程。


图8:左图是光线的反射和折射;右图是科学探索图景。

生物网络可视化(Biological Network Visualization)

来自奥地利维也纳技术大学的Hsiang-Yun Wu博士为大家介绍了生物网格数据,并结合她自己的研究工作,介绍了一些在对生物网络数据的可视化技术。

在生物领域,存在着许许多多的网络数据(图9),这些数据跨越的尺度极大,数据呈现异质化与多变量,而且在形态上往往具有一种聚类内部的连接程度高,聚类之间存在捷径相连的特点,同时随着生物技术的发展,生物网络数据的数据量在近年来迅速增长,更重要的是,生物网络中的语义信息较多,难以找到有效的策略计算布局使之语义信息相匹配,这些生物网络数据的特点都给可视化带来了巨大的挑战(图10)。


图9:生物领域中的网络数据。

图10:一个生物网络数据可视化的例子 。

之后Hsiang-Yun Wu博士紧密结合自己的工作,为我们介绍了人体代谢网络可视化领域的情况,人体代谢网络是由全体影响着细胞的生理性质和生化性质的代谢过程组成的网络。网络中除了代谢物之间的的反应关系,还有与数据性质有关的聚类关系,甚至整个网络还能按照代谢发生的场所进行层次的划分。针对这样的数据,毫无疑问,要找到一个具有良好可读性且能同时表示出不同层级的关系的可视化是十分具有挑战性的。Hsiang-Yun Wu博士介绍,现在一些试图解决这些问题的方法包括分开考虑块内网络布局和块间网络布局,松弛化块与块之间的边界[Wu et al., 2019](图11),以及使用分层区域平衡[Wu et al., 2020]等方法。


图11:Hsiang-Yun Wu博士通过矩形边界松弛优化了网络的布局 。

最后Hsiang-Yun Wu对生物网络可视化进行了总结,并针对未来的图绘制算法提出了问题——“机器是否能在绘图方面完全超越人类?”,她在GD2020上发表的工作”The TUring Test foor Graph Drawing Algorithm”(图12)也正是她尝试回答这个问题的一步。


图12:Hsiang-Yun Wu博士参与的工作,针对图绘制算法的图灵测试 。

数据可视化的色彩基础(Color Foundation for Data Visualization)

可视化色彩理论的专家Theresa-Marie Rhyne向大家介绍了可视化中的色彩模型、色彩理论和为生物数据可视化上色的10条规则。计算机中常用的色彩模型有RGB和CMYK这两种互补的色彩模型。色彩调和有三种基本类型,单色调和只包含一种颜色的不用灰度,可以用来做成序列化的颜色,可以使用在有序排列的数据上;类似色彩调和包含三个及以上的在色轮上相近的颜色,可以用于做成多色彩的序列颜色;互补调和使用色轮上相对的两个颜色,用于做成发散颜色序列,可以使用在类别数据上。基于感知的色彩模型有Munsell模型和HCL。基础的色彩理论包括三原色理论、补色理论、色调抵消理论和色彩不足问题。

在了解了色彩的一些基本模型和理论后,Theresa-Marie Rhyne总结给出了在生物数据可视化中使用颜色的十条建议(图13)。分别是:1)首先认识数据的特点;2)选择一个颜色空间;3)在颜色空间中创建一个调色板;4)将调色板应用到数据集上;5)检查颜色结果;6)评估可视化中颜色的交互;7)注意在特定学科中的颜色惯例;8)评估色彩缺失;9)考虑网页可行性和打印效果;10)保证在黑白下的正确性。


图13:使用颜色的10条规则 。
发表评论?

0 条评论。

发表评论


注意 - 你可以用以下 HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>