Lineage: 在家谱图中可视化多变量临床数据 (Visualizing Multivariate Clinical Data in Genealogy Graphs)

大多数对公共和个人健康构成重大挑战的疾病都是由多种遗传和环境因素引起的。本文[1]介绍了Lineage这一新型可视化分析工具,用于支持领域专家在结合族谱背景时研究此类多因素疾病。通过结合案例之间的家庭关系与其他数据,用户可以发现此类疾病可能涉及的共享基因组变体或共享环境暴露等。此设计研究的主要贡献是针对家谱和临床数据结合的这一类树状多变量图,通过设计家谱图与属性表格图相对齐的方式,能够在家谱分析中加入广泛的多元属性而不会使图混乱。

图1. Lineage系统的用户界面

 

该研究中,项目成员与临床医生、分析师和犹他大学精神病学系的研究生进行了合作。在一起合作的领域专家的工作流程中,本文提出了一下一些最重要的领域任务:

  • T1: Select families of interest.
  • T2: Analyze individual case.
  • T3: Compare cases.  
  • T4: Judge prevalence and clusters of phenotype.
  • T5: Compare families.  
  • T6: Quality control.

Juniper的设计能够满足以上的分析任务,支持领域专家在结合族谱背景时可视化探索研究多因素疾病。

下面介绍具体的可视化设计。

De-Cycling: 

在原本的图结构中可能会存在环的结构,如图2所示,因此在将它转化为树的结构时需要去环。

图2. 家谱图中的环

 

本文通过添加一个复制的节点的方法来消除环,使数据集类型变为树,然后将树进行线性化展开进行可视化,如图3所示。

图3. 通过添加一个复制的节点来消除环,并线性化树

 

Aggregation: 

线性化展开的树里面可能由几百个数据点,而用户关心的可能只是其中部分的点,这样其他的数据点可以通过聚集的方式减少所占用的空间,经过聚集的那些行的属性可视化形式也会是相应的聚集形式。如图4(a)所示。

Hiding: 

聚集模式可以使不感兴趣的点占用尽可能少的空间,但有时候用户只想让感兴趣的点拥有对应的属性可视化。这时候可以进行隐藏不感兴趣点的操作,这些数据点将被聚集起来,同时不被分配行空间,它们只是展示在行与行之间的空间里。如图4(b)所示。

图4. (a) 聚集不感兴趣的点 (b) 隐藏模式下,不感兴趣的点不被分配行空间,也没有对应的属性可视化

此外,用户可以指定根据某个属性对属性表格图中的行进行排序,这些行与家谱图中结点的对应关系会通过“Slope Chart”,即拥有不同斜率的连接家谱树图和属性表格图对应行的辅助连接线图,来展现。如图5所示。

图5. 排序与高亮对应关系

 

总的来说,本文介绍了一种使用线性化方法可视化多变量树和树状图的新方法。通过用Lineage系统来可视化在临床背景下的家谱图,设计家谱图与属性表格图相对齐的可视化方案,使得领域专家用户能够在家谱分析中同时考虑多元属性的影响,本文方法的有用性得到了展示。

 

 

参考文献:

[1] Nobre, C., Gehlenborg, N., Coon, H., & Lex, A. Lineage: Visualizing multivariate clinical data in genealogy graphs. IEEE transactions on visualization and computer graphics, 2018.

评论关闭。