作者存档: Lijing Lin

ECGLens:从大规模ECG数据中进行心律失常检测的交互式可视分析系统

心电图(ECG)常用于检测心律失常。传统上,心脏病专家总是根据单一的ECG观察图,进行疾病诊断。这导致不规则的心律失常很难检测出来。近几年,随着相关技术的发展,大量原始ECG数据的收集成为可能。这有望提高相关诊断的准确性。但大数据量给心脏病专家带来挑战。针对这个现象,这个工作介绍了基于大规模心电图数据进行心律失常检测和分析的交互式系统ECGLens[1]。

继续阅读 »

HiPiler: 基于交互式small multiples的大型基因组交互矩阵可视分析工具(HiPiler: Visual Exploration of Large Genome Interaction Matrices with Interactive Small Multiples)

 

人类基因组长约2米,紧密折叠到每个细胞核中。这种存在方式导致相聚很远的基因组序列可以紧密地在空间上接近。生物学家分析发现,基因组序列在空间上的靠近行为与某些疾病的发生紧密相关。为更好地帮助领域专家分析基因组的构建,这篇文章[1]提出一个可视分析工具HiPiler(图1)。这个工具支持用户在非常巨大的矩阵中,分析少数模式(patterns)的特征。

继续阅读 »

基于规则模型的动态影响网络 (Dynamic Influence Networks for Rule-based Models)

动态影响网络(DIN)[1],是一种新颖的可视分析技术,用于表示和分析基于规则模型的蛋白质-蛋白质相互作用网络。使用KaSim(一种Kappa语言编写的基于规则模型的开源随机模拟器)生成的数据,构建动态影响网络,表示每个规则对其他规则的影响。

继续阅读 »

主题建模参数的渐进式学习:可视分析框架(Progressive Learning of Topic Modeling Parameters: A Visual Analytics Framework)

主题分析模型是典型的非监督学习算法,广泛应用于文本主题组成分析。虽然主题模型应用广泛,且效果尤佳,但对于许多使用者来说,该模型的计算结果和参数调整对结果的影响,是很难理解的。换而言之,主题模型是个黑盒子。为此,文章提出了一个模块化的可视分析框架,通过用户驱动的强化学习过程,在不要求使用者对主题模型的底层算法具有深入理解的情况下,帮助用户学习到可理解性和可调节性更强的主题模型。

继续阅读 »

ACTIVIS: 工业规模深度神经网络的可视化探索 (ACTIVIS: Visual Exploration of Industry-Scale Deep Neural Network Models)

深度学习在许多领域,比如计算机视觉、自然语言处理,取得相当重要的突破。尽管越来越多公司在他们的产品上,用越来越多深度学习模型。但这些模型依靠非常多的参数,尝试从数据中学习隐藏的非线性的结构。这个特点,使得人们难以理解模型的结果,难以分析模型不好的原因进而采取进一步的措施。

近些年,越来越多研究者研发可视化工具,尝试帮助人们理解深度学习模型的结果。但现有的工具,往往针对某一特定的模型和某种类型的数据,不能满足工业界的需求。在工业界,一方面,使用的模型种类非常多,模型结构非常复杂;另一方面,分析的数据类型非常丰富,数据量也非常的大。

为此,本文提出ACTIVIS[1],一个支持工业界深度学习模型分析的可视化探索工具。

继续阅读 »

DeepEyes: 用于深度神经网络设计的递进式可视分析系统 (DeepEyes: Progressive Visual Analytics for Designing Deep Neural Networks)

深度神经网络,在模式识别问题上,取得非常不错的效果。但设计一个性能好的神经网络,需要反复尝试,是个非常耗时的过程。这个工作[1]实现了用于深度神经网络设计的可视分析系统,DeepEyes。该系统可以在DNNs训练过程中,提取数据,从网络整体效果,神经层和神经元角度,分析神经网络运行状态,进而协助用户更新DNNs。

继续阅读 »

基于自我中心线的动态自我网络可视分析方法(Egocentric Analysis of Dynamic Networks with Egolines)

动态网络,其结构随着时间不断发生变化,是个应用领域相当广泛的数据结构,比如社交媒体交流网络,学者之间的合作网络等。相关的研究相当的丰富(图1)。基本的展示形式有两种,点边形式(Node-link Diagram)和矩阵形式 (Matrix Diagram);时间映射方式主要有两大类,基于时间轴的映射和基于动画的映射。这些方法,关注的往往是整个网络。另一种重要的动态图研究方法,是自我网络分析(egocentric analysis)。相比于关注整个网络的分析,自我网络分析关注的是中心点(ego)及其相关联的节点(alters)构建的子图。 继续阅读 »

针对交互式数据可视化语法(Vega)的可视调试工具(Visual Debugging Techniques for Reactive Data Visualization)

Reactive Vega [1],是一种可视化领域专用,比D3更为高级的语法。它支持用户通过简洁的json,快速地定义交互式数据可视化。举个例子,图1-1绘制了一个散点图(如图1-3)。如果想在散点图中添加pan事件,可以通过signals关键词图1-2,定义事件以及事件触发时,相关数据的转化方式。相比于D3,在这里我们不需要定义事件的回调函数。这是因为Reactive Vega将事件当作数据流进行处理。当事件触发时,它会根据signals中定义的规则,重新计算相关的数据,并根据新的数据,重绘视图。

采用Reactive Vega定义交互式可视化,相当的简单方便。但是,它隐藏了数据具体的转化方式。同时,陈述式的语法形式模糊了数据之间的逻辑关系。这就导致Reactive Vega的调试,非常麻烦。常用的调试方法,比如断点查看,栈追踪等,在这里都发挥不了作用。为此,Hoffswell等人针对这种陈述式语法,提出了新的可视调试工具。

继续阅读 »

可视化不确定网络的概率图布局方法(Probabilistic Graph Layout for Uncertain Network Visualization)

不确定网络,在本文表示顶点是确定的(certain),边的存在与否满足某种概率分布的网络。在图1中,左图是确定网络(certain graph),右图是不确定网络(uncertain graph)。

在不确定网络可视分析中,现有的方法往往直接在确定图(exact graph)中用视觉变量(visual variables)表示不确定信息。这些方法可以很好的将图的拓扑结构展示出来,但忽略了不确定信息的概率分布情况。
在这篇文章[1],作者们提出一个概率图(probabilistic graph)布局方法。这个方法可以同时展示图的拓扑结构和不确定信息的概率分布。它的基本思想是,依据蒙特卡洛方法(Monte Carlo process)对不确定图进行采样;将采样获得图根据力导向算法进行布局;之后,将所有采样图的力导向布局组合起来,获得最后概率图的布局(如图2所示)。 继续阅读 »

Magnostics:基于图片搜索有趣的矩阵视图引导网络探索(Magnostics: Image-based Search of Interesting Matrix Views for Guided Network Exploration)

当我们想要理解大型网络数据时,搜索和分析是主要的 手段。为实现快速的搜索分析,一个广泛使用的方法是特征描述子(FDs)。特征描述子常用来描述某些重要的数据属性,然后根据这些属性计算数据元素之间的相似性分数。这篇文章[1]提出一系列经过验证的特征描述子,描述矩阵视图中的特征,以此来引导用户探索分析大型网络数据。 继续阅读 »