分类存档: 研究

VIBR: 通过MDL准则可视化大规模二分关系数据(Visualizing Bipartite Relations at Scale with the Minimum Description Length Principle)

对于两个集合,如果一个集合中点和另一个结合中的点有连接,而集合内的点之间没有连接,那么这样的数据称为二分关系数据。通常这样的数据通过图模型来描述,这类特殊的图称为二分图(图1)。生活中存在大量这样的二分关系数据,比如顾客购买商品,议员投票议案等。已有工作针对二分关系数据的分析仍停留在表现单个节点和边,难以处理大规模的二分关系数据。本文介绍的工作[1]使用了最小描述长度准则(Minimum Description Length Principle)来对二分数据聚合,并且提出了基于邻接链表形式的可视化方法分析二分关系数据,相比于已有方法,该方法能够更好的提供二分关系数据的概览。

继续阅读 »

Charticulator: 交互式构建定制的图表布局(Charticulator: Interactive Construction of Bespoke Chart Layouts)

定制的图表更具表现力,可以根据想要传递的数据洞察进行细节的设计,从而让目标用户更容易注意、理解和记忆这些图表。用户想要创建这些图表,可以使用绘图的工具,但是这些工具需要手动设置数据和属性的映射,比较低效;可以用可视化的库编写代码实现,但是用户需要有较高的编程技能;也可以使用一些交互式的可视化构建工具,但是这些一般需要用户从一些模版中进行选择,因而表现能力不足,并且提供的布局方式有限或者提供的布局构建的交互不够方便。针对已有工作存在的问题,[1]的作者们提出了Charticulator,可以灵活创建可视化布局。

继续阅读 »

SetCoLa: 高层次限制的图布局语言(High-Level Constraints for Graph Layout)

有效的图布局可以帮助人们分析网络的拓扑结构,已有的许多工具,比如Gephi,D3都能够完成图布局的任务。计算图布局的时候,通常只考虑节点的拓扑信息,而对于特定领域的图,比如生物信息网络,布局时候还要考虑节点的属性信息。针对这样的特定领域(Domain-specific)图数据,虽然已有特定的布局方法,但是这些方法只能限定在该领域里使用,而不具有推广性。使用一般的布局方式,比如力导向布局来处理这些图数据,为了反映网络的特定结构,还需要对布局后的结果进一步调整,耗时耗力。本文[1]提出了一种更高层次的布局语言SetCoLa,可以有效结合结合图数据本身特点,对于布局的结构进行限制。

继续阅读 »

CrowdLayout: Crowdsourced Design and Evaluation of Biological Network Visualizations

生物学家经常会用网络来分析实验中的现象,比如细胞内分子的交互,电信号在神经元之间的传递,但是创建一个能够有效表现生物学信息的网络扔存在挑战。尽管有大量的自动图布局算法,但是这些算法没有利用网络中生物学信息,生成的布局效果没有实际意义;专家通常会利用自己的专业知识通过手动的方式对这样的网络布局,但是这样的布局方式效率太低,难以短时间内对大量网络数据生成有效布局。所以这篇文章通过众包的方式让普通用户在一定的准则下,帮助专家创建、评估网络数据的布局[1]。 继续阅读 »

可视化助力理解地震活动

近些年来,世界范围内频繁的地震活动对人类社会造成了巨大的影响。十年前,2008年的5月12日,发生在四川省汶川的8级地震就造成了数十万人死伤,破坏面积超过数十万平方公里。在地震领域,科学家们已经开展了长期的针对地震发生过程的研究,并期望通过研究来减少强震带来的伤亡。其中,一些观测和研究表明地震活动可能与电离层中的异常信号相关,并据此提出了一个假说:在地震发生前,震中以及附近的岩石圈活动会释放电磁辐射到空气中,从而导致电离层相关信号的扰动。DEMETER卫星是由法国发射的、第一颗用于研究电离层扰动与地震活动相关性的卫星。北京大学可视化与可视分析实验室和中国地震台网中心的张永仙研究员合作,提出了一个可视分析系统,用于帮助科学家研究分析DEMETER卫星采集的电离层数据和地震事件之间的相关性。这个工作也于去年被SIGGRAPH Asia Symposium on Visualization接收,获得最佳论文提名奖。应组织者的邀请,今年5月12日至14日成都举办的“汶川地震十周年国际研讨会 暨第四届大陆地震国际研讨会”上,由实验室袁晓如研究员作了进一步交流。

继续阅读 »

并行粒子追踪中基于数据重划分的动态负载平衡方法 (Dynamic Data Repartitioning for Load-Balanced Parallel Particle Tracing)

在流场可视化中,粒子追踪是一种非常基础的技术。通过在流场区域追踪大规模的粒子,研究者可以进行各种各样的流场应用,例如生成流线和迹线去分析复杂流场内部结构等。但是,在应用粒子追踪时,我们往往需要处理大规模数据,其计算代价也非常高,因而需要更具可扩展性的并行算法。目前,最常见的并行粒子追踪算法是数据并行,如图1所示,即在初始时将数据划分为数据块并将这些块分配给不同的进程,之后的粒子追踪过程中,粒子在每个数据块中进行追踪计算并在数据块间进行交换,直至所有粒子追踪完成(即达到最大追踪步数,或者提前穿出了流场边界)。但是,这些数据块的负载很可能会非常不均衡。例如,某些数据块中可能存在漩涡等流场特征,导致附近的粒子会“陷入”其中。尽管存在一些静态负载平衡方法,试图在初始化阶段就将数据块进行负载均衡的划分和分配,但它们都需要进行比较复杂的预处理。因此,我们提出了一种基于数据重划分的动态负载平衡方法,使用一般的初始数据划分和分配策略,在运行时周期性地对数据块负载进行评估并据此进行重划分,从而重新平衡每个进程的负载。相关工作[1]已被IEEE PacificVis 2018接收,并在近日由实验室张江同学在IEEE PacificVis 2018会议上进行了报告。

继续阅读 »

IEEE Pacific Visualization Symposium 2018 – Day 2

今天是IEEE PacificVis正式会议的第二天,包括一个主题演讲,三个论文分享环节,以及海报展示与互动环节。Keynote讲者是来自莫纳什大学的Tim Dwyer教授,他报告的主题是《Immersive Analytics: Interactive Data Analysis Using the Surfaces and Spaces around Us》。近些年沉浸式头戴设备(head-mounted displays)的普及使得身临其境的立体可视化环境成为可能,然而在沉浸式环境下的可视化也带来了一系列的挑战。

继续阅读 »

Map-based Graph Visualization

地图形式的图可视化方式指将图中的社群用一段连续的区域表示,不同的社群构成了地图上不同的“国家”。这样的可视化方式既可以提高可视化美观度,吸引用户花更多的时间探索数据[1];又可以增强用户的对可视化内容的记忆,更准确回忆自己的发现结果[2]。

继续阅读 »

并行粒子追踪中使用基于带有约束的k-d树分解的动态负载平衡方法 (Dynamic Load Balancing Based on Constrained K-D Tree Decomposition for Parallel Particle Tracing)

粒子追踪是流场可视化中的一种非常基础的技术。很多应用,从最基本的流线,迹线的计算,到源汇分析和FTLE(有限时间李雅普诺夫指数)的计算,都需要追踪大量的粒子。粒子追踪本身计算量大,加之流场数据的规模往往也比较大,我们需要对其并行化处理。但是,无论是数据并行(对数据进行静态划分和分配)还是任务并行(对粒子进行静态分配),由于很难确保每个进程分配到均等的工作负载,并行粒子追踪往往存在着严重的负载不均问题。究其本质,造成这一问题的原因是在追踪过程中粒子的分布随时间变化,并且很可能分布非常不均。以图1(a)为例,粒子在追踪过程中的分布变化非常大,甚至在一段时间后有些进程(或数据)没有粒子。

继续阅读 »

对兴奋网络拓扑结构的可视分析 (Visual Analysis of Governing Topological Structures in Excitable Network Dynamics)

在计算生物学和神经学领域,了解不同拓扑结构如何影响兴奋网络(Excitable Network)中的动力学传播是一个重要的问题。本文通过可视分析的手段,利用多个关联视图,帮助用户探索不同网络结构在兴奋网络动力学传播中的角色。

继续阅读 »