Screenit: 对细胞筛选的可视分析 (Screenit: Visual Analysis of Cellular Screens)

本文介绍了针对生物制药中一种多维多层次数据——筛选数据的可视分析系统。这个系统连接了现有的支持大量数据但是层次较高的系统和支持细节层次但是数据量支持有限的系统。

继续阅读 »

草图的语义:时间序列可视查询系统的灵活性 (The Semantics of Sketch: Flexibility In Visual Query Systems For Time Series Data)

草图允许分析者指定复杂和自由的兴趣模式。可视化查询系统可以利用草图在大型数据集中找到这些感兴趣的模式。然而,草图是不明确的:同一张图可能代表大量潜在的查询。在这项工作中,我们调查了这些含糊之处,因为它们适用于可视查询系统的时间序列数据。我们定义了一类“不变量”——分析者在执行基于草图的查询时希望忽略的时间序列的属性。我们提出了一个众包的研究结果,表明这些不变量是人们如何评价草图和目标之间的匹配强度的关键组成部分。我们采用了一些时间序列匹配算法来支持草图中的不变量。最后,依赖于这些不变量,我们提出了一个基于Web部署的草图可视化查询系统原型。我们将原型应用于金融、数字人文和政治科学的数据。

继续阅读 »

通过可视化分析地理因素对多变量聚类的影响(Visualizing the Impact of Geographical Variations on Multivariate Clustering)

通过可视化分析地理因素对多变量聚类的影响

多变量地理空间数据是一种十分常见的数据类型,例如对各大城市的人口状况统计、世界各国的国力评判指标等等。如何分析地理因素(如地域的位置、范围、方向等)对多变量数据的影响,一直是地理信息、可视分析等领域的重要课题。另一方面,聚类是简化多变量分析的常用方法,它能够挖掘相似数据、总结数据特征、并消除变量增长所带来的负担。然而,当下的聚类分析方法并没有考虑地理因素的影响。这篇发表于2016年EuroVis会议的文章[1],就探讨了如何通过可视化分析地理因素对多变量聚类的影响。

继续阅读 »

基于自我中心线的动态自我网络可视分析方法(Egocentric Analysis of Dynamic Networks with Egolines)

动态网络,其结构随着时间不断发生变化,是个应用领域相当广泛的数据结构,比如社交媒体交流网络,学者之间的合作网络等。相关的研究相当的丰富(图1)。基本的展示形式有两种,点边形式(Node-link Diagram)和矩阵形式 (Matrix Diagram);时间映射方式主要有两大类,基于时间轴的映射和基于动画的映射。这些方法,关注的往往是整个网络。另一种重要的动态图研究方法,是自我网络分析(egocentric analysis)。相比于关注整个网络的分析,自我网络分析关注的是中心点(ego)及其相关联的节点(alters)构建的子图。 继续阅读 »

虚拟牵开器:使用基于物理变形的交互式数据探索系统 (Virtual Retractor: An Interactive Data Exploration System Using Physically Based Deformation)

在三维数据的探索中,视觉遮挡往往是一个比较严重的问题。数据内部重要的信息会被表面的元素遮挡住,影响了人们对这类数据的探索和认知。尽管可以有一些手段来处理遮挡,但是在这一过程中如何尽力保留所探索目标附近的上下文信息(例如一些辅助性的关键特征)也非常重要。这些都给三维数据的探索带来了比较大的挑战。实际上与之相类似的是,在我们的日常生活中,我们经常会通过直接打开的方式检查一个物品的内部情况,例如,通过拉动拉链打开一个手提包就可以看到里面的东西。在医学上,医生们做手术时经常会用到医疗牵开器,将切开的患处表面组织牵开,从而显露出需要手术的范围。受这一思想的启发,今年的PacificVis会议上就有一篇文章[1],使用一种虚拟牵开器的方法,通过物理变形将三维数据从表面“切开”,让用户可以对数据内部的信息进行探索。

继续阅读 »

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

Squares: 支持多类别分类器的交互式分析展示(Squares: Supporting Interactive Performance Analysis for Multiclass Classifiers)

对于机器学习来说,对分类器的表现进行分析是很关键的,因为它会影响到应用模型的人的产出。例如,应用模型的人在决定使用哪个参数之前,总是比较不同模型通过不同算法参数产生结果的表现。现在比较流行的工具有两种,第一种是统计学上的总结,例如准确度、精确度、召回率或对数的损失;第二种是混淆矩阵。

但当前的这两种工具也存在一些问题,第一是与原始数据缺乏关联;第二是会掩盖数据中的重要信息,例如分数的分布;第三是对于多分类分类器的支持是很重要的,而现有工具不具备这个功能。

继续阅读 »

基于自下而上的子空间探索的多变量体数据分析和可视化(Multivariate Volumetric Data Analysis and Visualization through Bottom-Up Subspace Exploration)

多变量体数据的可视化是科学可视化中的一个重要研究方向。这类数据往往包含了很多有意义的特征,而这些特征大都与多个变量相关。为了提取并可视化这些特征,人们通常会设计和使用多变量传递函数。不过,由于变量的数据比较大,并且变量与变量之间的关系很复杂,多变量传递函数的设计相比与传统的一维传递函数会遇到更大的困难和挑战。但是另一方面,某些特征事实上可能只存在于一个变量的子集中,也即是所有变量的一个子空间中。例如,飓风的风眼是一个非常重要的特征,它可以只根据速度和压强这两个变量就可以识别出来。因此,在多变量体数据中,通过子空间的探索来鉴定某些特征往往更加方便和容易。针对这一现象,今年PacificVis的一篇文章[1]提出了一种自下而上的子空间探索方法,支持对多变量体数据中特征的提取和可视化。

继续阅读 »

基于等价目的地的位置相关路网概括(Location-dependent generalization of road networks based on equivalent destinations)

位于道路网中某个顶点的用户想要到达某个地方。事实上用户的确切目的地可能与计划路径关系不大,因为确切的目的地并不会影响我们的初始方向。我们到达目的地有很多的条路径,其实绝大部分路径是重合的。许多目的地对于用户来说是等效的。我们提出了一种自动找到这些等价目的地的方法,并通过所得到的这些集群来简化路网。我们将这个问题模型化为有根,边缘加权的树中的聚类问题。我们计算出的聚类网络提供了一个常数等价度因子。通过我们这种方法可以简化节点和边,使得我们寻找最短路径的时候能够不被整个地图所干扰,能够高效的找出最短路径[1]。

继续阅读 »

北京大学2017年校园开放日实验室成果演示

2017年5月20日是北京大学校园开放日,实验室安排了在可视化与可视分析方面的最新成果向公众演示,包括湍流可视化,交通数据、微博数据可视分析,伪基站数据可视分析等科研项目。此次开放日实验室接待的参观者包括来自中小学生及其家长等百余人。实验室成员陈思明,洪帆,张江,赖楚凡,叶唐陟,陈帅,李国政,刘强强,冯璐,张宇,施悦凝等多位同学参与了本次开放日演示工作,向参观者介绍相关的工作,并面对面解答参观者的各种问题。今年校园开放日,实验室增加了HoloLens沉浸式可视化等项目,让参观者亲自体验可视化的乐趣。可视化能将复杂的数据转换为更容易理解的方式传递给受众,本次活动,很好地向公众普及了可视化的最新进展,受到参观者的好评。

继续阅读 »