分类存档: 论文报告

通过可视化分析地理因素对多变量聚类的影响(Visualizing the Impact of Geographical Variations on Multivariate Clustering)

通过可视化分析地理因素对多变量聚类的影响

多变量地理空间数据是一种十分常见的数据类型,例如对各大城市的人口状况统计、世界各国的国力评判指标等等。如何分析地理因素(如地域的位置、范围、方向等)对多变量数据的影响,一直是地理信息、可视分析等领域的重要课题。另一方面,聚类是简化多变量分析的常用方法,它能够挖掘相似数据、总结数据特征、并消除变量增长所带来的负担。然而,当下的聚类分析方法并没有考虑地理因素的影响。这篇发表于2016年EuroVis会议的文章[1],就探讨了如何通过可视化分析地理因素对多变量聚类的影响。

继续阅读 »

基于自我中心线的动态自我网络可视分析方法(Egocentric Analysis of Dynamic Networks with Egolines)

egolines-p2

动态网络,其结构随着时间不断发生变化,是个应用领域相当广泛的数据结构,比如社交媒体交流网络,学者之间的合作网络等。相关的研究相当的丰富(图1)。基本的展示形式有两种,点边形式(Node-link Diagram)和矩阵形式 (Matrix Diagram);时间映射方式主要有两大类,基于时间轴的映射和基于动画的映射。这些方法,关注的往往是整个网络。另一种重要的动态图研究方法,是自我网络分析(egocentric analysis)。相比于关注整个网络的分析,自我网络分析关注的是中心点(ego)及其相关联的节点(alters)构建的子图。 继续阅读 »

虚拟牵开器:使用基于物理变形的交互式数据探索系统 (Virtual Retractor: An Interactive Data Exploration System Using Physically Based Deformation)

图1 基于四面体网格变形的虚拟牵开器原理图。

在三维数据的探索中,视觉遮挡往往是一个比较严重的问题。数据内部重要的信息会被表面的元素遮挡住,影响了人们对这类数据的探索和认知。尽管可以有一些手段来处理遮挡,但是在这一过程中如何尽力保留所探索目标附近的上下文信息(例如一些辅助性的关键特征)也非常重要。这些都给三维数据的探索带来了比较大的挑战。实际上与之相类似的是,在我们的日常生活中,我们经常会通过直接打开的方式检查一个物品的内部情况,例如,通过拉动拉链打开一个手提包就可以看到里面的东西。在医学上,医生们做手术时经常会用到医疗牵开器,将切开的患处表面组织牵开,从而显露出需要手术的范围。受这一思想的启发,今年的PacificVis会议上就有一篇文章[1],使用一种虚拟牵开器的方法,通过物理变形将三维数据从表面“切开”,让用户可以对数据内部的信息进行探索。

继续阅读 »

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

teaser

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

Squares: 支持多类别分类器的交互式分析展示(Squares: Supporting Interactive Performance Analysis for Multiclass Classifiers)

图1 每一列代表一个类别,用颜色标记

对于机器学习来说,对分类器的表现进行分析是很关键的,因为它会影响到应用模型的人的产出。例如,应用模型的人在决定使用哪个参数之前,总是比较不同模型通过不同算法参数产生结果的表现。现在比较流行的工具有两种,第一种是统计学上的总结,例如准确度、精确度、召回率或对数的损失;第二种是混淆矩阵。

但当前的这两种工具也存在一些问题,第一是与原始数据缺乏关联;第二是会掩盖数据中的重要信息,例如分数的分布;第三是对于多分类分类器的支持是很重要的,而现有工具不具备这个功能。

继续阅读 »

基于自下而上的子空间探索的多变量体数据分析和可视化(Multivariate Volumetric Data Analysis and Visualization through Bottom-Up Subspace Exploration)

图1 一种自下而上的子空间探索方法的流程图

多变量体数据的可视化是科学可视化中的一个重要研究方向。这类数据往往包含了很多有意义的特征,而这些特征大都与多个变量相关。为了提取并可视化这些特征,人们通常会设计和使用多变量传递函数。不过,由于变量的数据比较大,并且变量与变量之间的关系很复杂,多变量传递函数的设计相比与传统的一维传递函数会遇到更大的困难和挑战。但是另一方面,某些特征事实上可能只存在于一个变量的子集中,也即是所有变量的一个子空间中。例如,飓风的风眼是一个非常重要的特征,它可以只根据速度和压强这两个变量就可以识别出来。因此,在多变量体数据中,通过子空间的探索来鉴定某些特征往往更加方便和容易。针对这一现象,今年PacificVis的一篇文章[1]提出了一种自下而上的子空间探索方法,支持对多变量体数据中特征的提取和可视化。

继续阅读 »

基于等价目的地的位置相关路网概括(Location-dependent generalization of road networks based on equivalent destinations)

teaser

位于道路网中某个顶点的用户想要到达某个地方。事实上用户的确切目的地可能与计划路径关系不大,因为确切的目的地并不会影响我们的初始方向。我们到达目的地有很多的条路径,其实绝大部分路径是重合的。许多目的地对于用户来说是等效的。我们提出了一种自动找到这些等价目的地的方法,并通过所得到的这些集群来简化路网。我们将这个问题模型化为有根,边缘加权的树中的聚类问题。我们计算出的聚类网络提供了一个常数等价度因子。通过我们这种方法可以简化节点和边,使得我们寻找最短路径的时候能够不被整个地图所干扰,能够高效的找出最短路径[1]。

继续阅读 »

FaVVEs: 不同抽象层次的多个图标结合的方式可视化数据的不同属性(Faceted Views of Varying Emphasis (FaVVEs): a framework for visualising multi-perspective small multiples)

FaVVEs

在可视化中,大部分数据存在多个不同的属性,比如说空间,时间以及描述性的信息等角度,分析人员需要同时研究不同的属性。然而目前存在的并排图标(small multiple)将不同的属性分开比较的方法使得用户难以对于数据进行分析。为了辅助用户同时获得同时分析数据集的不同属性,本文提出了框架FaVVEs,将支持将不同的并排图标叠加在一起进行显示,同时通过动态调整图标的抽象程度,尽可能的避免并排图标的遮挡问题。本文针对图标并排显示以及叠加显示进行了用户测评。

继续阅读 »

面向量化的可视分析的结构化刷选和统计联动 (Towards Quantitative Visual Analytics with Structured Brushing and Linked Statistics)

teaser

目前的可视分析系统提供的刷选联动操作多是定性的,即在一个视图中任意刷选,在其他视图中高亮对应数据进行联动。这种刷选联动方式,一方面很难重现一个自由的刷选操作。另一方面,高亮的联动方式不支持定量分析。而本文[1]对刷选-联动方式进行拓展,提出面向量化可视分析的结构化刷选和统计联动的新颖的交互设计。 继续阅读 »

针对交互式数据可视化语法(Vega)的可视调试工具(Visual Debugging Techniques for Reactive Data Visualization)

debugging3

Reactive Vega [1],是一种可视化领域专用,比D3更为高级的语法。它支持用户通过简洁的json,快速地定义交互式数据可视化。举个例子,图1-1绘制了一个散点图(如图1-3)。如果想在散点图中添加pan事件,可以通过signals关键词图1-2,定义事件以及事件触发时,相关数据的转化方式。相比于D3,在这里我们不需要定义事件的回调函数。这是因为Reactive Vega将事件当作数据流进行处理。当事件触发时,它会根据signals中定义的规则,重新计算相关的数据,并根据新的数据,重绘视图。

采用Reactive Vega定义交互式可视化,相当的简单方便。但是,它隐藏了数据具体的转化方式。同时,陈述式的语法形式模糊了数据之间的逻辑关系。这就导致Reactive Vega的调试,非常麻烦。常用的调试方法,比如断点查看,栈追踪等,在这里都发挥不了作用。为此,Hoffswell等人针对这种陈述式语法,提出了新的可视调试工具。

继续阅读 »