月度存档: 五月 2017

区间似然树:一种可视探索不确定性数据集的紧凑高效的表示方法 (Range Likelihood Tree: A Compact and Effective Representation for Visual Exploration of Uncertain Data Sets)

teaser

本文针对的数据是具有不确定性的标量场数据。我们知道,普通的标量场数据在一个空间格点上只会确定的取一个数值。而在具有不确定性的标量场数据中,一个空间格点会以一定概率分布取不同的标量值。因此,这种数据也被称为概率分布场数据。这类数据在原有的空间维度上新增加了一个分布维度,因此对这类数据的可视化和分析会十分困难。已有的方法或者基于一些统计指标对概率分布进行约减,或者通过定义概率分布间的相似性来进行分析。而本文则提出使用累积概率来进行分析。

继续阅读 »

Squares: 支持多类别分类器的交互式分析展示(Squares: Supporting Interactive Performance Analysis for Multiclass Classifiers)

图1 每一列代表一个类别,用颜色标记

对于机器学习来说,对分类器的表现进行分析是很关键的,因为它会影响到应用模型的人的产出。例如,应用模型的人在决定使用哪个参数之前,总是比较不同模型通过不同算法参数产生结果的表现。现在比较流行的工具有两种,第一种是统计学上的总结,例如准确度、精确度、召回率或对数的损失;第二种是混淆矩阵。

但当前的这两种工具也存在一些问题,第一是与原始数据缺乏关联;第二是会掩盖数据中的重要信息,例如分数的分布;第三是对于多分类分类器的支持是很重要的,而现有工具不具备这个功能。

继续阅读 »

基于自下而上的子空间探索的多变量体数据分析和可视化(Multivariate Volumetric Data Analysis and Visualization through Bottom-Up Subspace Exploration)

图1 一种自下而上的子空间探索方法的流程图

多变量体数据的可视化是科学可视化中的一个重要研究方向。这类数据往往包含了很多有意义的特征,而这些特征大都与多个变量相关。为了提取并可视化这些特征,人们通常会设计和使用多变量传递函数。不过,由于变量的数据比较大,并且变量与变量之间的关系很复杂,多变量传递函数的设计相比与传统的一维传递函数会遇到更大的困难和挑战。但是另一方面,某些特征事实上可能只存在于一个变量的子集中,也即是所有变量的一个子空间中。例如,飓风的风眼是一个非常重要的特征,它可以只根据速度和压强这两个变量就可以识别出来。因此,在多变量体数据中,通过子空间的探索来鉴定某些特征往往更加方便和容易。针对这一现象,今年PacificVis的一篇文章[1]提出了一种自下而上的子空间探索方法,支持对多变量体数据中特征的提取和可视化。

继续阅读 »

基于等价目的地的位置相关路网概括(Location-dependent generalization of road networks based on equivalent destinations)

teaser

位于道路网中某个顶点的用户想要到达某个地方。事实上用户的确切目的地可能与计划路径关系不大,因为确切的目的地并不会影响我们的初始方向。我们到达目的地有很多的条路径,其实绝大部分路径是重合的。许多目的地对于用户来说是等效的。我们提出了一种自动找到这些等价目的地的方法,并通过所得到的这些集群来简化路网。我们将这个问题模型化为有根,边缘加权的树中的聚类问题。我们计算出的聚类网络提供了一个常数等价度因子。通过我们这种方法可以简化节点和边,使得我们寻找最短路径的时候能够不被整个地图所干扰,能够高效的找出最短路径[1]。

继续阅读 »

北京大学2017年校园开放日实验室成果演示

开放日1

2017年5月20日是北京大学校园开放日,实验室安排了在可视化与可视分析方面的最新成果向公众演示,包括湍流可视化,交通数据、微博数据可视分析,伪基站数据可视分析等科研项目。此次开放日实验室接待的参观者包括来自中小学生及其家长等百余人。实验室成员陈思明,洪帆,张江,赖楚凡,叶唐陟,陈帅,李国政,刘强强,冯璐,张宇,施悦凝等多位同学参与了本次开放日演示工作,向参观者介绍相关的工作,并面对面解答参观者的各种问题。今年校园开放日,实验室增加了HoloLens沉浸式可视化等项目,让参观者亲自体验可视化的乐趣。可视化能将复杂的数据转换为更容易理解的方式传递给受众,本次活动,很好地向公众普及了可视化的最新进展,受到参观者的好评。

继续阅读 »

FaVVEs: 不同抽象层次的多个图标结合的方式可视化数据的不同属性(Faceted Views of Varying Emphasis (FaVVEs): a framework for visualising multi-perspective small multiples)

FaVVEs

在可视化中,大部分数据存在多个不同的属性,比如说空间,时间以及描述性的信息等角度,分析人员需要同时研究不同的属性。然而目前存在的并排图标(small multiple)将不同的属性分开比较的方法使得用户难以对于数据进行分析。为了辅助用户同时获得同时分析数据集的不同属性,本文提出了框架FaVVEs,将支持将不同的并排图标叠加在一起进行显示,同时通过动态调整图标的抽象程度,尽可能的避免并排图标的遮挡问题。本文针对图标并排显示以及叠加显示进行了用户测评。

继续阅读 »

面向量化的可视分析的结构化刷选和统计联动 (Towards Quantitative Visual Analytics with Structured Brushing and Linked Statistics)

teaser

目前的可视分析系统提供的刷选联动操作多是定性的,即在一个视图中任意刷选,在其他视图中高亮对应数据进行联动。这种刷选联动方式,一方面很难重现一个自由的刷选操作。另一方面,高亮的联动方式不支持定量分析。而本文[1]对刷选-联动方式进行拓展,提出面向量化可视分析的结构化刷选和统计联动的新颖的交互设计。 继续阅读 »

针对交互式数据可视化语法(Vega)的可视调试工具(Visual Debugging Techniques for Reactive Data Visualization)

debugging3

Reactive Vega [1],是一种可视化领域专用,比D3更为高级的语法。它支持用户通过简洁的json,快速地定义交互式数据可视化。举个例子,图1-1绘制了一个散点图(如图1-3)。如果想在散点图中添加pan事件,可以通过signals关键词图1-2,定义事件以及事件触发时,相关数据的转化方式。相比于D3,在这里我们不需要定义事件的回调函数。这是因为Reactive Vega将事件当作数据流进行处理。当事件触发时,它会根据signals中定义的规则,重新计算相关的数据,并根据新的数据,重绘视图。

采用Reactive Vega定义交互式可视化,相当的简单方便。但是,它隐藏了数据具体的转化方式。同时,陈述式的语法形式模糊了数据之间的逻辑关系。这就导致Reactive Vega的调试,非常麻烦。常用的调试方法,比如断点查看,栈追踪等,在这里都发挥不了作用。为此,Hoffswell等人针对这种陈述式语法,提出了新的可视调试工具。

继续阅读 »

流式文本的在线可视分析(Online Visual Analytics of Text Streams)

1

现如今的互联网上有大量的流式文档,一个很普遍的问题就是如何检测和跟踪这种文本流中的新兴事件。目前在挖掘和可视化文本流方面已经取得了很大的进步。然而,大多数现有的方法都是离线方法。离线的方法是基于所有文档来计算结果的。每次当新文件流入时,这些方法都会先将新文档与旧文档合并,然后重新计算模型。目前使用的这些离线方法存在两个主要的问题:
1. 重新计算模型时间消耗太大;
2. 由于模型被重新计算,结果在一定程度上发生了变化,这对用户来说可能是难以理解的。
这篇文章[1]提出了一种在线的可视化分析方法,帮助用户探索和了解大量流式文档中的层次主题演化。

继续阅读 »

TextTile:给结构化数据和无结构文本提供无缝探索性分析的交互式可视化工具 (TextTile: An Interactive Visualization Tool for Seamless Exploratory Analysis of Structured Data and Unstructured Text)

TextTile-interface

在实际的很多应用中,数据集由无结构文本和结构化数据组合而成。比如购物网站上,顾客会给商品的质量、物流服务质量、商家态度等条目打分,也可以写一段关于商品的评论。前者就是结构化数据,后者则是无结构文本数据。分析者面对这些数据时,往往需要同时分析二者。既可能先指定结构化数据字段的过滤条件(如对于北京的餐馆),总结文本信息(如,用户评价这类餐馆时最经常使用哪些关键词);也可能先指定无结构文本(如用户评价中含有“非常满意”),再观察这些数据在结构化数据字段的分布(如,这样的评论的地理分布)。然而,分析者面对这类数据时,面临两大问题:(1)没有一种系统的方式来组织和连接这些操作;(2)缺少完整地集成了这些操作的可视化系统,能够支持用户灵活地进行分析。 继续阅读 »