标签存档: 高维数据可视化

斯图加特大学博士后周亮访问北京大学

20170412photo

ping pi2017年4月12日,德国斯图加特大学可视化研究实验室(Visualisierungsinstitut, Universitaet Stuttgart (VISUS))博士后周亮访问北大可视化与可视分析实验室。周亮博士的研究方向包括大规模多属性数据的可视化与分析,交互式复杂数据特征提取。

继续阅读 »

WeightLifter:多准则权重空间的可视探索(WeightLifter: Visual Weight Space Exploration for Multi-Criteria Decision Making)

WeightLifter:多准则权重空间的可视探索

人们在做选择的时候,往往会综合考虑事物的多个方面。譬如在选择住房时,有的人注重装修,有的人看重便利的交通,有的人则更偏好良好的社区环境等等。当多个准则并存,我们常常赋予它们不同的权重,并选择综合得分最高的作为最佳选项。然而,人对权重的把握总是模糊的,如果略微改变权重设定,得到的“最佳选项”是否会不一样呢?在这篇文章[1]中,作者们针对多准则评价体系,提出了一种探索多维权重空间的可视分析方法。利用该方法,用户能够充分了解权重变化对最终决策的影响,并有针对性地调整权重、作出选择。

继续阅读 »

降维中的可视交互:一个结构化的文献分析 (Visual Interaction with Dimensionality Reduction: A Structured Literature Analysis)

chart

降维是高维数据可视分析的一种重要的数据抽象技术。它将高维数据降解到低维空间,同时尽可能保留诸如异常点、聚类等特征。降维的方法林林总总,在可视分析中很难一步到位使用不需要任何适配的降维方法。常见的做法是通过交互的方式,将标准的降维方法适配到具体的应用场景中。目前在关于算法与可视交互如何融合方面,大多数工作是从高层次、抽象的角度来讨论其流程或模型[1][2]。本文[3]聚焦于降维这一特定方向,通过对文献进行半自动分析的方式,对降维中的可视交互进行结构化的文献调研。

继续阅读 »

从边际投影中重构类别型联合分布的可视分析方法(A Visual Analytics Approach for Categorical Joint Distribution Reconstruction from Marginal Projections)

联合分布重构的可视分析方法

所谓边际投影,指的是多维数据在少数几个维度上的数量累积,例如两份病患统计数据,分别展示病人在年龄和性别上的一维分布。然而仅凭这些数据,我们无法确定不同性别的病患在各个年龄段上的二维分布,因为边际投影重构出的联合分布并不唯一。传统的自动算法能够给出重构分布的少数“可行解”,却无法结合用户的先验知识、也不一定符合现实情况。在这篇文章中[1],作者提出了一种可视分析方法,通过高维可视化手段、重构并展示大量潜在的联合分布,以帮助用户识别其中符合事实或预期的、有价值的分布。

继续阅读 »

基于自内嵌平行坐标的多分辨率气象集合模拟数据的参数分析 (Multi-Resolution Climate Ensemble Parameter Analysis with Nested Parallel Coordinates Plots)

003

传统的集合模拟数据本身以及参数空间都非常复杂,因为集合模拟数据往往是多成员 (multi-run),多维度 (multi-dimensional)以及时变的 (time-varying)。在此基础之上,领域科学家 (如气象学家) 在进行集合模拟时,还需要使用不同的分辨率来进行模拟,因为不同的分辨率的数据可以得到不同物理意义的特征 (pyhsical feature),因此,气象学家往往会对同一个模拟进行多分辨率的多次模拟。

继续阅读 »

AxiSketcher: 基于用户绘制的非线性数轴映射

Axis Sketcher用户界面

线性建模是一类典型的高维数据分析方法,它假设数据服从线性分布,并寻求拟合度最优的线性模型。然而在现实世界中,大多数数据分布都是非线性的,如对数分布、幂律分布,甚至是难以描述的高维流形分布。我们对事物的认知,往往也只能通过非线性模型来解释,但这些模型却通常难以获得,且需要借助大量的机器学习方法。那么,有没有可能通过简单交互,快速产生贴合用户认知的非线性模型呢?这篇InfoVis 2016的文章[1]给出了一种可行的思路。

继续阅读 »

在平行坐标图中集成时间序列图 (Time-Series Plots Integrated in Parallel-Coordinates Displays)

图3:探索两变量间变化的延迟的关系

时变的高维数据是一类十分复杂的数据。例如,在模型模拟数据中,通常会预先设置一些(非时变的)输入参数的数值,然后模型模拟会产生一些输出属性,其中有些是非时变的,而有些是时变的。在这些数据中,领域专家通常需要研究输入参数与输出参数、输出参数之间的关系。此时,对时变高维数据进行可视化就变得非常重要了。本篇工作中提出了一种基于平行坐标图的焦点+上下文的可视化方式,通过在平行坐标图的相邻轴之间插入时间序列图来展示时变信息。

继续阅读 »

SepMe: 2002种度量视觉元素分离程度的准则 (SepMe: 2002 New Visual Separation Measures)

12

在可视数据分析中,分析者需要用视觉观察数据,寻找有趣而未知的模式。在降维的投影的语境下,希望降低人的认知开销,让机器事先找到有趣的投影。为此,就需要量化定义投影的质量,在许多工作中都给出了各自的视觉效果度量(visual quality measure),这些度量都希望能够模仿人类知觉的准则。

本文只考虑到二维散点图的投影,在二维散点图的视觉效果度量的相关工作中,一般来说,这些视觉效果度量,或者说可分性度量,希望散点图中不同类的中心距离比较大,或者希望在不同范围中根据类标签计算出的熵比较小。不失一般性,本文只讨论数据的类别标签只有两种的情况。

继续阅读 »

多尺度、跨地域的多变量数据可视化(Visualizing Multiple Variables Across Scale and Geography )

多尺度、跨地域的多变量符号矩阵

多变量数据往往伴随着其他数据形式而出现,譬如时变多变量数据、空间多变量数据等等。多变量可视化如平行坐标、散点图矩阵等已经被广泛熟知和应用,却鲜有方法能够同时表现伴随的时空或层次信息。这篇文章 [1] 以地理空间多变量数据为核心,提出了一种新颖的可视化形式,以呈现多尺度、跨地域的数据分布与联系。

继续阅读 »

数据语境图:在同一个视图中融合数据与变量信息 (The Data Context Map: Fusing Data and Attributes into a Unified Display)

数据语境图:在同一个视图中融合数据与变量信息

设想如下的场景,一位准大学生正在寻找他心仪的大学,而他所面对的上千所高校,在各项指标上(如地理位置、学术质量、奖惩制度等)都有不同的特点,他应该如何选择呢?当然,他可以使用College Prowler [2] 这样的工具,通过不断设定过滤条件来筛选合适的学府,但这样的操作繁琐而不直观,数据探索的效率低。或许,他也可以利用高维投影(projection)、内部布局(interior layout)等方法,将这些多维数据直观展现在二维平面上。但这类方法不能兼顾表现数据与维度,他需要在多个视图中切换以观察各类信息,如学校的分布(数据关系)、指标的关联(维度关系)以及各校评分(数值情况)等等。文章作者提出了数据语境图(Data Context Map)的方法[1],该方法将数据与维度信息融合在同一个视图中,让用户能够快速地整合分析数据和维度的分布以及联系。

继续阅读 »