标签存档: 散点图

AxiSketcher: 基于用户绘制的非线性数轴映射

Axis Sketcher用户界面

线性建模是一类典型的高维数据分析方法,它假设数据服从线性分布,并寻求拟合度最优的线性模型。然而在现实世界中,大多数数据分布都是非线性的,如对数分布、幂律分布,甚至是难以描述的高维流形分布。我们对事物的认知,往往也只能通过非线性模型来解释,但这些模型却通常难以获得,且需要借助大量的机器学习方法。那么,有没有可能通过简单交互,快速产生贴合用户认知的非线性模型呢?这篇InfoVis 2016的文章[1]给出了一种可行的思路。

继续阅读 »

SepMe: 2002种度量视觉元素分离程度的准则 (SepMe: 2002 New Visual Separation Measures)

12

在可视数据分析中,分析者需要用视觉观察数据,寻找有趣而未知的模式。在降维的投影的语境下,希望降低人的认知开销,让机器事先找到有趣的投影。为此,就需要量化定义投影的质量,在许多工作中都给出了各自的视觉效果度量(visual quality measure),这些度量都希望能够模仿人类知觉的准则。

本文只考虑到二维散点图的投影,在二维散点图的视觉效果度量的相关工作中,一般来说,这些视觉效果度量,或者说可分性度量,希望散点图中不同类的中心距离比较大,或者希望在不同范围中根据类标签计算出的熵比较小。不失一般性,本文只讨论数据的类别标签只有两种的情况。

继续阅读 »

多尺度、跨地域的多变量数据可视化(Visualizing Multiple Variables Across Scale and Geography )

多尺度、跨地域的多变量符号矩阵

多变量数据往往伴随着其他数据形式而出现,譬如时变多变量数据、空间多变量数据等等。多变量可视化如平行坐标、散点图矩阵等已经被广泛熟知和应用,却鲜有方法能够同时表现伴随的时空或层次信息。这篇文章 [1] 以地理空间多变量数据为核心,提出了一种新颖的可视化形式,以呈现多尺度、跨地域的数据分布与联系。

继续阅读 »

散点图的动态透明度优化(Dynamic Opacity Optimization for Scatter Plots)

图九:真实的数据

这是一篇简短而有趣的文章,作者是来自AutoDesk Research的Justin Matejka,Fraser Anderson和George Fitzmaurice,发表于CHI 2015 [1]。文章试图解决一个常见而棘手的问题:当散点图的数据量过大时,数据的重叠会引起严重的视觉遮挡,影响用户对数据结构和分布的理解。比如图一这种情况,我们已经很难从散点图上看出数据分布的特征。
解决这种视觉拥挤或者说过度渲染的方法主要有以下几种方法:降低数据规模,减小数据点尺寸,改变数据点形状,移除填充色,使用半透明色。使用半透明色是实践中最主要和有效的手段,但透明的选择需要用户的经验进行反复调节,当有很多散点图并行展示时(比如散点图矩阵),用户设置就会显得单调而低效。因此作者希望通过搜集一系列的用户设置数据,寻找一个简单的模型来描述数据特征和渲染透明度的关系,进而能够自动调整散点图的渲染透明度。
继续阅读 »

多类散点图的可视化概括与探索(Visual Abstraction and Exploration of Multi-class Scatterplots)

sample

散点图是应用最广泛的可视化图表之一,在展现数据分布、辅助数据分析等方面一直扮演着重要角色。但随着数据量的增长,由数据交叠引起的视图混杂使其不适用于大数据的可视化。针对数据交叠的问题,领域内的研究者提出了许多不同的解决方案,包括改变视图元素、显示密度分布、扭曲放大视图等等,这些方法都试图从提高空间利用率和减小数据规模两方面,来寻求问题的解答。在本文中[1],来自浙江大学可视化小组的研究者们则提出利用层次化的“多类蓝噪声采样”方法[2],通过采样数据集得到模拟原数据分布的低密度分布,以大大减轻视图负担和数据交叠,并辅助多类散点图的可视化探索。

继续阅读 »

选择散点图及降维技术的经验式指引 (Empirical Guidance on Scatterplot and Dimension Reduction Technique Choices)

1

在可视化高维数据的时候,我们常常需要先对数据进行降维,然后将降维后的数据以散点图的形式展现出来。在这个过程中,我们既需要选择合适的降维技术(Dimension Reduction Technique, DR),也需要选择合适的可视展现方式(Visual Encoding, VE),才能较好地通过降维数据来展现原高维数据的结构和特征。哥伦比亚大学的Michael Sedlmair等人[1]开展了一次相关的数据研究,探寻了三种散点图形式对不同降维数据的可视化效果,并基于研究的结果给出了如何选择散点图来表现降维数据的经验式指引。

继续阅读 »