标签存档: 高维数据可视化

FiberClay:通过雕刻三维轨迹揭示内在结构(FiberClay: Sculpting Three Dimensional Trajectories to Reveal Structural Insights )

随着在虚拟现实与增强现实的场景中,构建3D物体并与之交互的技术日渐成熟,可视化领域开始尝试利用这样的场景来探索、分析高维的数据。将空间数据在三维空间中可视化一直是备受争议的话题,在三维空间中可视化复杂的、大量的轨迹会遇到一系列挑战,例如密集轨迹的重叠问题会使得对轨迹的交互、查询变得繁复,尤其是在三维沉浸式空间中。本文提出FiberClay将轨迹在三维空间中可视化,同时结合新颖的3D刷选方法来快速选择轨迹,支持探索分析数据的内在结构。

继续阅读 »

Clustrophile 2:可视化指导聚类分析

聚类是探索性数据分析中一种流行的无监督学习方法。聚类算法通过基于相似性的度量将数据划分为子集,为分析人员提供了探索数据结构和变化的有力手段。然而,由不同算法、算法参数、数据子集和属性子集所决定的聚类空间是巨大的,如何引导用户高效地探索空间而不是漫无目的地尝试依然是一个巨大的挑战。为解决上述挑战,本文[1]提出了一种用于引导聚类分析的新型交互式工具Chustrophile 2。它指导用户进行基于聚类的探索性分析,适应用户反馈以改进用户指导,促进聚类的解释,并帮助用户快速推理聚类之间的差异。除此之外,Clustrophile 2还提供了一个新颖的功能,the Clustering Tour,根据用户的分析目标和期望选择聚类参数并推断不同聚类结果的质量。

继续阅读 »

SRVis:在可视化排名中实现更好的空间整合(SRVis: Towards Better Spatial Integration in Ranking Visualization)

互动排名技术大大提高了分析师根据多种标准有效做出明智和明智决策的能力。然而,现有技术不能令人满意地支持对大规模空间替代品进行排序所涉及的分析任务,例如为连锁店选择最佳位置,其中所涉及的复杂空间背景对于决策过程是必不可少的。在将排名与空间背景相结合的先前尝试中观察到的局限性促使我们开发上下文集成的视觉排序技术。基于我们通过与领域专家合作总结的一组通用设计要求,本文[1] 提出了SRVis,一种新颖的空间排序可视化技术,通过解决上述环境集成中的三个主要挑战,即支持高效的空间多标准决策过程,即a)空间排名和背景的呈现,b)排名的可视化表示的可扩展性,以及c)对上下文整合的空间排名的分析。具体来说,我们使用可扩展的基于矩阵的可视化和基于新型两阶段优化框架的堆叠条形图来编码大量排名及其原因,该框架可最大限度地减少信息丢失,并采用灵活的空间过滤和直观的比较分析来实现 深入评估排名并帮助用户选择最佳空间替代方案。通过对优化方法,两个案例研究和专家访谈的实证研究,对所提出技术的有效性进行了评估和论证。

继续阅读 »

SIRIUS:交互式对称双向降维技术(SIRIUS: Dual, Symmetric, Interactive Dimension Reductions)

在经典的降维技术中,维度(attributes)一般被视作输入而数据(observations)作为输出,用户通过与数据投影进行交互来了解数据与维度之间的关联。但在许多分析场景中,两者地位平等、相互影响、密不可分。通过分析数据之间的关系,能够揭示维度的重要性与价值,反之亦然。例如在区分西瓜与梨子时,“尺寸”是十分重要的因素。又如在强调糖分与水分的相关性时,“西瓜”便比“糖葫芦”更有说服力。为了帮助用户进行数据与维度的双向关联性分析,这篇发表于IEEE VIS 2018的文章[1]提出了SIRIUS(Symmetric Interactive Representations In a Unified System):即同一系统下的交互性对称双向降维技术。

继续阅读 »

在散点矩阵中使用动画来减轻重叠(Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices)

散点矩阵(SPLOM)是可视化中渲染多变量多类别数据的常用技术。然而,多类别 SPLOMs 有透支(重叠点)的问题,大多数现有技术只关注于单个散布图与单一类的透支减轻问题。本文利用闪烁点动画来达到减轻多类别散点矩阵中的透支问题。在69个参与者的用户研究中,我们发现用户不仅在使用动画SPLAMs识别密集区域方面表现更好,而且还发现他们更容易解释,并且优于静态散点矩阵。这些结果为今后减轻多类别SPLOM透支的工作开辟了新的方向,并为应用动画减轻其他可视化形式中的透支提供了见解。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »

Pattern Trails: 对子空间中数据变化的可视分析(Pattern Trails: Visual Analysis of Pattern Transitions in Subspaces)

在高维数据中,任意维度的组合都形成一个子空间,数据关系则因维度考量的不同而发生改变。举例来说,虎与狼在肉食性、体型、栖息地等方面相近,但在基因组成、群聚性上,虎与猫则更为相近。然而,维度的组合极其繁多,其数量随维度的增多而呈指数级增长。对于如此大量的子空间,我们该如何发掘其中数据关系的变化呢?针对该问题,这篇发表于IEEE VAST 2017的文章[1]提出了Pattern Trails,一种基于可视化的交互式分析方法。

继续阅读 »

Hashedcubes: 对于大数据的简洁,低存耗,实时的可视探索 (Hashedcubes: Simple, Low Memory, Real-Time Visual Exploration of Big Data)

交互式可视化系统的设计者现在正面对着大规模、多维度的数据的挑战。这一工作为以下问题提供了一个肯定的答案:是否存在一个简单的数据结构为一个更成熟的索引提供更丰富的性能,同时使空间消耗相对较低、执行方法较为简便?

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

DSPCP:在平行坐标中展现复杂数据关系(DSPCP: A Data Scalable Approach for Identifying Relationships in Parallel Coordinates)

DSPCP:在平行坐标中展现复杂数据关系

平行坐标是一种高效而常用的、展现高维数据分布的可视化方法。其形式简洁、可扩展性强,有着同类方法难以比拟的优势。然而,平行坐标也存在不少缺点,形式不直观便是其中重要的一项。用户通过观察折线分布,仅能感知两个维度之间的线性相关性,而且往往会高估其中的正相关关系[2]。这篇发表在2017年TVCG上的文章[1],则巧妙地利用了平行坐标的点线对称性,增强了平行坐标表现复杂数据关系的能力与准确性。

继续阅读 »