标签存档: 高维数据可视化

在散点矩阵中使用动画来减轻重叠(Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices)

散点矩阵(SPLOM)是可视化中渲染多变量多类别数据的常用技术。然而,多类别 SPLOMs 有透支(重叠点)的问题,大多数现有技术只关注于单个散布图与单一类的透支减轻问题。本文利用闪烁点动画来达到减轻多类别散点矩阵中的透支问题。在69个参与者的用户研究中,我们发现用户不仅在使用动画SPLAMs识别密集区域方面表现更好,而且还发现他们更容易解释,并且优于静态散点矩阵。这些结果为今后减轻多类别SPLOM透支的工作开辟了新的方向,并为应用动画减轻其他可视化形式中的透支提供了见解。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »

Pattern Trails: 对子空间中数据变化的可视分析(Pattern Trails: Visual Analysis of Pattern Transitions in Subspaces)

在高维数据中,任意维度的组合都形成一个子空间,数据关系则因维度考量的不同而发生改变。举例来说,虎与狼在肉食性、体型、栖息地等方面相近,但在基因组成、群聚性上,虎与猫则更为相近。然而,维度的组合极其繁多,其数量随维度的增多而呈指数级增长。对于如此大量的子空间,我们该如何发掘其中数据关系的变化呢?针对该问题,这篇发表于IEEE VAST 2017的文章[1]提出了Pattern Trails,一种基于可视化的交互式分析方法。

继续阅读 »

Hashedcubes: 对于大数据的简洁,低存耗,实时的可视探索 (Hashedcubes: Simple, Low Memory, Real-Time Visual Exploration of Big Data)

交互式可视化系统的设计者现在正面对着大规模、多维度的数据的挑战。这一工作为以下问题提供了一个肯定的答案:是否存在一个简单的数据结构为一个更成熟的索引提供更丰富的性能,同时使空间消耗相对较低、执行方法较为简便?

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

DSPCP:在平行坐标中展现复杂数据关系(DSPCP: A Data Scalable Approach for Identifying Relationships in Parallel Coordinates)

DSPCP:在平行坐标中展现复杂数据关系

平行坐标是一种高效而常用的、展现高维数据分布的可视化方法。其形式简洁、可扩展性强,有着同类方法难以比拟的优势。然而,平行坐标也存在不少缺点,形式不直观便是其中重要的一项。用户通过观察折线分布,仅能感知两个维度之间的线性相关性,而且往往会高估其中的正相关关系[2]。这篇发表在2017年TVCG上的文章[1],则巧妙地利用了平行坐标的点线对称性,增强了平行坐标表现复杂数据关系的能力与准确性。

继续阅读 »

Screenit: 对细胞筛选的可视分析 (Screenit: Visual Analysis of Cellular Screens)

本文介绍了针对生物制药中一种多维多层次数据——筛选数据的可视分析系统。这个系统连接了现有的支持大量数据但是层次较高的系统和支持细节层次但是数据量支持有限的系统。

继续阅读 »

通过可视化分析地理因素对多变量聚类的影响(Visualizing the Impact of Geographical Variations on Multivariate Clustering)

通过可视化分析地理因素对多变量聚类的影响

多变量地理空间数据是一种十分常见的数据类型,例如对各大城市的人口状况统计、世界各国的国力评判指标等等。如何分析地理因素(如地域的位置、范围、方向等)对多变量数据的影响,一直是地理信息、可视分析等领域的重要课题。另一方面,聚类是简化多变量分析的常用方法,它能够挖掘相似数据、总结数据特征、并消除变量增长所带来的负担。然而,当下的聚类分析方法并没有考虑地理因素的影响。这篇发表于2016年EuroVis会议的文章[1],就探讨了如何通过可视化分析地理因素对多变量聚类的影响。

继续阅读 »

斯图加特大学博士后周亮访问北京大学

ping pi2017年4月12日,德国斯图加特大学可视化研究实验室(Visualisierungsinstitut, Universitaet Stuttgart (VISUS))博士后周亮访问北大可视化与可视分析实验室。周亮博士的研究方向包括大规模多属性数据的可视化与分析,交互式复杂数据特征提取。

继续阅读 »

WeightLifter:多准则权重空间的可视探索(WeightLifter: Visual Weight Space Exploration for Multi-Criteria Decision Making)

WeightLifter:多准则权重空间的可视探索

人们在做选择的时候,往往会综合考虑事物的多个方面。譬如在选择住房时,有的人注重装修,有的人看重便利的交通,有的人则更偏好良好的社区环境等等。当多个准则并存,我们常常赋予它们不同的权重,并选择综合得分最高的作为最佳选项。然而,人对权重的把握总是模糊的,如果略微改变权重设定,得到的“最佳选项”是否会不一样呢?在这篇文章[1]中,作者们针对多准则评价体系,提出了一种探索多维权重空间的可视分析方法。利用该方法,用户能够充分了解权重变化对最终决策的影响,并有针对性地调整权重、作出选择。

继续阅读 »