标签存档: 高维数据

北大可视化课程设计精选 – 1:企业对比:腾讯 vs 阿里

北京大学开设包括本科和研究生在内的可视化课程。其中本科课程自2008年开始开设,是国内早期开设专门课程之一。每年可视化课的最重要环节是课程设计。在此我们展示相关的优秀结果。注意到这是作为一个课程的设计作业,参与的同学基本都没有此前的前端实现经验,课程设计更体现的初步掌握可视化方法来分析解决实际问题。

继续阅读 »

Visual Boosting in Pixel-based Visualizations (基于像素的可视化中的视觉增强)

基于像素的可视化方法是针对每一个数据项仅使用很小的一个区域(若干个像素)进行视觉编码的一种可视化方法。在面对大规模数据集时,基于像素的可视化方法有较好的表现,可以提供高分辨率。然而同时也有其弊端,若数据较为稀疏,像素大小的数据项容易被人忽视,而若数据项较密集,紧密排布的像素数据点会掩盖潜在的数据特征。因此,视觉增强的方法被用来加强对基于像素的可视化的认知,常用的视觉增强方法有光轮、颜色、变形、影线、形状符号等。

继续阅读 »

在散点矩阵中使用动画来减轻重叠(Using Animation to Alleviate Overdraw in Multiclass Scatterplot Matrices)

散点矩阵(SPLOM)是可视化中渲染多变量多类别数据的常用技术。然而,多类别 SPLOMs 有透支(重叠点)的问题,大多数现有技术只关注于单个散布图与单一类的透支减轻问题。本文利用闪烁点动画来达到减轻多类别散点矩阵中的透支问题。在69个参与者的用户研究中,我们发现用户不仅在使用动画SPLAMs识别密集区域方面表现更好,而且还发现他们更容易解释,并且优于静态散点矩阵。这些结果为今后减轻多类别SPLOM透支的工作开辟了新的方向,并为应用动画减轻其他可视化形式中的透支提供了见解。

继续阅读 »

在可视分析中系统地结合降维投影与聚类方法(Towards a Systematic Combination of Dimension Reduction and Clustering in Visual Analytics)

在可视分析中系统地结合降维投影与聚类方法

在高维数据分析中,聚类(Clustering)与降维(Dimension Reduction)都是常用的机器学习方法。前者尝试对数据进行归纳分类,而后者则试图压缩维度并尽可能地保留分布信息。可视分析往往结合两者的优点,以帮助用户更好地挖掘数据隐含的信息。在具体应用中,我们应该如何挑选聚类和降维方法呢?两者的结合都有哪些因素需要考虑,又有哪几种不同的方案呢?这篇发表于IEEE VAST 2017的文章[1] 便系统地探讨了这些问题。

继续阅读 »

对人工神经网络的隐式行为进行可视化 (Visualizing the Hidden Activity of Artificial Neural Networks)

图3:训练前后MLP最后一层数据表示的投影图

在许多机器学习任务中,人工神经网络尤其是近些年发展起来的深度学习网络,已经取得了十分瞩目的结果。然而,以前研究者往往将神经网络的内部行为当作黑盒来看待,神经网络到底学习到了什么并不了解。近些年来,研究者们逐渐开始关注这一问题,并通过了解其内部行为来帮助优化模型。而这篇工作则是从可视化的角度出发来对待这个问题。

继续阅读 »

用时序MDS视图分析高维数据(Temporal MDS Plots for Analysis of Multivariate Data)

在大数据时代,数据的维度越来越丰富,一个数据往往拥有许多属性(Multivariate)。同时数据越来越多的数据带有着时间属性,如何分析高维数据的在时间上的模式成为一项挑战。在现实中,这类数据包括了计算机通络流量数据、医疗数据、金融数据等。可视分析技术致力于帮助人们理解复杂的数据并且找到数据中蕴含的模式。在2015的VAST论文中,来自德国Konstanz大学的小组提出了时序MDS视图(Temporal MDS Plots)的方法帮助分析高维数据在时间上的模式。 继续阅读 »

决策探索实验室:一个针对决策管理的可视分析解决方案(Decision Exploration Lab: A Visual Analytics Solution for Decision Management)

随着现在时代的发展,可视分析不仅仅用于传统的科学数据或者统计数据等量化、可描述的领域,而对于“过程”、“决策”等这些看似抽象的东西,也有可视分析的用武之地。这篇文章,我们就来介绍一个在管理科学领域,利用可视分析对决策流程的管理、探索与优化的故事。

继续阅读 »