月度存档: 十二月 2013 - 第2页

针对空间聚类的可视分析:通过启发式方法来引导对聚类结果的探索 (Visual Analytics for Spatial Clustering: Using a Heuristic Approach for Guided Exploration)

如今,具有定位功能的设备越来越普及,使得越来越多的数据带有了地理空间属性。与之对应地,对这类数据的分析需求也越来越旺盛,例如在旅游业、城市规划、安全等等领域的应用。在探索这类数据时,分析专家或者领域专家往往希望在初始时能得到数据的概览,从而能对数据的空间分布与聚集关系有一定的了解。一种常用的方法就是对数据进行空间聚类。大多数已有的聚类方法均需要在算法开始前指定参数,难以有参数设定的推荐。同时,对于用户的参数选择,这些方法也难以对聚类结果的好坏程度给出一些视觉上的反馈。针对这些问题,本文应用计算几何中一种基于距离的空间聚类算法α-shape,能同时解决空间点的聚类问题以及用形状来表示聚类结果的问题,通过可视化与启发式的交互手段,使得用户可以对不同参数下的聚类结果进行探索,对聚类过程进行操纵。

继续阅读 »

等高线箱线图:一种描述系集模拟数据中特征集合不确定性的方法 (Contour Boxplots: A Method for Characterizing Uncertainty in Feature Sets from Simulation Ensembles)

系集模拟的研究方法在诸如气象学、计算流体力学等学科有着十分广泛的应用,其目的是为了了解模型以及参数的稳定性。已有的系集可视化方法通常直接将系集成员可视化,或者将诸如均值等聚集值可视化。然而,在很多情况下,系集模拟中令人感兴趣的部分通常不是数值场,而是其中的特征集合。这种特征集合通常为物理变量或者其衍生变量的阈值,从可视化的角度来看即为标量场的等高线。在这个工作中,作者从箱线图受到启发,从箱线图所表示的统计深度 (statistical depth) 类比到等高线的带深度 (contour band depth),提出了等高线箱线图 (Contour Boxplots),用于对系集等高线的不确定性进行描述。
继续阅读 »

径向集:大规模重叠集合的可交互可视分析 (Radial Sets: Interactive Visual Analysis of Large Overlapping Sets)

集合在数学上的定义是包含若干不重复元素的一个整体抽象概念,现实中的很多数据都可以以集合的形式展现,不管是论文数据、电影数据等。然而定义在相同数据集上的集合可能产生重叠,重叠的部分对数据分析有着很大的影响。最基本的分析集合的方式是文氏图,但是当集合数量增大时集合之间的关系会变难以观察(如图1)。针对大规模集合交集中的问题,本文[1]提出了可交互的径向集可视化方法。 继续阅读 »

通过交互式可视化理解商业生态系统中企业间的关系 (Understanding Interfirm Relationships in Business Ecosystems with Interactive Visualization)

商业生态系统具有数量庞大、关系复杂、公司网络遍布全球的特点,与此同时他们通过相互之间的合作、合伙和竞争来创造和交付新产品和服务。考虑到商业生态系统在数据规模,复杂度和快速变化方面的迅猛增长,以及经济和竞争带来的压力,分析人员要面对迅速理解这些企业关系网络中的基本特征的高强度任务。而已有工具只能提供以查询或列表形式等有限的交互分析功能。本文为解决大规模商业数据快速分析的问题,设计并实现了dotlink360,一个交互的可视化系统,提供了能够洞察商业生态系统的组成成分,时序统计信息和各个属性之间的连接关系的功能。

继续阅读 »

基于正投影的星型坐标(Orthographic Star Coordinates)

高维数据分析与可视化是一个重要且充满挑战的研究话题。本篇博客介绍的文章[1]主要针对星型坐标(Star Coordinates)的可视化方式,提出了一种更好地保持高维数据性状、交互进行可视分析探索的一种方式(Orthographic Star Coordinate)。

继续阅读 »

GPLOM:高维多变量可视化的广义视图矩阵(GPLOM: The Generalized Plot Matrix for Visualizing Multidimensional Multivariate Data)

GPLOM概览

在高维多变量可视化里,类别变量(Categorical Variable)常常被作为取值离散的连续变量(Continuous Variable)来处理和表现,但这种方式无法从视觉上区分大量取值相同的数据,因而会导致严重的视图遮挡,并大大降低信息表达的效率。而常见的类别可视化方法(Categorical Visualization)往往只适用于维度较低的情形,其维度扩展能力普遍较差。到这篇来自IEEE InfoVis 2013的文章通过在散点图矩阵中引入类别可视化方法、构造混合视图的广义视图矩阵,来达到消除数据遮挡、简化视图形式的目的,从而在高维多变量情况下高效地表达类别型数据的信息。
继续阅读 »