月度存档: 六月 2015

矩阵可视化中表现形式和并列排布方式对视觉感知的影响(The Effects of Representation and Juxtaposition on Graphical Perception of Matrix Visualization)

TileMatrix

图数据(或网络结构数据)是一种常见的由顶点和边组成的数据类型,例如人与人的社交网络,计算机网络架构。对于网络数据的可视化通常有矩阵(matrix)和点边图(node-link graph)两种形式。本文[1]专注分析无向图数据的矩阵可视化。包括分析两种矩阵的表现形式:方形矩阵(square matrix)和三角矩阵(triangular matrix),以及基于三角矩阵的三种并列排布方式:并排(side-by-side),背靠背(back-to-back),互补拼接(complementary) 对用户的影响。并且基于分析的结论提出了用于时变(time-varying),多属性(multi-faceted),带权重(weighted)的无向图数据的可视化设计—— TileMatrix。 继续阅读 »

g-Miner:多变量图上的交互式分组挖掘(g-Miner: Interactive Visual Group Mining on Multivariate Graphs)

定制模板以查找合适的分组

想象你是一个大型公司的人力资源部经理,你需要从几千名职员中挑选一群人组成一个项目团队。除了相互熟悉以外,他们也必须具备特定的能力。当有人退出时,你还需要快速地找到替代者,以保证团队的运营。在数据挖掘领域,类似的任务又被称作分组挖掘(Group Mining)。而事实上,每个职员都具备不同的能力,他们之间又有错综复杂的社会关系。你所面对的,其实是一张大规模的多变量图(Large-scale Multivariate Graph)。如何帮助用户在这种图上快速地进行分组数据挖掘,就是g-Miner这一工具 [1] 所要解决的问题。

继续阅读 »

散点图的动态透明度优化(Dynamic Opacity Optimization for Scatter Plots)

图九:真实的数据

这是一篇简短而有趣的文章,作者是来自AutoDesk Research的Justin Matejka,Fraser Anderson和George Fitzmaurice,发表于CHI 2015 [1]。文章试图解决一个常见而棘手的问题:当散点图的数据量过大时,数据的重叠会引起严重的视觉遮挡,影响用户对数据结构和分布的理解。比如图一这种情况,我们已经很难从散点图上看出数据分布的特征。
解决这种视觉拥挤或者说过度渲染的方法主要有以下几种方法:降低数据规模,减小数据点尺寸,改变数据点形状,移除填充色,使用半透明色。使用半透明色是实践中最主要和有效的手段,但透明的选择需要用户的经验进行反复调节,当有很多散点图并行展示时(比如散点图矩阵),用户设置就会显得单调而低效。因此作者希望通过搜集一系列的用户设置数据,寻找一个简单的模型来描述数据特征和渲染透明度的关系,进而能够自动调整散点图的渲染透明度。
继续阅读 »

单子探索:一叶知秋 (Monadic Exploration: Seeing the Whole Through Its Parts)

图1 单子探索界面设计

在日常学习、工作和生活中,人、事、物之间以各种各样的关系彼此关联着:人们之间存在着社交网络关注的关系;研究人员之间存在着项目合作、论文合作者的关系;著作之间存在着引用的关系等等。这些存在关系的数据构建出了一个关系信息空间。对这个空间进行浏览 (navigation) 有助于我们更好地探索其中存在的关系结构。而对关系信息空间进行浏览并不总是很容易的,尤其是当这个空间存在着异构的、或大规模的数据项。这篇文章[1]则提出了一种新的浏览关系信息空间的方法——单子探索

继续阅读 »

欺骗性的可视化如何骗人?:常见扭曲技术的实证性研究 (How Deceptive are Deceptive Visualizations?: An Empirical Analysis of Common Distortion Techniques)

啊啊啊

随着大数据时代的来临,可视化技术的运用越来越广泛。媒体人、政治家纷纷利用可视化图片表述自己的观点,以赢得大众的支持。尽管这些可视化图片可以直观的传达大量信息,但他们同时也会扭曲信息,误导大众。许多时候这种误导的故意的:可视化图片的制作者会故意通过扭曲可视化结果来增强其效果。也有时候,这种误导是无意的:制作者可能对可视化技术并不熟悉而错误的使用了某些技术。在CHI2015会议上,来自美国纽约大学(NYU)的几名研究者报道了他们在这方面进行的实证研究工作[1]。他们将这类误导性的可视化成为欺骗性可视化(Deceptive Visualization)。从图1中的一些典型的案例出发,它们对相关的技术进行了分类,并通过实验研究了其中一些技术对人理解图片含义造成的影响。此外,他们还研究了不同类型的人对欺骗性可视化的反应。

继续阅读 »

À Table!一个提升足球联赛排行榜时变探索能力的工具

图3:À Table!的界面概览

这篇工作来自于2014年CHI会议,由法国INRIA实验室与美国哈佛大学联合完成。
本文针对的数据是足球联赛的排行榜数据。图1展示的就是某足球联赛中一轮比赛结束后的排行榜情况,其中主要包含各个足球队队伍信息(队名,队徽),积分、胜负平场数、进球失球数等数据,以及根据积分的排名和排名变化情况。而在足球联赛中,通常会有若干轮比赛,这样就能得到数张类似的排行榜。从一系列的排行榜的演变中,读者能够获取到各支队伍的积分变化情况、排名变化情况等等。具体到这篇工作所使用的数据,该联赛有20支队伍,共进行38轮比赛,每支队伍含有10项属性信息。同时,排行榜的读者可以针对其中某一个属性定义一个排序函数,并应用于各个轮次的排行榜数据上,用于理解数据。

继续阅读 »

MatrixWave: 事件序列数据的视觉比较 (MatrixWave: Visual Comparison of Event Sequence Data)

matrixwave1

事件序列数据是我们生活中很常见的一类数据。它由一系列带有时间戳的事件组成,往往与人们的活动息息相关,因此对这类数据的分析也成为了许多领域的研究热点。这里面一个重要的分析任务就是不同时间段和不同人群之间的比较。例如,网站日志记录了用户访问网页并在不同网页之间跳转的过程,作为网站分析人员,他们可能想知道有多少用户访问了一个特定的网页,用户在他们网站的停留时间以及主要的访问路径。尽管现在也有一些诸如辛基图(Sankey Diagram)等针对这类数据的可视化技术,但是涉及到视觉比较方面的工作却非常少。因此这篇文章就提出了一种可视化的设计,MatrixWave[1],不仅可以对大而密集的单一事件序列数据进行可视化呈现,还可用于两个相关事件序列数据的比较分析。

继续阅读 »

社交行为的相近时间关系可视分析 (Visual Analysis of Proximal Temporal Relationships of Social and Communicative Behaviors)

4

发展心理学专家在研究儿童的社会和交流行为时,通常关注于他们在相近时间上的行为表现,例如婴儿对自己名字的反应。心理学家希望通过这些行为的分析来来提前发现儿童的自闭症、发育障碍等问题。
继续阅读 »