作者存档: zuchao.wang

欺骗性的可视化如何骗人?:常见扭曲技术的实证性研究 (How Deceptive are Deceptive Visualizations?: An Empirical Analysis of Common Distortion Techniques)

随着大数据时代的来临,可视化技术的运用越来越广泛。媒体人、政治家纷纷利用可视化图片表述自己的观点,以赢得大众的支持。尽管这些可视化图片可以直观的传达大量信息,但他们同时也会扭曲信息,误导大众。许多时候这种误导的故意的:可视化图片的制作者会故意通过扭曲可视化结果来增强其效果。也有时候,这种误导是无意的:制作者可能对可视化技术并不熟悉而错误的使用了某些技术。在CHI2015会议上,来自美国纽约大学(NYU)的几名研究者报道了他们在这方面进行的实证研究工作[1]。他们将这类误导性的可视化成为欺骗性可视化(Deceptive Visualization)。从图1中的一些典型的案例出发,它们对相关的技术进行了分类,并通过实验研究了其中一些技术对人理解图片含义造成的影响。此外,他们还研究了不同类型的人对欺骗性可视化的反应。

继续阅读 »

可视分析中的知识产生模型 (Knowledge Generation Model for Visual Analytics)

可视分析技术已经发展了近十年。在这些年间,人们研究了大量的可视分析方法和案例,发表了不少研究论文。然而,对于一些基本问题,人们依然没有明确的答案。例如,一个基本的可视分析流程是怎样的?一个可视分析系统应该包含哪几个组件?如何评价和比较不同的可视分析系统?在VAST’2014的一篇论文中[1],Sacha等人提出了一个可视分析模型,系统性的回答了以上问题。

继续阅读 »

传感器网络中时序数据相似性探索与异常检测的可视分析 (Visual Analysis of Time-Series Similarities for Anomaly Detection in Sensor Networks)

智能电网(Smart Grid)连接城市的不同部位,将发电厂产生的电能输送到千家万户,对城市的正常运转至关重要。用户用电量的变化,以及偶尔发生的电网故障,都会导致电网上各处的负载发生变化。电网不同位置有不同的负载变化模式,会出现不同的异常状况。电网管理人员需要密切监视这些模式和异常。然而,对电网负载的分析较为复杂。首先,这种分析需要同时考虑多个角度,包括:电网上传感器的空间分布、拓扑关系以及每一个传感器上的负载变化,而通常的分析工具往往只考虑时变特征或者拓扑特性。此外,电网上的异常行为通常难以预知,因此没有特别好的自动方法可以检测所有异常,而异常检测很大程度上以来于专业人员的判断。在EuroVis 2014中,来自德国的研究者们设计了一个可视分析系统 [1],可以同时研究电网中的相似性和异常事件。

继续阅读 »

动态图可视化综述 (The State of the Art in Visualizing Dynamic Graphs)

最近二十年来,随着动态图数据的大量产生,动态图可视化研究也得到了长足的发展。人们设计了许多可视化技术,用于支持不同种类的探索任务。接着,为了比较不同技术的优劣,人们又并发展了相应的评价方法。在此过程中,人们也将动态图可视化技术运用于解决一系列实际问题。Beck等人在今年EuroVis的Start of the Art Report环节报告了一篇综述论文[1],总结了现有的动态图可视化研究。他们共计考察了129篇相关论文,将它们大致分为技术类、评价类和应用类。他们随后对以上三方面研究进行详细的归类整理,并在最后展望了未来的研究方向。

继续阅读 »

利用可视分析进行时间序列模型选择(Visual Analytics for Model Selection in Time Series Analysis)

时间序列分析在医疗、气象、金融等领域非常常用。常见的分析任务包括:判断一个变量是否存在明显的随时间上升或下降趋势,根据过去的变化趋势预测未来的值。为了完成这些分析任务,人们发展了许多时间序列模型,包括时间域模型和频率域模型。本文将要提到的SARIMA模型就是一种常用的时间域模型。该模型有7个超参数需要分析人员结合自己的经验手动指定,而指定这些参数的过程称为模型选择。统计学家发展了一套标准的适用于SARIMA模型的模型选择流程,称为Box-Jenkins方法。现有的常用分析软件(例如R)已经支持基于Box-Jenkins方法的模型选择流程,然而该过程需要分析人员手动输入多条命令,在不同的显示图表之间切换,并且手动比较多个模型。进行这些操作并不方便。本文的作者基于R中已有的算法,使用Java重新设计了一个支持模型选择的可视分析界面TiMoVA[1](Time series analysis, Model selection, and VA),能够支持更流畅的模型选择流程。

继续阅读 »

利用空间变换研究群体移动 (Space Transformation for Understanding Group Movement)

在许多时候,我们需要对群体的移动进行分析。例如,对于一些动物的移动,我们可能会关心谁在路线确定上起领导作用,谁倾向于走在队伍的前列,每个动物的相对位置是否会随着时间变化。传统的分析方法可以提取移动特征,例如移动群体、相遇、趋势设定,但是却不能很好的表现这些特征。而相关的可视分析方法还很原始,目前只能显示群体属性随时间的变化,例如群体位置凸包的面积和形状随时间的变化。这些现有的方法都不能满足复杂问题的分析需求,例如动物的行为分析。对此,德国Fraunhofer Institute IAIS的Natalia Andrienko等人提出了空间变换的方法[1]。他们的方法可以对群体移动进行深入的研究。

继续阅读 »

大规模城市时空数据的可视化探索:以纽约出租车载客记录的研究为例 (Visual Exploration of Big Spatio-Temporal Urban Data: A Study of New York City Taxi Trips)

目前,越来越多的出租车安装了GPS,从而产生了大量的出租车数据。这些数据记录了出租车的行为,反映了城市的生活方式,并且可以帮助出租车运行部门监控出租车运行状态、改进出租车的调度。以纽约出租车数据为例,在2009、2011和2012年共有5.4亿次载客,每次载客记录了出租车编号、司机编号、起始终止的时间和地点、行驶距离以及车费、小费和收费数据。这是一个典型的 Origin-Destination (OD) 数据,只有起始终止信息而没有轨迹信息。该数据原始大小为120GB,存储为一系列csv文件。然而,纽约的城市规划和交通专家目前并没有很好的工具来分析这些出租车数据。他们面临两大困难。首先,为了能够对数据进行筛选和统计,他们需要学习数据库查询语言 (例如SQL),而这对他们很困难。此外,他们常用的工具 (例如Matlab、R、ARCGIS) 都无法处理如此大量的数据,因此他们每次只能研究数据的一个小样本。这样一来,他们通常只能根据经验猜想数据中可能存在某种现象,然后用一个小数据来验证,而对整个数据的全面探索无法完成。而且,由于要不断的用数据库输出小样本,再调用分析工具,整个工作流程非常繁琐,还容易出错。针对以上两点问题,纽约大学 Claudio Silva 教授带领他的研究组,开发了一个出租车OD数据分析系统TaxiVis [1],能够对三年的出租车数据进行流畅的探索式分析,并且查询操作完全图形化,简单直接。

继续阅读 »

Small Multiple显示中多类别的结构化比较模型(A Model for Structure-Based Comparison of Many Categories in Small-Multiple Displays)

不同类别间的相互比较是可视化中的一个基本任务。以船舶轨迹数据为例,人们需要比较船舶在一周不同天和一天不同时刻的线路。对于这类任务,一种通常的可视化策略是Small Multiple显示,而Pivot Table就是相应的一种可视化形式。那么,用Pivot Table到底可以完成哪些比较人物呢?如何设计Pivot Table以支持这些比较任务呢?

继续阅读 »

基于出租车轨迹数据的交通拥堵可视分析(Visual Traffic Jam Analysis based on Trajectory Data)

提到交通拥堵,大家一定都感到头疼。它让我们的出行变得不便,心情变得焦虑。同时它减缓了物流,加剧了空气污染。理解和治理交通拥堵是许多人的梦想,政府、企业、研究机构都在用各自的方法为着这个梦想而努力。作为我们研究可视化的人来说,我们是否也可以为理解和治理交通拥堵尽一份力呢?在我们最新的工作中,我们将可视分析方法运用于交通拥堵分析,得到了不错的结果。相应的论文[1]已经被IEEE VAST 2013所接收。

继续阅读 »

大规模移动数据中换乘模式的可视化(Visualizing Interchange Patterns in Massive Movement Data)

今年的EuroVis会议上有一篇关于移动数据中换乘模式的可视化工作[1]。文章以乘客在地铁系统内部的换乘为例,介绍了一种基于环形表示的可视化设计,如图1。它简洁的展现了在每个地铁站内,乘客进出站和乘坐或换乘线路的流量信息(统称为换乘模式),并支持不同地铁站和不同时间之间换乘模式的比较。

继续阅读 »