月度存档: 十二月 2013

ScatterBlog2:通过用户监督下的过滤对微博信息进行实时监控(ScatterBlogs2: Real-Time Monitoring of Microblog Messages Through User-Guided Filtering)

图4 最终结果

每天微博上都会出现海量的信息,这些数据时时刻刻都在增加着。为了能够实时监控感兴趣的主题,我们需要有一套合适的方法来筛选这些大规模并且不断变化的数据。这篇IEEE VAST 2013的文章[1]设计了一套新颖的系统,让分析者能够交互的创建过滤器,并实时交互地监测微博上的热点事件。
继续阅读 »

利用空间变换研究群体移动 (Space Transformation for Understanding Group Movement)

img_andrienko_crop

在许多时候,我们需要对群体的移动进行分析。例如,对于一些动物的移动,我们可能会关心谁在路线确定上起领导作用,谁倾向于走在队伍的前列,每个动物的相对位置是否会随着时间变化。传统的分析方法可以提取移动特征,例如移动群体、相遇、趋势设定,但是却不能很好的表现这些特征。而相关的可视分析方法还很原始,目前只能显示群体属性随时间的变化,例如群体位置凸包的面积和形状随时间的变化。这些现有的方法都不能满足复杂问题的分析需求,例如动物的行为分析。对此,德国Fraunhofer Institute IAIS的Natalia Andrienko等人提出了空间变换的方法[1]。他们的方法可以对群体移动进行深入的研究。

继续阅读 »

多态社交网络可视分析:和社会学家的合作设计研究(Visual Analytics for Multimodal Social Network Analysis: A Design Study with Social Scientists)

图1 系统界面

传统的社交网络分析(Social network analysis,SNA)[1] 主要研究结点和边的关系,所有的结点都是同一类型的数据。但是,有的网络结点可能是不同类型的,比如论文合作关系,既有作者结点,又有论文结点,还可能有会议结点,机构结点等。这些所有的结点混在一起组成的社交网络,每一类结点我们称为一种模式(Mode),用传统的图分析方法就很难研究模式间的关系。研究这类社交网络的方法称为多态社交网络分析(Multimodal social network analysis,mSNA)。这篇来自IEEE VAST 2013的文章[2] 通过与社会学家合作,设计了一套针对多态社交网络的可视分析方法,首先针对mSNA抽象出来问题模型,然后设计了可视分析系统MMGraph,最后根据社会学家的反馈总结了研究人员如何和领域专家进行合作的流程。
继续阅读 »

大规模城市时空数据的可视化探索:以纽约出租车载客记录的研究为例 (Visual Exploration of Big Spatio-Temporal Urban Data: A Study of New York City Taxi Trips)

taxi_teaser_crop

目前,越来越多的出租车安装了GPS,从而产生了大量的出租车数据。这些数据记录了出租车的行为,反映了城市的生活方式,并且可以帮助出租车运行部门监控出租车运行状态、改进出租车的调度。以纽约出租车数据为例,在2009、2011和2012年共有5.4亿次载客,每次载客记录了出租车编号、司机编号、起始终止的时间和地点、行驶距离以及车费、小费和收费数据。这是一个典型的 Origin-Destination (OD) 数据,只有起始终止信息而没有轨迹信息。该数据原始大小为120GB,存储为一系列csv文件。然而,纽约的城市规划和交通专家目前并没有很好的工具来分析这些出租车数据。他们面临两大困难。首先,为了能够对数据进行筛选和统计,他们需要学习数据库查询语言 (例如SQL),而这对他们很困难。此外,他们常用的工具 (例如Matlab、R、ARCGIS) 都无法处理如此大量的数据,因此他们每次只能研究数据的一个小样本。这样一来,他们通常只能根据经验猜想数据中可能存在某种现象,然后用一个小数据来验证,而对整个数据的全面探索无法完成。而且,由于要不断的用数据库输出小样本,再调用分析工具,整个工作流程非常繁琐,还容易出错。针对以上两点问题,纽约大学 Claudio Silva 教授带领他的研究组,开发了一个出租车OD数据分析系统TaxiVis [1],能够对三年的出租车数据进行流畅的探索式分析,并且查询操作完全图形化,简单直接。

继续阅读 »

SoccerStories:为足球可视分析开球 (SoccerStories: A Kick-off for Visual Soccer Analysis)

soccer

随着科技的发展,全程收集足球比赛的数据记录,包括了与时间相关的多维属性,球员位置、动作类型等等已经成为可能。在拥有了这样的数据后,如何分析和有效地重现球赛,并没有得到很好的研究。目前,大多数关于此类数据的分析仍是针对个别球员或整支队伍的数值统计上。还有一些可视化工作是通过直接绘制或HeatMap的形式来表达球员的聚集位置信息。但这样做会丢失位置之间的连贯性。为解决这个的问题,也有通过流图(Flow Graph)来表现其连接性,但仍丢失了例如球员动作这样的属性信息。一场球赛涉及到的不仅仅是这些统计的数字信息或者位置信息,而是一个多维的时空数据。针对这样一个复杂的时空数据,本文[1]将一场足球比赛分解为多个阶段(Phase),而对每一个阶段进行可视化表示来作为一个切入点。从这个切入点出发,本文设计了SoccerStories,一种探索足球比赛的阶段的可视分析系统。
继续阅读 »

Common Angle Plots:类型数据关联的知觉正确的可视化 (Common Angle Plots as Perception-True Visualizations of Categorical Associations)

1

在现实中,人们在观察一幅图像时可能会产生不正确的感觉或知觉,是为视觉错觉。在视觉错觉中,有两个著名的例子:咖啡墙错觉(Cafe Wall Illusion)和Müller-Lyer错觉(Müller-Lyer Illusion)。如下图1(左)所示,当我们左右相错地移动条带时,实际上等高的条带会看起来不等高。而在图1(右)中,当改变了箭头的方向时,实际上等长的线条看起来不等长。由此可见,视觉错觉对于人做出正确的判断,产生了严重的障碍。而本文[1]将重心集中到了消除类型数据的可视化中的视觉错觉上。
继续阅读 »

一个基于经验获得的关于制图学和地理空间可视化的交互元素分类(An Empirically-Derived Taxonomy of Interaction Primitives for Interactive Cartography and Geovisualization)

tex_table1

在可视化领域,交互是一种重要的人与数据交流的方式。在制图学和地理空间可视化的工作中,由于数据具有的时空特性,对用户来说,需要感知基于地理空间、时间空间与树形控件的信息,在具体的任务中,交互会扮演十分重要的角色。因此这篇论文,他们的采访对象是十几个地理、制图、基于地图的可视化等方面的专业领域人士。设计了两轮实验,获得了一手的实践经验,并且从中总结得出了基于不同任务的交互分类。

继续阅读 »

StoryFlow: 追踪故事的发展脉络(StoryFlow:Tracking the Evolution of Stories)

storyflow1

讲故事是人类与生俱来的本领,就像《疯狂原始人》里主人公总是在夜里给大家讲故事一样,人们习惯并喜欢讲故事、听故事。但当故事复杂的时候,尤其是参与的人物之间关系随时间变化、故事的场景也随时间变化时,要很好地”讲“一个让人理解的故事就很有挑战性了。来自微软亚洲研究院的Liu等人在今年的VIS会议中提出的StoryFlow系统,很好地提供了一个基于故事线(Storyline)的追踪故事发展的可视化方法。如下图所示。
继续阅读 »

基于多准则的体绘制动画生成方法 (A Multi-Criteria Approach to Camera Motion Design for Volume Data Animation)

1.workflow

动画在可视化中起着非常重要的作用,尤其在体绘制过程中,动画可以对一些复杂结构及实时趋势进行可视化。然而现有的很多动画生成方法都需要大量的人工干预,如大量地加入关键帧(keyframe)。

本文[1]采用对虚拟摄像头路径自动生成的方法对体绘制的内部结构进行“录制”,从而形成动画。在路径生成过程中,采用了摄影学与可视化中的一些准则,对初步生成的路径进行优化。具体而言,路径优化时采用了6条准则,每条准则将产生一定方向的力,对路径上的结点进行更改,6条准则对应的力线性地组合在一起,最终优化的路径就是这些力平衡的结果。

继续阅读 »

连接性浏览器:基于大容量神经科学体数据查询的可视分析 (Connectome Explorer: Query-Guided Visual Analysis of Large Volumetric Neuroscience Data)

2.interface

在神经科学中,神经元之间的连接性可视化一直是一个热门的研究课题,现有的方法大部分只提供二维神经元连接性的可视分析,缺乏直观的三维体绘制效果。本文[1]可视化的数据中包括以下几个神经元研究对象:Synapse(神经元的突触),Axons(轴突),Dendrite(树突),Glia(神经胶质).

本文[1]仿照SQL语言中查询机制,对大容量神经科学体数据进行查询与分析。如图2所示,具体步骤包括

1) 数据采集;数据采集自电子显微镜,体绘制数据包括多个体数据,EM Data体数据,Segmentation体数据,其中Segmentation体数据是由人工结合一些智能识别算法Trace出来的。也就是说,神经元数据之间的连接性由人工手动tracing得到的。

继续阅读 »