使用拓扑分析来支持以事件为引导的城市数据探索 (Using Topological Analysis to Support Event-Guided Exploration in Urban Data)

近年来技术的不断革新使得大量城市数据的收集变得越来越方便,这些收集到的数据还可以用来分析城市,如果这些数据得到了适当的分析利用,可以用来帮助我们解决现有问题并有利于政策制定。然而,对于城市数据的有效分析,还有着许多挑战,无论是从数据量,还是从一个城市固有的时空复杂性。通常分析这种数据的方式是使用不同的聚类并且产生视觉总结,但是这些会产生许多矛盾,如使用粗糙聚类可以减少数据片的量,但是可能引起信息丢失。

这篇文章提出了一种有效并且可扩展的技术,这种技术可以自动发现事件并且引导用户到很可能感兴趣的时间片。事件检测是通过由城市数据衍生出来的随时间变化的标量函数完成的,本文用一个给定函数的最小值和最大值来表示数据中的事件。直观来说,最小值(最大值)捕捉到了对应于数据的低谷(高峰)的特征,拓扑的使用也使得事件可以有任意的空间结构。为了支持可能存在的大量事件,他们还设计了一个指标化方案来把跨越多个时间片的相似模式组合到一起。从而不仅能够支持识别周期时间,还可以识别有不同频率的事件。

这篇文章选取了纽约出租车数据和地铁数据,关于出租车数据,专家们比较关心导致拥堵和出租车分布集中的交通相关的事件,而对于地铁数据,专家比较关心的是每个地铁站的车辆延迟。所以需要针对不同的研究目的分别为这两种数据设计合适的标量函数。

1

 图1. 事件引导的探索技术概观

图1所示是这篇文章提出的技术的流程图,第一步,输入数据被转化成随时间变化的标量函数,第二步,从标量函数中计算得到拓扑特征来识别事件集,第三步,从识别到的事件中创建一个事件集指数来支持对大量事件的查询,第四步,一个可视界面可以引导用户到感兴趣的事件,第五步,在数据中,允许用户选择一个事件,第六步,交互搜索相似事件。2

图2. 确认最小值事件的地图视图

本文还用到了一些交互的视觉探索界面,如图2所示的地图视图,用户可以选择感兴趣的事件并检索相似事件,图3所示的视觉探索界面,时间线视图根据不同的密度和范围把事件分成了四个区域,根据拓扑重要性对事件进行了分类,图4所示的是过滤后的某天的事件组分布视图,图中游行对应的事件在视图中非常突出,用户可以识别到这个模式。

3

 图3. 视觉探索界面

4

图4. 过滤后的2011年11月的事件组分布视图

针对这篇文章提出的方法,他们分别对两个数据集进行了案例研究。图5是对纽约出租车数据进行的探索,选择不同的时间单位可以得到不同的界面,从中可以探索得到不同的事件。图6是对纽约地铁进行的探索,可以得到一些事件,并且可以发现,在早高峰和晚高峰的事件频率较高,在工作日的事件频率比周末的要高。5

图5. 纽约的最小值事件

6图6. 三号线2013年八月的事件分布视图

这篇文章介绍了一种基于拓扑学的技术来对数据进行基于事件的探索。通过引导用户到感兴趣的数据部分来对现有的视觉分析系统的能力进行扩展。这种技术用了有效的算法来捕捉时空数据的拓扑特性,并且通过对事件分组和指标化来对数据进行灵活探索。

[1] Harish Doraiswamy, Nivan Ferreira, Theodoros Damoulas, Juliana Freire, and Cl´audio T. Silva. Using Topological Analysis to Support Event-Guided Exploration in Urban Data. IEEE Transactions on Visualization and Computer Graphics, 2014 

评论关闭。