通过对OD数据的空间时间抽象来揭示大规模移动数据的模式和趋势(Revealing Patterns and Trends of Mass Mobility Through Spatial and Temporal Abstraction of Origin-Destination Movement Data)

Origin-destination (OD)移动数据没有具体的描述移动的轨迹,而是仅具有起点,目的地,开始和结束时间以及其他属性。为了研究大规模移动数据的时空模式和趋势,常常把单个轨迹通过时间间隔聚合成流。时变的OD流数据为可视化和分析提出了两个难题。首先,流可以连接任意位置,从而形成的具有许多边缘交叉遮挡的难以理解的表达。第二个挑战是需要分析长时间序列的多个空间状态。这篇文章[1]提出一种方法,通过空间和时间抽象来促进对长时间序列流数据的探索。它通过一种特殊的数据聚合方式,允许通过图表而不是流图来表示空间状态,从而减少流图所具有的交叉和遮挡问题。聚合数据用于通过空间状态的相似性对时间间隔进行聚类。聚类结果的时间和空间可视化表达有助于发现大规模移动行为的周期性模式和长期趋势。

该工作的分析流程如图1所示。前两个操作是数据转换,通过设定方向,距离和时间间隔,然后根据这些分类对数据进行离散化分组,得到聚集后数据。时间上分析通过对每个时间间隔的聚集数据进行交互式聚类,然后对聚类结果进行日历形式的表达,来探索时间分布模式。空间上分析,针对分类后的离散化数据,在地图上绘制径向图来探索空间模式。

图1 工作流程

首先是数据的空间抽象处理,通过对相同起点或终点的流在方向和距离上分类聚集。方向上对0到360度分为m个间隔。距离,也就是流的长度上分为k个间隔。还有一种起点和终点相同的特殊情况。这样对于一个时间间隔的空间状态就有n*(2*k*m+1)的向量表达。其中n为起点终点的数量,2代表两种出发和进入的流方向。聚集前数据量为n*n,这样当n>> 2*k*m+1时,通过聚集减少了数据量。以伦敦自行车数据(28周的数据,569个停车点,218187条OD流)为例,方向分为罗盘的八个方向,距离分为(0, 2 km], (2 km, 5 km], (5 km, +)三个间隔,所以对于一个停车点有2*8*3+1= 49个汇总流量。

对于数据的时间抽象处理,需要根据整个时间周期长度,特定的时间周期和时间密度等来定义恰当的时间间隔。以伦敦自行车数据为例,整个时间周期为28周。每天的骑行数据都有相同的模式,然而根据以小时为时间间隔会有太多的间隔。并且存在很多间隔没有流数据。所以最终时间间隔为把每天分为早上 [6:00, 10:00), 中午 [10:00,16:00), 下午到8点[16:00, 20:00), 和夜间[20:00, 6:00)。

图2 聚类的日历形式

然后可以使用基于划分的聚类例如k-means,根据不同时间间隔的空间聚类数据的相似性进行聚类。伦敦自行车数据形成10个聚类,聚类的结果使用颜色区分,然后采用日历形式如图2来进行展示。每一行代表一周的时间,每一天由四个块来表示。块的大小越小代表在此颜色的聚类中这个数据与聚类中心的距离越大。从日历形式中可以发现时间分布上由每天每周以及季节的周期性。还有几个异常的只有一个时间间隔的颜色是在假期时间。

对于空间状态,根据聚集的数据作者采用在地图上绘制径向图的形式。如图3所示设计空间,每个图均需表达不同方向,距离和流的数目。每列代表不同的形状,P为多边形,B为条块,R为玫瑰图。每行代表组件的组合方式,O为重叠,J为对齐,S为分段。除了CJ 使用区块表示不同距离范围,其他都是使用颜色。CJ使用灰度的深浅代表流的数目,其他采用长度或角度表示。

图3 径向图设计空间

对于两个径向图的比较作者采用显示表达差异的方式。如图4所示,假设A与B比较。对于上面一行,采用轴线表示A的长度,三角形的高度代表二者的绝对差异。实心三角形表达B比A长,空心相反。对于下面环形图,采用颜色的深浅代表差异的大小。红色表达B比A长,蓝色相反。

图4 径向图比较模式

图5中为径向图在地图中的表现效果。用户可以通过选择时间间隔,拖动滑动块等来展示不同时间间隔的空间状态。同时用户可以选择不同的径向图设计方式。通过点击地图中的不同地点也可以进入径向图的比较模式。同时根据需求也可以展现所选择地方的流线,如图中的蓝绿色所示。针对图中较小的径向图,用户可以通过改变径向图所表达数据的限制范围来交互式的聚焦。例如减小表达上限,可以增大原本较小的径向图,超过上限地点的径向图会变半透明。

图5

在图5中我们可以发现主要有两个枢纽,它们都是在地铁站。图5上半部分对应早上,有大量的向外的流线。可以推断有大量的人在早上乘坐地铁出行,出站后然后骑行自行车前往目的地。而图下半部分是在下午,模式正好相反。

 

参考文献:

[1]G. Andrienko, N. Andrienko, G. Fuchs and J. Wood, “Revealing Patterns and Trends of Mass Mobility Through Spatial and Temporal Abstraction of Origin-Destination Movement Data,” in IEEE Transactions on Visualization and Computer Graphics, vol. 23, no. 9, pp. 2120-2136, Sept. 1 2017.

评论关闭。