大规模地理空间的源-目的地移动数据的视觉抽象(Visual Abstraction of Large Scale Geospatial Origin-Destination Movement Data)

大量的移动数据集以源 – 目的地(OD)形式表示,例如出租车旅行,移动电话位置等。作为可视化OD数据的常用方法,流图(flow map)经常因为大量的遮挡和交叉问题而难以发现移动的模式。过滤,聚类和边捆绑都可以减少流图的视觉混乱​​,但是OD流之间的相关性经常被忽略,这使得简化的OD流图呈现很少的语义信息。该工作[1]将OD流表征为单词和语句后通过Word2Vec模型来向量化处理。然后采用t-SNE对转换的高维向量进行降维,并设计了迭代的多目标采样方案以在矢量化表示空间中选择OD流。为了增强采样后OD流图的可读性,作者设计了抽象的流图以及flow wheel等呈现OD流的相互作用,并且整合了一组定量比较技术来评估样本流。基于真实数据集的案例研究和领域专家的访谈证明了该系统在减少视觉混乱和增强OD流量相关性方面的有效性。

图1 工作流程

系统概览:该工作的工作流程如图1所示。首先是语料库的生成:将每一个OD流定义为一个单词(源,目的地),那一个句子便由一系列的OD流单词构成。接下来使用Word2Vec将文档训练成词向量。这里采用了skip-gram模型来通过目标单词来预测上下文单词,并且它比较适合训练量足够多的数据集。由此我们得到了OD流的高维向量表示。接下来采用t-SNE进行高维投影,t-SNE算法可以保持数据集的局部和全局结构。因此在投影图中距离相近的点会大概率的拥有相似的轨迹上下文,如图2b所示。

图2 OD流图与二维投影图

接下来作者采用多目标优化的蓝噪音采样方法对降维点进行采样。采样时采用的多目标限制包括流的交叉,重要性,以及社区分布。这样可以有效的减小视觉的聚集,保持图的结构和社群的分布。

系统的界面如图3所示,(a)为控制界面,(b)为地图界面来展现所筛选的OD流,并提供了交互式的flow wheel来帮助用户专注感兴趣的局部区域的探索。(c)为降维后的二维点的词嵌入视图,不同的颜色代表不同的社区。(g,e,f)为一系列比较试图帮助用户衡量不同的采样策略。

图3 系统界面

在案例分析中,作者比较展现了蓝噪音采样方法中多目标限制(流的交叉,重要性,以及社区分布)的作用。其中a,b,c均为蓝噪音采样。d,e,f分别为加入流的交叉,重要性,以及社区分布限制采样的采样结果。与a相比,d中明显增加了黑色的OD流;与b相比,e中存在较少的流交叉;在c和f中,右上角的矩阵展现了采样前与采样后社区的变化,与c相比,f的社区分布与采样前的社区分布较类似。该案例验证了多目标优化的蓝噪音采样的有效应。

图4 多目标采样案例分析

 

 

 

参考文献:

[1] Zhou Z, Meng L, Tang C, et al. Visual Abstraction of Large Scale Geospatial Origin-Destination Movement Data[J]. IEEE transactions on visualization and computer graphics, 2018.

 

评论关闭。