SemanticTraj:针对海量轨迹数据的一种新的交互尝试(A New Approach to Interacting with Massive Taxi Trajectories)

随着传感器技术的发展,越来越多的轨迹数据可以被采集,例如出租车的轨迹数据、滴滴和Uber记录的轨迹数据,数据能够帮助专家进行城市交通规划。然而现有的轨迹可视分析系统都需要大量的交互例来支持分析,需要,分析人员需要学习系统并并且使用大量繁琐、耗时的交互来完成分析。针对这些问题,这篇文章提出了SemanticTraj的可视分析系统。通过把轨迹数据转化为文本描述数据,通过文本搜索的交互方式对轨迹数据进行查询分析。一方面,通过数据文本搜索的查询方式不需要分析人员进行专业训练,因为我们比较熟悉百度、Google 这样的搜索引擎。另一方面,把轨迹数据转化为文本描述能提供高层次的信息,更容易帮助用户总结分析结果。

如图一所示,系统首先把轨迹数据转化为文本描述的数据。文本化后的数据包括Trip 和 Trajectory 两种粒度的文档描述。在此基础上建立关键词的索引,通过文本搜索引擎进行查询。用户通过文本输入的方式进行轨迹数据的查询,查询的内容包括POI关键词,时间和速度的范围,查询的模式包括通配符、模糊匹配,布尔操作。最后基于文本化的轨迹数据提供了关键信息的总结描述以及相关的可视化。pipeline

图1. SematicTraj 系统的流程图

这个工作的核心是把原始的轨迹数据文本化,用合适的特征描述原始的轨迹数据就显得尤为关键。针对出租车的轨迹数据,作者从行程和轨迹两种粒度进行文本化,生成行程文档和轨迹文档。其中,行程文档提取轨迹数据中载客的上下车地点,上下车时间以及行程距离当做关键信息进行索引。而轨迹文档则提取了轨迹进过的街道名称、速度信息以及是否载客的消息当做索引的关键信息。

document

图2.对轨迹数据进行文本化,转化为行程文档和轨迹文档

有了上述两种文档索引之后,系统就可以简历搜索引擎帮助用户查询。为了降低用户的学习曲线,查询的方式可以和传统的查询方式基本相同。如下表所示,用户可以用个POI 或街道名称进行关键词查询,或者POI序列查询,在此基础上支持通配符,模糊查询,区间查询以及布尔查询。query

表1.SematicTraj 提供的查询方式

最终呈现在用户面前的系统界面如下图所示,用户在(1)中输入要查询的文本表达式进行轨迹查询,查询结果在地图(5)上展示,并且在事先定义好的模板里(6)总结轨迹查询结果。在此基础上(3)视图提供了散点图、平行坐标、OD流图的可视化形式,用户可以上面进一步筛选数据。

system图3. SemanticTraj 系统界面图

这篇论文提出了一种新的分析轨迹数据的交互方式,不同于传统的时空刷选的方式,用户直接在文本框中输入查询条件就可以进行轨迹数据查询,降低了用户的学习成本。这个工作的核心是把轨迹数据转化成文本的形式,用适当的特征去描述轨迹,十分依赖文化化时提取的特征。

评论关闭。