标签存档: 出租车

大规模城市时空数据的可视化探索:以纽约出租车载客记录的研究为例 (Visual Exploration of Big Spatio-Temporal Urban Data: A Study of New York City Taxi Trips)

目前,越来越多的出租车安装了GPS,从而产生了大量的出租车数据。这些数据记录了出租车的行为,反映了城市的生活方式,并且可以帮助出租车运行部门监控出租车运行状态、改进出租车的调度。以纽约出租车数据为例,在2009、2011和2012年共有5.4亿次载客,每次载客记录了出租车编号、司机编号、起始终止的时间和地点、行驶距离以及车费、小费和收费数据。这是一个典型的 Origin-Destination (OD) 数据,只有起始终止信息而没有轨迹信息。该数据原始大小为120GB,存储为一系列csv文件。然而,纽约的城市规划和交通专家目前并没有很好的工具来分析这些出租车数据。他们面临两大困难。首先,为了能够对数据进行筛选和统计,他们需要学习数据库查询语言 (例如SQL),而这对他们很困难。此外,他们常用的工具 (例如Matlab、R、ARCGIS) 都无法处理如此大量的数据,因此他们每次只能研究数据的一个小样本。这样一来,他们通常只能根据经验猜想数据中可能存在某种现象,然后用一个小数据来验证,而对整个数据的全面探索无法完成。而且,由于要不断的用数据库输出小样本,再调用分析工具,整个工作流程非常繁琐,还容易出错。针对以上两点问题,纽约大学 Claudio Silva 教授带领他的研究组,开发了一个出租车OD数据分析系统TaxiVis [1],能够对三年的出租车数据进行流畅的探索式分析,并且查询操作完全图形化,简单直接。

继续阅读 »