Home > 论文评述 > 纽约市出租车数据可视化研究

纽约市出租车数据可视化研究

作者:maxiaohong 日期:2013 年 11 月 20 日发表评论 (0) 查看评论

Visual Exploration of Big Spatio-Temporal Urban Data:A Study of New York City Taxi Trips

作者：Nivan Ferreira, Jorge Poco, Huy T. Vo, Juliana Freire, and Cl ´ audio T. Silva

来源：VAST2013

本文主要对纽约市的出租车数据进行可视化，支持用户可视查询。系统主界面如下：

与本文相关的工作有：分析出租车数据、对运动的可视化以及可视数据选择和查询。分析出租车数据的相关主要包括：1）推荐系统，向司机推荐最优的方案找到乘车的顾客；2）研究human mobility，研究上车和下车位置的分布以及与城市环境之间的关系；3）在GPS数据流中检测异常；4）分析人们平时乘车的主要目的。对运动的可视化主要包括：1）对轨迹数据的可视化；2）对OD数据（origin-destination data，只包含开始和结束位置，以及与路径相关的其他属性，不包含完整的行驶轨迹）。可视数据选择和查询的相关工作包括：1）动态查询，指通过图形插件进行查询；2）直接在可视化结果上操作进行查询；3）利用松弛查询（query relaxation）交互地产生选择。

本文使用的原始数据有120G，是纽约市2009、2011、2012年的出租车数据，主要对数据维度有主要的数据维度：pickup location、dropoff location、pickup time、dropoff time、traveled distance、fare amount、tip amount。

领域专家对该方面数据可视化提出的需求有：1）能够了解城市动态2）研究数据的不同方面在时间和空间上如何变化（How does the taxi fleet activity vary during weekdays?）3）给定时间探究特定的事件（How was the taxi activity in Midtown affected during a presidential visit）

4）不同neighborhoods之间模式的差异（What is the frequency of taxis in Midtown and Harlem?）

本文提出的可视化系统为TaxiVis，整体的可视化思路是：基于k-d tree建立一个特定的索引，以支持交互地时空查询，一旦有查询结果，立即反馈在地图上绘制，用户再根据这个结果refine query。由于查询结果可能很大，因此采用自适应的细节层次和密度热力图对查询结果进行可视化。

整体的系统结构如下图所示：

本文提出的可视查询模型为：SELECT * FROM trips WHERE <constraints>。Constrains是指对每一条出租车trip进行时间、属性、空间上的限制。时间限制通过系统提供的time widget进行选择，空间限制通过用户在地图上直接圈选，空间限制通过用户在属性直方图上圈选完成。

下图显示了3个可视查询：1）用橘色圈起来的限定trip开始位置的查询2）用红色圈起来的限定trip结束位置的查询3）用蓝色圈起来的限定起始位置的查询和用蓝色箭头指向的同时限定起始位置和结束位置的查询的析取。