基于功能区划分的出租车热点区域发现方法研究

时间:2022-10-20 10:41:25

基于功能区划分的出租车热点区域发现方法研究

摘要:针对城市出租车分布不合理的问题,提出了一种基于功能区划分的出租车OD热点区域发现方法。首先对出租车的原始OD点进行提取,使用改进的DB-SCAN算法对功能区中的出租车OD点进行聚类,并用卡方分布的统计学方法得出热点区域。该方法的准确性和可信性可通过两个指标评估,覆盖率和命中率。实验结果表明,该方法能够有效地发现和预测不同时间段、不同功能区的出租车OD热点区域。

关键词:功能区;出租车OD热点区域;出租车分布;改进的DB-SCAN算法;卡方分布

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)25-5571-05

1 概述

目前,城市出租车已成为最重要的交通工具之,它具有方便、快捷、舒适等特点,受到越来越多出行者的亲睐[1]。出租车是城市客运交通的重要组成部分,是常规公共交通的重要补充[2]。但是目前存在严重的乘客打车难的问题,包括等待空车时间长,以及乘客在陌生地不知何处可以打车等。而上述所有问题,都能被归结为出租车分布不合理的问题。

已有学者针对此问题进行了研究。Hu, K, Z He等人[3]提出了一种解决问题的方法,他们的主要思想是将城区划分成多个行政区域,根据某区域在某一时间段内,该区域出租车为空载状态的数量占有该区域内所有出租车数量的比率,计算得到该区域的出租车空车率,根据区域空车率引导高空车率区域内的空车转移至低空车率区域,实现区域间出租车空车率均衡。这种方法能够使得城区内出租车数量均衡,但是由于行政区域的划分不能反映该区域内的人群出行特征,而不同出行特征的区域在不同时间段对于出租车的需求量是不同的。因此这种方法不能解决上述问题。

郑宇等人[4]提出的功能区方法将北京市按照居民出行以及POIs(points of interests)划分成多个功能区域,该功能区域的划分能够帮助人们清楚地了解复杂的都市区域特征,有利于各种应用如城市规划、企业选址、用户出行分析和社会建议等。该功能区域与行政区域的不同主要在于行政区域是按照政治和行政管理划分的,而功能区域划分是按照人群出行特征划分的。该功能区划分方法的优点是能够反映该区域内人群出行特征,分析时能更加清楚该区域的生活、工作、娱乐等能力。

2 热点区域发现

针对市民出行打车不方便,以及出租车空驶率高的问题,该文创新地提出一个基于功能区划分的出租车OD热点区域发现方法。该方法可以分为三个步骤:1)功能区内出租车OD点的筛选;2)功能区的网格划分及网格聚类权值计算;3)采用改进的DB-SCAN方法筛选功能区内网格,并采用卡方分布统计分析得出热点区域。

2.1 有关定义

2.2 数据处理

本文根据郑宇等人[4]提出的功能区发现方法,将北京城区划分为不同功能区域,将市区按照市民出行活动区域,划分为工作区、商业区以及生活区、车站等。在不同功能区域中,出入该区域的乘客人群具有明显的生活、工作规律,在时间上具有周期性。譬如在西单商业区,人群出行时间段集中在12点之后。根据功能区出行特点及人群出行的周期性,该文对于各功能区分时间段周期性研究其热点OD区域分布。从出租车原始数据中提取功能区域的行车OD数据,并对通过车载设备向交通信息中心传回的出租车载客原始数据筛选出OD点。

由于出租车行驶轨迹覆盖了整个北京公路网络,所以我们采用水平/垂直交叉点数判别法提取功能区域的OD点。通过上述方法很容易得到功能区域内的OD 点,对这些点采用改进的DB-SCAN算法进行聚类,剔除离群的OD点,形成一个个簇构成的区域,作为热点区域的候选对象。然后:

1)把功能区域划分成[r×r]的网格。由于各个功能区的道路宽度以及地形不相同,所以对于参数[r]的选定也不相同,参数[r]的可选值在表1中。根据落在每个网格内的OD点个数,确定每个网格的权值。网格密度初始化为0,将各个时间段聚类簇中的GPS点投射到各个网格中。如果GPS点属于该网格,该网格密度加1。这样就将发现热点区域的问题转换成根据每个网格权值大小进行聚类。

3 热点区域的覆盖率和命中率

本文选择时间从2012年1月1日到2012年12月30日,北京公路上12000辆汽车的原始GPS数据(包括经纬度位置、运行时间、载客状态、行驶速度和方向等信息[7])。每辆汽车每30秒至70秒上传一次GPS数据。测试地图选择北京四维图新的2012版本的地图底层,并选择分析区域为北京西站、国贸、望京和西单。

3.1 热点区域的覆盖率

本节讨论分析OD热点区域的覆盖率。以西单区域为例,基于本文中的方法对此区域第一季度的数据进行分析。区域中原始出租车OD点分布与聚类后划分的热点区域分布如图1所示,该图选取[h6]时间段数据进行分析。绿色的五角星代表出租车乘客的真实OD点,红色区域代表热点区域,即采用该方法聚类得到的区域。可以看到所得到的热点区域覆盖了大多数的OD点,覆盖率为78.53%。从聚类得到的结果可以得出,在这个时间段内,出租车停车点区域主要沿着该商业圈的出入口以及出入口周边的路口,并呈现带状分布。

对第二季度各个时间段的热点区域命中率进行分析,得到结果如图4所示。图4(a)显示第二季度[D0]特征日,[hi(2≤i≤7)]时间段热点区域对原始OD点的命中率;图4(b)、7(c)分别为特征日[D1]、[D2]相应时间段热点区域的命中率。从这三张图可以看出,使用第一季度的数据计算得到的热点区域,对第二季度原始OD点也具有很高的命中率(高于70%)。

通过计算得到三种特征日的平均命中率分别为76.34%,73.73%和71.89%。因此,采用该方法计算该区域的热点分布,得到的结果可以作为出租车上下客热点区域的依据。

4 结束语

本文提出一种在功能区发现出租车OD热点区域的方法,此方法目的在于使城市出租车分布更加合理。选用改进的DB-SCAN算法进行聚类分析,并用卡方分布对最终热点区域进行合并分析。通过对2012年12000辆出租车所记录的原始GPS数据进行处理,根据人们在不同时间段、不同功能区的出行情况,最终得出出租车OD热点区域。对热点区域的评价有两个标准,一个是覆盖率,另一个是命中率。综合分析得出,该文采用的方法能够根据人群出行特征所划分的功能区准确找出热点区域。

在未来的工作中,仍将需要继续完善本文工作。例如,出租车OD热点区域可以根据公路分布情况和实际距离合并。另外,该方法也可以通过结合其他数据,例如结合公交车站数据和地铁站数据等,进行完善。

参考文献:

[1] 周晶,何建敏,盛昭瀚.城市出租车运营系统的随机分析[J].管理工程学报,2000,14(1):63.

[2] 陆建,王炜.城市出租车拥有量确定方法[J].交通运输工程学报,2004,4(1):92-95.

[3] Hu K,Z He, et al.Taxi-Viewer: Around the Corner Taxis Are! . Ubiquitous Intelligence & Computing and 7th International Conference on Autonomic & Trusted Computing (UIC/ATC) [C].2010 7th International Conference on, IEEE, 2010.

[4] Yuan J,Y Zheng,et al.Discovering regions of different functions in a city using human mobility and POIs[C].Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining, ACM. 2012.

[5] Lee J.Analysis on the waiting time of empty taxis for the Taxi telematics system. Convergence and Hybrid Information Technology[C].2008. ICCIT'08. Third International Conference on, IEEE. 2008.

[6] Deng Z,M Ji.Spatiotemporal structure of taxi services in Shanghai: Using exploratory spatial data analysis[C].Geoinformatics, 2011 19th International Conference on, IEEE. 2011.

[7] 童晓君,向南平,朱定局.基于出租车GPS数据的城市居民出行行为分析[J].电脑与电信,2012(1):56.

上一篇:中小学教育培训机构运营与管理若干问题探讨 下一篇:风险投资业发展过程中的困境及其系统对策