

清华大学 土木工程系, 北京 100084
收稿日期: 2015-12-02
基金项目: 北京市自然科学基金资助项目(9132010)
作者简介: 奇格奇(1987-), 男, 博士研究生
通信作者: 吴建平, 教授, E-mail:jianpingwu@tsinghua.edu.cn
摘要:快速城镇化造成的交通拥堵、交通安全、交通环境等问题日益突出,从交通参与者个体的特性出发,分析驾驶风格多样性,从而建立“以人为本”的智能交通系统,是充分开发利用现有道路交通资源的有效途径。然而,驾驶风格难以检测和量化,这导致个体特征与系统性的计算难以进一步融合。该文通过实验车采集了16位驾驶员在实际道路上的驾驶行为数据,利用主题模型挖掘驾驶行为中的隐含主题,将数据结构由“驾驶风格-驾驶行为数据”转化为“驾驶风格-驾驶状态-驾驶行为数据”结构,发现了驾驶风格结构化信息,能够为建立更为有效的智能交通系统提供科学依据与理论支持。通过分析相关性,证实了模型重构数据与原数据有较好的一致性,验证了模型进行驾驶风格多样性分析的可行性。
关键词: 城镇化 驾驶风格 主题模型 智能交通 驾驶行为
Driving styles during rapid urbanization
QI Geqi, WU Jianping


Department of Civil Engineering, Tsinghua University, Beijing 100084, China
Abstract:Traffic congestion, traffic safety, and traffic related environmental problems caused by rapid urbanization have become increasingly important with "human-centered" intelligent transportation systems (ITS) needed that are based on individual driving characteristics. Thus, common driving styles were analyzed to more effectively utilize the existing road transport resources. However, driving styles are difficult to identify and quantify, which leads to difficulties modelling the individual driving characteristics. In this paper, the driving characteristics of 16 drivers on actual roads were analyzed using a topical model. The hidden driving characteristics were extracted and used to convert the data from "driving style-driving behaviour data" into "driving style-driving state-driving behaviour data". The discovered driving style structural information provides theoretical support for more efficient intelligent transportation systems. The reconstructed model data is shown to correlate well with the original data which verifies the model for analyzing driving style diversity.
Key words: urbanizationdriving styletopic modelintelligent transportation systemsdriving behaviour
智能交通系统(intelligent transport systems,ITS)利用先进的信息、通讯、控制以及计算机技术收集、处理、分析交通数据,挖掘相关知识并应用于交通运输领域,以达到交通系统科学、高效、可持续运行的目的。其中,先进的驾驶辅助系统(advanced driving assistant systems,ADAS)[1-2]、交通仿真技术(traffic simulation,TS)[3]以及其他智能化技术[4]日渐成熟,并在一定程度上缓解了城镇化过程中交通拥堵、交通安全、交通污染等问题。尽管如此,随着城镇化的快速进行,城市交通运行的参与成员呈现多样化,导致了城市交通驾驶风格的多样性。由于个体间的差异性影响着整体交通流的变化,这使得选取交通问题的解决方案不仅需要宏观层面的交通时空结构信息,也同样需要微观层面的驾驶风格的结构化信息。
面对智能交通系统如何量化提取人的层面的知识这一新的挑战,本文通过先进的实车采集技术收集不同驾驶员的驾驶行为数据,利用主题模型(topic models,TM)对驾驶风格多样性进行量化分析,进而为建立“以人为本”的智能交通系统提供理论依据。
1 城镇化背景作为经济转型期的必经阶段,城镇化已成为国家现代化的重要标志,在推动社会全面协调发展、提高居民生活质量的同时,由其引发的城市物理空间匮乏、人口过度聚集、资源分配不合理等问题也不断考验着城市管理服务水平[5]。道路交通城镇化过程中的交通拥堵、交通安全、交通污染等问题就是其中不可忽视的重要内容。
长期以来,道路交通都是衡量城镇化水平的重要指标。作为城市各个功能环节的连接者,道路交通是城市高效运行的命脉。城镇化水平与道路交通建设相辅相成,图 1所示为2004-2013年的城镇化率及城市道路建设的发展趋势图,可见二者在发展趋势上具有一致性。
![]() |
图 1 城镇化率与城市道路建设发展趋势 |
图选项 |
然而,随着城镇化交通需求的进一步提高,道路交通在物理空间上的可扩展性逐渐饱和,以增建道路调节交通供需平衡的手段的可实施性与适用性大幅减弱。如图 2所示,自2008年以后,私人机动车保有量的增速高于人均城市道路面积的增速,这说明物理空间的供给已逐渐难以跟上需求增长的速度。因此,如何在现有道路交通系统下充分开发利用道路交通通行能力、平衡供需,则成为城市交通可持续协调发展的关键问题,而智能交通系统则是解决这一问题的有效途径之一。然而,当前的智能交通系统的分析与计算主要依赖时空结构信息,如交通量的产生时间、地点等,而对于车辆在道路上的驾驶过程则通常采用简化的方式,如对所有车辆均采用单一的驾驶风格或模式。快速城镇化凸显了驾驶风格多样性对交通系统的影响,而对其相关知识的挖掘与量化则需要有效的数据支撑与合理的分析方法。
![]() |
图 2 私人机动车保有量与人均城市道路面积趋势 |
图选项 |
2 实车数据采集交通行为数据的采集具有多种方式,根据采集目的可分为2类:宏观交通行为数据采集与微观交通行为数据采集。宏观交通行为是指交通参与者对交通起始点、交通方式、出行时间等与整体交通系统博弈后的选择行为,可通过OD调查、路段检测器、问卷调查等方式进行采集。微观交通行为是指交通参与者与局部交通环境(如前方车辆)进行博弈后采取的具体驾驶行为,而根据实施的策略不同又被分为跟驰行为、换道行为等(其中跟驰行为在微观交通行为中所占比例最大),其采集方式也根据实验目的、条件等因素有所不同[6-9]。
驾驶风格的多样性主要体现在不同的交通参与者微观交通行为上的差异性。因此,本文研究试图通过分析大量的微观交通行为,从中获得驾驶风格多样性的相关知识,而便携式车载设备的不断革新使微观交通行为的实车数据采集成为可能[10]。本文研究中的实验用车分别安装了激光扫描雷达、GPS惯性导航以及视频采集设备,如图 3a所示为实验用车所采用的设备及相应安装位置。其中,激光扫描雷达通过对前方目标光脉冲的反射计算前车与后车间的相对距离与相对速度,具有极高的距离分辨率与速度分辨率;而由于在城市道路上进行数据采集,GPS惯性导航设备能够较好地适应周围建筑物及树木对于GPS信号的干扰,从而能够获取实验车连续的速度与加速度值;视频采集设备则安装于实验车的前部、后部、驾驶员脸部和脚部用于对周围环境的辨识及驾驶员行为的记录,如图 3b所示为实验车部分数据采集界面的展示。
![]() |
图 3 实验车数据采集 |
图选项 |
本文研究中所采集的数据包括16名驾驶员超过40 h的驾驶行为数据,车辆总行驶距离超过700 km。所采集的驾驶行为数据主要由跟车行为数据构成,单个驾驶行为数据由前后车距离、前后车速度差、后车速度、后车加速度表示,数据采集频率为10 Hz。由于天气条件、交通环境可能导致个体驾驶风格的波动,数据采集过程主要挑选在天气晴朗的工作日高峰至平峰时间段(早8:30-11:30),并对各驾驶员采用相同的数据采集路径。
3 主题模型作为统计学习方法的一种,主题模型能够将数据特征映射到语义空间,挖掘数据中的主题化信息,已被广泛应用于文本挖掘[11-12]、图像识别[13-14]、社交网络[15-16]等多个领域。主题模型是一种概率图模型,其典型代表包括隐语义索引(latent semantic indexing,LSI)模型[17]、概率隐语义索引(probabilistic latent semantic indexing,PLSI)模型[18]、以及隐Dirichlet分配(latent Dirichlet allocation,LDA)模型[19]。
本文采用LDA模型对驾驶行为数据进行分析,LDA模型的图模型形式如图 4所示。在LDA模型中,数据wt的生成由2组概率分布θd与?k决定,而θd与?k的概率分布分别服从以α与β为超参数的狄利克雷分布;每个数据wt被赋予了特定的主题zt,θd表示样本d中各主题的分布情况,?k则表示主题k中各数据的分布情况。
![]() |
图 4 LDA模型的图模型形式 |
图选项 |
LDA模型的训练可由EM算法[19]或Gibbs抽样算法[20]完成,本文采用后者。Gibbs抽样算法是一类马尔科夫链蒙特卡洛方法(Markov chain Monte Carlo,MCMC),其抽样过程如下:
1)随机初始化X0=(x10, …, xs0);
2)根据条件概率p(x|x-i)进行循环抽样,其中x-i=xj(j=1, …, s, j≠i),进而确定XP=(x1P, …, xsP),P为循环次数。
在主题模型的计算中,Gibbs抽样算法通过不断更新数据的当前主题,获得数据主题的稳态分布,进而求得样本在主题上的分布θd与主题在数据上的分布?k,其对数据当前主题的判别公式如下:
$\begin{array}{*{20}{c}}{p\left( {{z_{\left( {d,s} \right)}} = k\left| {{z_{ - \left( {d,s} \right)}},W} \right.} \right) \propto E\left( {{\theta _{dk}}} \right) \cdot E\left( {{\varphi _{kt}}} \right) = }\\{\frac{{n_d^k, - \left( {d,s} \right) + {\alpha _k}}}{{\sum\limits_{j = 1}^K {\left( {n_d^j, - \left( {d,s} \right) + {\alpha _j}} \right)} }} \cdot \frac{{n_k^t, - \left( {d,s} \right) + \beta t}}{{\sum\limits_{j = 1}^T {\left( {n_k^j, - \left( {d,s} \right) + {\beta _j}} \right)} }}.}\end{array}$ | (1) |
作为3层Bayes网络结构,LDA模型将数据形式由“样本-数据”结构转化为“样本-主题-数据”结构,能够达到对数据集中隐含主题的挖掘,并获得相应的结构化信息。
4 驾驶风格多样性分析通过将LDA模型应用于实车采集的微观交通行为数据集,可以将最初的“驾驶风格-驾驶行为数据”结构转化为“驾驶风格-驾驶状态-驾驶行为数据”结构,其中驾驶状态即为LDA模型所挖掘出的隐含主题,而不同驾驶状态的组合方式导致了驾驶风格的多样性。
作为数据的预处理过程,原始微观交通行为数据通过聚类算法被分为252类驾驶行为数据。随后,经过LDA模型的训练,可从16种驾驶风格中提取9种驾驶状态,图 5所示为16种驾驶风格中的9类驾驶状态分配比例,图 6所示为9类驾驶状态中252种驾驶行为数据的概率分布。可见,不同驾驶员的驾驶风格可被量化表示为各驾驶状态的组合形式(图 5),而每一类驾驶状态的含义则由驾驶行为的分布给出(图 6)。
![]() |
图 5 LDA模型驾驶风格分布训练结果 |
图选项 |
![]() |
图 6 LDA模型各类驾驶状态分布训练结果 |
图选项 |
利用LDA模型的训练结果重构16位驾驶员的驾驶行为数据,并与所收集的原驾驶员行为数据进行相关性分析,可获得各驾驶员的重构数据与原数据的相关系数,如图 7所示。相关系数能够表征重构数据与原数据的一致性,16位驾驶员的相关系数均值为0.934,方差为0.001 89,这说明LDA模型所建立的“驾驶风格-驾驶状态-驾驶行为数据”结构能够较好地表达原有“驾驶风格-驾驶行为数据”结构中的信息。
![]() |
图 7 LDA模型重构数据与原数据的相关系数 |
图选项 |
5 结论与展望本文利用主题模型对大量微观交通驾驶行为进行分析,从而挖掘出了驾驶风格中的隐含主题,获得了驾驶风格多样性的结构化信息。根据驾驶状态(所挖掘的隐含主题)中不同驾驶行为数据的分布情况,对驾驶状态做进一步的语义说明,而不同驾驶员的驾驶状态分布则决定了驾驶风格的多样性。
随着城镇化进程的加快,城镇道路受到其物理空间的限制,道路交通参与者对道路资源的争夺将不可避免地对交通拥堵、交通安全、交通污染等问题产生影响。根据所提取的驾驶风格多样性的相关知识,充分利用道路交通参与者的特点,进行更为人性化的辅助驾驶系统设计、准确的微观交通仿真、高效的交通管控系统,能够缓解快速城镇化背景下产生的各类问题,从而建立“以人为本”的智能交通系统促进城镇化进程协调可持续发展。
参考文献
[1] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Wang J, Zhang L, Zhang D, et al. An adaptive longitudinal driving assistance system based on driver characteristics[J]. IEEE Transactions on Intelligent Transportation Systems, 2013, 14(1): 1–12. DOI:10.1109/TITS.2012.2205143 |
[2] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Marsden G, Mcdonald M, Brackstone M. Towards an understanding of adaptive cruise control[J]. Transportation Research Part C-Emerging Technologies, 2001, 9(1): 33–51. DOI:10.1016/S0968-090X(00)00022-X |
[3] | Journal of Central South University(Science and Technology), 41(2):649-654.-->郭敏, 杜怡曼, 吴建平. 微观交通仿真基础理论及应用案例[M]. 北京: 人民交通出版社, 2007.GUO Min, DU Yiman, WU Jianping. The Basic Theory of Microscopic Traffic Simulation and Its Applications[M]. Beijing: China Communications Press, 2007. (in Chinese) |
[4] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Jarasuniene A. Research into intelligent transport systems (ITS) technologies and efficiency[J]. Transport, 2007, 22(2): 61–67. |
[5] | Journal of Central South University(Science and Technology), 41(2):649-654.-->杨超, 奚宽武. 城镇化与交通协调发展的国际经验与启示[J]. 交通世界(运输·车辆), 2014(8): 36–42.YANG Chao, XI Kuanwu. International experience and implications of urbanization and coordinated development of transportation[J]. Transpoworld (Transport·Vehicle), 2014(8): 36–42. (in Chinese) |
[6] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Piao J N, Mcdonald M. Low speed car following behaviour from floating vehicle data[C]//Proceedings of the IEEE IV 2003:Intelligent Vehicles Symposiums. Columbus, USA:IEEE, 2003:462-467. |
[7] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Reed M P, Green P A. Comparison of driving performance on-road and in a low-cost simulator using a concurrent telephone dialling task[J]. Ergonomics, 1999, 42(8): 1015–1037. DOI:10.1080/001401399185117 |
[8] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Hoogendoorn S P, Van Zuylen H J, Schreuder M, et al. Microscopic traffic data collection by remote sensing[J]. Journal of the Transportation Research Board, 2003, 1855(1): 121–128. |
[9] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Brackstone M, Mcdonald M. An instrumented vehicle for microscopic monitoring of driver behaviour[C]//Proceedings of the IEEE-IEE Vehicle Navigation and Informations Systems Conference. Ottawa, Canada:IEEE, 1993:401-404. |
[10] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Mcdonald M, Brackstone M A. The role of the instrumented vehicle in the collection of data on driver behaviour[C]//IEE Colloquium on Monitoring of Driver and Vehicle Performance. London, UK:IET, 1997:1-7. |
[11] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Zelong L, Maozhen L, Yang L, et al. Performance evaluation of latent Dirichlet allocation in text mining[C]//Proceedings of the 8th International Conference on Fuzzy Systems and Knowledge Discovery. Shanghai, China:IEEE, 2011:2695-2698. |
[12] | Journal of Central South University(Science and Technology), 41(2):649-654.-->李庆丰.基于主题模型的多文档自动文摘方法研究[D].大连:大连海事大学, 2013. LI Qingfeng. Research on the Method of Multi-document Summarization Based on Topic Model[D]. Dalian:Dalian Maritime University, 2013. (in Chinese) |
[13] | Journal of Central South University(Science and Technology), 41(2):649-654.-->李晓旭.基于概率主题模型的图像分类和标注的研究[D].北京:北京邮电大学, 2012. LI Xiaoxu. The Study of Image Classification and Annotation Based on Probabilistic Topic Model[D]. Beijing:Beijing University of Posts and Telecommunications, 2012. (in Chinese) |
[14] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Lienou M, Maitre H, Datcu M. Semantic annotation of satellite images using latent Dirichlet allocation[J]. IEEE Geoscience and Remote Sensing Letters, 2010, 7(1): 28–32. DOI:10.1109/LGRS.2009.2023536 |
[15] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Youngchul C, Junghoo C. Social-network analysis using topic models[C]//Proceedings of the 35th Annual International ACM SIGIR Conference on Research & Development in Information Retrieval (SIGIR 2012). Portland, USA:ACM, 2012:565-574. |
[16] | Journal of Central South University(Science and Technology), 41(2):649-654.-->骆国靖.基于主题模型的模块化网络和社区挖掘研究[D].杭州:浙江大学, 2008. LUO Guojing. The Study of Module Network and Community Mining Based on Topic Model[D]. Hangzhou:Zhejiang University, 2008. (in Chinese) |
[17] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Deerwester S, Dumais S T, Furnas G W, et al. Indexing by latent semantic analysis[J]. Journal of the American Society for Information Science, 1990, 41(6): 391–407. DOI:10.1002/(ISSN)1097-4571 |
[18] | Journal of Central South University(Science and Technology), 41(2):649-654.--> Hofmann T. Probabilistic latent semantic analysis[C]//Proceedings of the Uncertainty in Artificial Intelligence. Stockholm, Sweden:Morgan Kaufmann, 1999:289-296. |
[19] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Blei D M, Ng A Y, Jordan M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3(4-5): 993–1022. |
[20] | Journal of Central South University(Science and Technology), 41(2):649-654.-->Smith A, Roberts G O. Bayesian computation via the Gibbs sampler and related Markov-chain Monte-Carlo methods[J]. Journal of the Royal Statistical Society Series B-Methodological, 1993, 55(1): 3–23. |