基于旅客异质性画像的公铁联程出行方案推荐方法

删除或更新信息，请邮件至freekaoyan#163.com(#换成@)

本站小编 Free考研考试/2022-11-27

杨敏, 李宏伟, 任怡凤, 张聪伟
东南大学交通学院, 南京 210096
收稿日期：2021-10-30
基金项目：国家重点研发计划项目(2018YFB1601300); 国家自然科学基金资助项目(52072066); 江苏省****基金资助项目(BK20200014)
作者简介：杨敏(1981-)，男，教授。E-mail: yangmin@seu.edu.cn

摘要：公铁联程是我国重要的城际出行交通方式之一，但基于单一因素排序的城际票务出行方案推荐方法无法满足公铁联程旅客的个性化出行需求。为提升出行效率，该文基于旅客历史出行订单数据构建画像数据库，使用TF-IDF(term frequency-inverse document frequency)、K-means算法探究旅客异质性衍生的公铁联程出行需求差异，依据偏好得分、敏感特性设置奖励函数，使用Q-learning强化学习算法构建基于旅客异质性画像的公铁联程出行方案推荐方法。以天津-泗洪作为典型的特大城市-小城市公铁联程出行路线，与传统的城际出行方案推荐方法对比，为3类不同敏感特性的旅客推荐公铁联程出行方案。结果表明：该文推荐的公铁联程出行方案能够缩短20%的行程耗时，降低32%的行程费用，在契合旅客行为偏好和敏感特性、满足个性化出行需求方面均有较好的表现。
关键词：公铁联程异质性Q-learning算法出行推荐方法
Road-rail intermodal travel recommendations based on a passenger heterogeneity profile
YANG Min, LI Hongwei, REN Yifeng, ZHANG Congwei
School of Transportation, Southeast University, Nanjing 210096, China

Abstract: Road-rail intermodal travel is one of the important intercity travel modes. However, an intercity travel recommendation method based on single factor ranking cannot satisfy the personalized travel demands of road-rail intermodal passengers. This study improves travel efficiency by using a profile database based on passenger historical ticketing data with the term frequency-inverse document frequency (TP-IDF) and K-means algorithms to explore the road-rail intermodal travel demand differences derived from the passenger heterogeneity. The model uses reward functions based on preference scores and sensitivity characteristics with the Q-learning reinforcement learning algorithm in a road-rail intermodal travel recommendation method based on the passenger heterogeneity profile. The method is applied to the Tianjin-Sihong route as a typical road-rail intermodal travel route from a megacity to small cities with road-rail intermodal travel schemes recommended for three types of passengers with different sensitivities. The results show that the recommended travel schemes shorten travel times by 20% and reduce travel costs by 32% while effectively meeting passenger behavior preferences, sensitivity characteristics and personal demands.
Key words: road-rail intermodal travelheterogeneityQ-learning algorithmtravel recommendations
《国家综合立体交通网规划纲要》(2021年)要求加快建设京津冀、长三角等枢纽群间的多方式交通一体化发展，其中公铁联程出行方式让旅客使用公路和铁路2种交通方式、多阶段实现单次完整出行，能够有效耦合我国相对完善的公路、铁路交通运输网络，提高综合运输组合效率，同时满足枢纽群日益增长的城际交通出行需求。但由于程序复杂、针对性差、可靠性低等问题，联程出行在我国城际出行的占比仍处于较低水平^[1]，依赖用户手动设置单一因素排序的联程出行方案推荐方法已无法满足旅客的个性化出行需求。因此，本研究考虑旅客异质性衍生的出行需求差异，基于强化学习算法为旅客规划生成个性化的公铁联程出行方案，以简化出行程序，提高服务质量。目前旅客联程出行规划领域的相关研究主要集中于以下3个方面。
1) 考虑旅客异质性的联程出行方式选择：Jiang等^[2]基于机场航班数据和Stated Preference调查得到的旅客偏好数据，比较分析后发现目标城市和航班班次频率是影响石家庄正定机场空铁联程使用的最重要因素; Li等^[3]对中国京广走廊上的4个典型城市进行了偏好调查，研究乘客在航空和铁路一体化服务中的出行行为选择; 芮海田等^[4]设计调查问卷构建MNL(multinomial logit model)模型分析旅客中长距离出行方式选择的影响因素，发现出行距离、目的地城市等级、年龄、出行目的等因素具有显著影响; 此外，也有研究人员基于问卷调查数据分析旅客异质性对联程出行中各出行服务选择的影响，包括枢纽间换乘方式、票价优惠、票务信息一体化等^[5-7]。
2) 基于多方式交通网络建模的出行路径规划：文[8]构建了单方式及多方式组合出行交通网络，详细论述了交通出行路径选择集的建模方法; 文[9-10]针对多方式组合出行交通网络中的广义路径重叠问题、流量平衡问题，提出了解决方法。最经典的出行路径规划求解是基于无向图的最短路径算法，多方式、多程出行路径规划问题通常以时间、距离、费用、换乘次数和换乘时间等作为约束条件，形成耗时最短、费用最低等的单目标或多目标的路径规划求解算法^[11-12]，主要算法有标号约束的最短路径算法、双向搜索算法、启发式算法、遗传算法等^[13-14]，如Song等^[15]利用南京市公私交通设施构建多式出行网络，使用基于频率的多模式路径生成算法和CH算法为用户规划全天出行方案。
3) 旅客城际出行方案推荐系统：Renjith等^[16]对先前的个性化旅游出行推荐系统进行了较为详细的阐述，包括基于内容、协同过滤、混合系统等的推荐系统，常用算法包括KNN(K-nearest neighbor)、K-means、朴素Bayes、SVM(support vector machine)和CART(classification and regression tree)树算法; Abowd等^[17]利用用户当前位置和历史位置为用户提供个性化的导游服务; 与之类似，张学龙^[18]利用用户画像技术对用户的出发、到达城市进行预测并推荐对应的出行方案; 刘小燕等^[19]基于强化学习算法，通过推荐代理与用户显示输入信息的交互为用户提供相关出行辅助信息; Wen等^[20]则基于用户社交媒体上的历史记录挖掘社交信息和POI(point of interest)特征，设计了一种基于用户偏好的旅游路线规划方法。
综上，联程旅客出行规划领域的研究场景主要是以机场为枢纽背景，研究数据大多来源于问卷调查，构建的出行链面向城市内的多交通方式出行。城际出行方案推荐主要服务于以旅游为出行目的的旅客，不具有普遍适用性，在面对联程出行场景时会出现中转城市单一、出行链断裂、方案不合理等问题; 现有的城际票务平台大多基于单因素排序实现出行方案推荐，鲜有研究基于旅客真实的历史出行数据探究旅客异质性所衍生的公铁联程出行需求差异，并将其融入出行票务方案推荐，为旅客生成符合心理预期的个性化公铁联程出行方案，导致旅客出行程序烦琐，无法智慧、高效、便捷出行。
因此，针对缺乏融合公路、铁路城际票务属性和旅客公铁联程多环节、需求差异的出行方案推荐方法问题，本研究应用公铁联程旅客历史订单脱敏数据，基于TF-IDF文本挖掘算法、K-means聚类算法构建旅客异质性画像，挖掘出行需求差异; 以天津-泗洪出行路线作为超大城市-小城市公铁联程典型场景的具体实例，依据旅客的需求差异设置对应的奖励函数，使用Q-learning强化学习算法求解生成最符合旅客个体需求的公铁联程出行票务方案。
1 数据采集与分析本研究依据2020年9月20日-10月21日长三角区域某互联网脱敏票务订单数据，筛选7 522名出行旅客的公铁联程历史订单数据。为拓展旅客当次出行相关信息，基于出发、到达城市匹配第三方城际票务平台的火车、汽车票务信息，构建异质性画像数据库，描述性统计如表 1所示。
表 1 旅客异质性画像统计性描述

方式属性	平均值	最小值	最大值
0-6时出行/次	0.02	0	2
6-12时出行/次	0.61	0	9
12-18时出行/次	0.57	0	7
18-24时出行/次	0.07	0	7
0-6时换乘/次	0.01	0	1
6-12时换乘/次	0.36	0	7
12-18时换乘/次	0.73	0	5
18-24时换乘/次	0.17	0	7
高铁/次	0.89	0	7
动车/次	0.21	0	4
普快/次	0.17	0	5
高级席次/次	0.44	0	8
中级席次/次	0.69	0	8
初级席次/次	0.14	0	5
平均票价/元	105.89	18.00	1 020.00
A_p	0.35	0.08	1.00
S_p	0.41	0.12	1.00
平均耗时/min	282.87	56.00	2 700.00
平均换乘时长/min	105.38	5.00	1 198.00
A_t	0.64	0.19	1.00
S_t	0.74	0.22	1.00
注：高级席次包括高铁的商务座、特等座、一等座，动车的商务座、特等座、动卧、高级动卧、一等卧、一等座，普快的高级软卧、软卧、特等软座、一人软包; 中级席次包括高铁的二等座、多功能座，动车的二等卧、二等座，普快的一等软座、硬卧; 初级席次包括普快的二等软座、硬座、软座。

表选项

由于不同旅客的城际交通方式、行程距离等不同，仅直接比较单次出行费用、耗时并不合理，因此本文提出A_p、S_p、A_t和S_t 4个指标来综合考虑行程费用、耗时这2个因素对公铁联程旅客出行选择的影响，其中：A_p为旅客当次公铁联程出行费用与可行出行方案费用的比值最小值，S_p为出行费用与车型相同可行出行方案费用的比值最小值，A_t为出行耗时与可行出行方案耗时的比值最小值，S_t为出行耗时与车型相同可行出行方案耗时的比值最小值。
从表 1中可以看出，旅客的出行时段集中于6-18时，换乘时间则集中在12-18时，对火车程中高铁及中高级席次的需求较高，说明长三角区域公铁联程旅客对出行舒适度、耗时的要求较高，但平均换乘时长约占平均出行耗时的37%，可见优化公铁票务换乘衔接能够有效缩短旅客出行时间，提高出行效率。当前的第三方票务平台提供的公铁联程票务推荐存在换乘时间过长、中转城市单一等问题，同时公铁联程出行方案中出发时间、中转城市、换乘时间、火车车次等关键属性均存在较庞大的选择集，而强化学习在大空间、复杂非线性系统中具有良好的学习性能，通常被用于任务调度、机器人设计等方面^[21]，因此本研究使用Q-learning强化学习算法来求解生成最符合旅客个性化出行需求的公铁联程出行方案。
Q-learning是一种基于Markov Chain的异策略时序差分方法，动作策略为ε-greedy策略，通常设置一个评估智能体状态和动作的奖励函数，智能体依据该奖励函数采取随机动作或奖励最大动作，以达到特定目标，更新迭代步骤如表 2所示。
表 2 Q-learning算法迭代流程

第1部分: 环境初始化 1) 搭建环境; 2) 初始化Q-table，均设置为0
第2部分: Q-learning算法迭代 1) 还原智能体为初始状态S₀; 2) 在当前状态下，依据ε-greedy策略从Q-table中选择一个动作A; 3) 执行动作A，观察下一个状态S′、状态S′下Q值最大的动作A′、动作A得到的奖励R; 4) 更新Q(S, A)及Q-table; 5) 更新状态：S←S′; 6) 判断迭代是否结束，结束则退出，否则重复步骤1-6

表选项

2 个性化公铁联程出行方案推荐2.1 旅客异质性画像研究关于旅客异质性画像的主要研究方法是聚类分析和判别分析，根据观测到的变量将旅客划分为不同类型的群体，常用算法包括K-means、随机森林、分类回归树等^[22-24]。本研究在个体维度上使用TF-IDF文本挖掘算法探究旅客在公铁联程多阶段行为选择的偏好差异，在群体维度上使用K-means聚类算法区分旅客对出行费用、耗时的敏感特性差异，研究框架如图 1所示。

图 1 研究框架

图选项

现有的第三方城际票务平台在提供服务时，主要采用基于混合系统的推荐系统，个性化地为旅客推荐旅游路线、酒店和景点等，并没有聚焦于出行票务方案的推荐上。本研究将挖掘的旅客行为选择偏好、敏感特性差异作为变量输入出行方案推荐系统中，本质上是基于内容的推荐系统，推荐票务属性最符合旅客出行需求的公铁联程出行方案。
本研究在以下公铁联程出行行为中探究旅客异质性衍生的选择偏好：出行时段、换乘时段、火车车型和席次等级。在TF-IDF算法中字词的重要性与它在文件中出现的次数成正比，但同时会随着它在语料库中出现的频率成反比，故本研究使用TF-IDF算法计算旅客对不同出行方式的偏好得分，表示如下：

$\operatorname{TF}-\operatorname{IDF}(k, j)=\underbrace{\frac{n_{k}}{N_{j}}}_{\mathrm{TF}} \cdot \underbrace{\ln \frac{M}{m_{k}+1}}_{\mathrm{IDF}} .$

(1)

其中：N_j为旅客j的历史出行次数，n_k为该旅客选择k类出行方式的出行次数; M为总旅客数，m_k为历史选择过k类出行方式的旅客数; TF-IDF(k, j)为算法计算结果，即旅客j的k类出行方式偏好得分。
K-means算法是常用的无监督学习聚类方法，在面对大样本时聚类速度较快且效果达到中上水平。本研究使用K-means聚类算法划分公铁联程旅客的敏感特性：以A_p、S_p作为变量划分旅客的价格敏感性，以A_t、S_t作为变量划分旅客的时间敏感性，根据轮廓系数确定聚类中心数量均取2，聚类结果如图 2所示。

图 2 K-means聚类结果

图选项

聚类结果显示，83.06%的旅客价格敏感，价格敏感特性U_j=1，16.94%的旅客价格不敏感，U_j=0; 同理，62.23%的旅客时间敏感，时间敏感特性V_j=1，37.77%的旅客时间不敏感，V_j=0。
2.2 公铁联程出行方案推荐方法本研究以天津-泗洪出行路线作为超大城市-小城市公铁联程典型场景的具体实例，天津是京津冀枢纽群的关键枢纽城市，而泗洪是长三角城市群中江苏省宿迁市下属的县级市，之间暂无铁路、公路票务直达，公铁联程是2个城市间交通出行的重要方式。在搜索天津-泗洪出行方案时第三方票务平台仅提供了天津-徐州-宿迁的铁路转铁路出行方案，出现了出行链断裂的现象; 在推荐出行方案时也机械地依据出发时刻、耗时和价格的排序方法将出行方案展示给旅客，旅客需额外自主搜索宿迁-泗洪的出行方案，并在海量的出行方案中手动筛选出最符合自身出行需求的票务。因此本研究基于Q-learning算法，并依据异质性画像研究得到的偏好得分、敏感特性设置奖励函数，从中转城市、出发时段、火车车次等选择集中求解得到最符合旅客需求的公铁联程出行方案。
依据敏感特性为智能体划分3类旅客：价格敏感旅客(U_j=1, V_j=0)，时间敏感旅客(U_j=0, V_j=1)，均敏感旅客(U_j=V_j)。设计的Q-learning算法包含智能体出行方式选择、公铁联程票务推荐2个阶段，贪婪度ε设置为0.8，对应状态的奖励函数表示如下：

$\begin{gathered}R_{x}=\operatorname{TF}-\operatorname{IDF}(k, j), \quad x=1,2,3,4 ; \end{gathered}$

(2)

$R_{5}=1.5-n_{\mathrm{R}} ;$

(3)

$R_{6}=\left\{\begin{array}{l}-5, \quad c_{\mathrm{dpt}} \neq c_{\mathrm{arr}} \text { 或 } t_{\mathrm{int}}<20 \text { 或 } t_{\mathrm{int}}>180 ; \\5 \times\left(1-q_{j}\right)-n_{\mathrm{r}}, \quad c_{\mathrm{dpt}}=c_{\mathrm{arr}} \text { 且 } 20 \leqslant t_{\mathrm{int}} \leqslant 180 .\end{array}\right.$

(4)

其中：x为智能体所处的状态位置，前4个状态-动作为智能体出行方式选择阶段，即旅客依据自身的偏好特性选择最符合自身需求的出行行为; 奖励函数为式(2)，3类旅客的实例奖励得分设置如表 3所示; 随后是铁路程和公路程票务推荐，奖励函数为式(3)和式(4); q_j为规划方程值，q_j的收敛情况能反映推荐的公铁联程出行方案是否最优; n_R和n_r分别为与铁路、公路票务属性不符的出行行为数，即在旅客预期与票务推荐出现差异时给予惩罚; c_dpt为公路程出发城市，c_arr为铁路程到达城市; t_int为中转换乘时间，合理换乘时间设置为20~180 min，当铁路程与公路程衔接不合理时给予一个较大的惩罚值。

$F_{j}=\min q_{j} ;$

(5)

$q_{j}= \begin{cases}0.2 t_{\mathrm{sum}}+0.8 c_{\mathrm{sum}}, & U_{j}=1, V_{j}=0 ; \\ 0.8 t_{\mathrm{sum}}+0.2 c_{\mathrm{sum}}, & U_{j}=0, V_{j}=1 ; \\ 0.5 t_{\mathrm{sum}}+0.5 c_{\mathrm{sum}}, & U_{j}=V_{j}.\end{cases}$

(6)

表 3 Q-learning奖励值

状态		动作	R_price	R_time	R_all
智能体出行方式选择	出发时段	0-6时	0.25	0.18	0
		6-12时	0.18	0.25	0.20
		12-18时	0.02	0.02	0.11
		18-24时	0	0.20	0
	火车类型	高铁	0.06	0.22	0.07
		动车	0.04	0.04	0.19
		普快	0.46	0	0.10
	席次等级	高级	0	0.48	0
		中级	0.25	0.39	0.35
		初级	0.44	0	0.14
	换乘时间	0-6时	0	0.13	0
		6-12时	0.18	0.13	0.11
		12-18时	0.13	0.18	0.16
		18-24时	0.06	0.06	0.08
票务推荐	火车程	667个	式(3)	式(3)	式(3)
票务推荐	汽车程	114个	式(4)	式(4)	式(4)

表选项

其中：F_j为旅客j的目标规划方程函数，依据旅客的敏感特性差异设置不同的参数; t_sum和c_sum分别为公铁联程出行票务方案的行程耗时、行程费用经过最大-最小标准化处理后的对应值。针对3种敏感特性的公铁联程旅客，规划方程值q_j设置的常数项不同，其奖励函数值也存在显著差异，R_price、R_time、R_all分别对应价格敏感旅客、时间敏感旅客、均敏感旅客的奖励函数值，各个状态-动作下可获取的具体奖励值如表 3所示。
环境初始化完成后即进入Q-learning算法的迭代过程，表示如下：

$\begin{gathered}Q(S, A) \leftarrow Q(S, A)+ \\\alpha\left[R+\gamma {\max \nolimits_{{A^\prime }}} Q\left(S^{\prime}, A^{\prime}\right)-Q(S, A)\right] .\end{gathered}$

(7)

Q-table依据式(7)更新Q值，学习率α设为0.1，奖励衰减值γ设为0.9，当q_j的值趋于稳定说明已求解得到一个最符合旅客出行需求的公铁联程方案，即可停止迭代。在Q-learning算法迭代结束后，为验证其方案推荐的有效性，比较3类旅客智能体与环境交互过程中的规划方程结果q_j、奖励总和值R_sum的变化情况。

$R_{\mathrm{sum}}=\sum\limits_{x=1}^{6} R_{x}.$

(8)

其中：R_sum既能反映行方案的合理性，也能反映推荐的公铁联程出行方案是否满足旅客总体出行需求，如图 3和4所示。

图 3 Q-learning规划方程结果

图选项

图 4 Q-learning奖励总和值

图选项

图 3中，各类旅客的规划方程结果均经历了先大幅振荡，再逐渐收敛成一条直线的过程，这是智能体在不断与环境交互试错过程中寻找最符合旅客敏感特性的公铁联程出行方案。当规划方程值较大时，对应的奖励值偏小，在后续迭代中智能体则会偏向于选择其他的出行方案。当规划方程结果稳定收敛于一条直线时，说明已经求解出最优出行方案，即可停止迭代。由于ε-greedy策略存在随机性，故不同类型旅客出行方案收敛所需的迭代次数不同。
图 4中，3类旅客的奖励总和值折线均经历了先大幅振荡，最终收敛于一条直线上下小幅振荡的过程。由于每一次的动作选择都是基于贪婪度ε的贪婪策略，均有一定几率选择到随机动作，因此求解出最优出行方案后仍会出现奖励总和值小幅波动的情况。该条直线对应的奖励总和值处于较高水平，说明推荐的公铁联程出行方案较为合理，同时整体上能够满足旅客的个性化出行需求。通过设置贪婪度ε随时间变大可以获得多个可行的公铁联程出行方案，依据规划方程值排序推荐给旅客，见表 4。
表 4 基于异质性画像的公铁联程出行方案推荐排序

出行方案属性		价格敏感方案			时间敏感方案			均敏感方案
出行方案属性		1	2	3	1	2	3	1	2	3
铁路程	出发城市	天津	天津	天津	天津	天津	天津	天津	天津	天津
	出发站	天津站	天津站	天津站	天津南	天津西	天津西	天津西	天津西	天津西
	到达城市	徐州	徐州	徐州	徐州	徐州	徐州	徐州	徐州	徐州
	到达站	徐州站	徐州站	徐州站	徐州东	徐州东	徐州东	徐州东	徐州东	徐州东
	出发时间	01∶21	00∶55	01∶21	09∶30	10∶41	10∶41	10∶41	10∶07	10∶41
	到达时间	07∶04	06∶51	07∶04	11∶52	13∶29	13∶29	13∶29	13∶02	13∶29
	车次编号	Z171	Z365	Z171	G321	G267	G267	G267	G329	G267
	席次	硬座	硬座	硬座	一等座	一等座	一等座	二等座	二等座	二等座
	耗时/min	343	356	343	142	168	168	168	175	168
	票价/元	93	93	93	434	432.5	432.5	258	270	258
公路程	出发城市	徐州	徐州	徐州	徐州	徐州	徐州	徐州	徐州	徐州
	出发站	徐州汽车南站	徐州汽车南站	徐州汽车南站	徐州汽车东站	徐州汽车东站	徐州汽车东站	徐州汽车东站	徐州汽车南站	徐州汽车东站
	到达城市	泗洪	泗洪	泗洪	泗洪	泗洪	泗洪	泗洪	泗洪	泗洪
	到达站	梅花长途车站	梅花长途车站	泗洪汽车站	梅花长途车站	泗洪汽车站	梅花长途车站	泗洪汽车站	梅花长途车站	梅花长途车站
	出发时间	07∶50	07∶50	07∶50	12∶30	14∶00	14∶15	14∶00	13∶30	14∶15
	到达时间	10∶35	10∶35	10∶53	15∶15	16∶31	17∶00	16∶31	16∶15	17∶00
	耗时/min	165	165	183	165	151	165	151	165	165
	票价/元	55	55	60	55	60	55	60	55	55
总和	费用/元	148	148	153	489	492.5	487.5	318	325	313
总和	耗时/ min	554	580	572	345	350	379	350	368	379

表选项

在中转城市方面，本研究中转城市选择集包括南京、徐州、宿州、宿迁等15个城市，表 4中推荐的公铁联程出行方案均以徐州作为中转城市，可见徐州是天津-泗洪公铁联程出行路线中时价比较高、铁路到达-公路出发时间耦合较好的中转城市; 在换乘时间方面，推荐给3类旅客的公铁联程出行方案平均换乘时间为50、38和35 min，符合本文所设置的合理换乘时间，相较于历史出行数据平均换乘时间缩短了39.11%。
在出行行为偏好选择方面，推荐的公铁联程出行方案会依据旅客的偏好需求最大程度选择其最偏好的出行行为，以时间敏感旅客为例，其最偏好的出行行为分别为6-12时出发、高铁、高级席次和12-18时换乘，对应的公铁联程出行方案属性均满足上述偏好需求，说明其能较好地满足旅客出行行为偏好; 在敏感特性方面，推荐给3类旅客的公铁联程出行方案的平均费用、耗时和席次分别为150元-569 min-硬座、490元-358 min-一等座、319元-366 min-二等座，呈低费用-高耗时-低舒适性、高费用-低耗时-高舒适性、中费用-低耗时-中舒适性特点，如图 5所示，证明本研究推荐的公铁联程出行方案符合旅客的敏感特性。

图 5 基于异质性画像的公铁联程出行方案对比

图选项

以均敏感类旅客为例，依据第三方票务平台传统的出发时刻、出行耗时、出行价格排序方法从出行方案池中提取公铁联程出行方案，同时从异质性画像数据库中提取该类旅客真实的天津-泗洪公铁联程历史出行数据，见表 5。以该旅客真实历史出行数据为对照，对比上述方法推荐的公铁联程出行方案行程耗时缩短、行程费用减少、奖励值总和情况，见图 6。
表 5 公铁联程出行方案推荐方法对比

出行方案属性		出发时刻排序	出行耗时排序	出行价格排序	真实历史出行
火车程	出发城市	天津	天津	天津	天津
	出发站	天津站	天津南	天津西	天津南
	到达城市	南京	徐州	宿州	南京
	到达站	南京站	徐州东	宿州站	南京南
	出发时间	00∶43	07∶27	21∶21	08∶31
	到达时间	13∶35	9∶26	04∶22	11∶55
	车次编号	K151	G45	T35	G143
	席次	硬座	二等座	硬座	二等座
	耗时/min	772	119	421	204
	票价/元	135.5	270	98	393.5
公路程	出发城市	南京	徐州	宿州	南京
	出发站	南京客运南站	徐州汽车南站	宿州快客站	南京客运南站
	到达城市	泗洪	泗洪	泗洪	泗洪
	到达站	泗洪汽车站	梅花长途车站	泗洪汽车站	泗洪汽车站
	出发时间	14∶00	10∶00	05∶50	12∶40
	到达时间	17∶27	12∶45	09∶20	15∶48
	耗时/min	207	165	210	188
	票价/元	72	55	35	72
总计	耗时/min	1 004	318	719	437
总计	费用/元	207.5	325	133	465.5

表选项

图 6 各方法推荐的公铁联程出行方案对比

图选项

均敏感类旅客对于出行耗时、出行费用的单方面敏感特性不显著，期望推荐的公铁联程出行票务方案在2方面均有一定的减少。在图 6中，各方法推荐的公铁联程出行方案在出行价格上均优于历史出行票务，分别减少了32%、55%、30%、71%。在出行耗时缩短表现上，仅有基于异质性画像、出行耗时的出行方案的出行耗时低于历史出行票务，分别缩短了20%和27%。可见，基于异质性画像和出行耗时的公铁联程出行方案推荐方法在缩短行程时间、减少行程费用上均表现较好，原因在于其均选择了徐州作为中转城市，若推荐的公铁联程出行方案选择南京、宿州等作为中转城市，则会显著增加出行耗时。
在旅客出行需求匹配上，旅客当次历史出行遵循了本研究挖掘的旅客偏好需求，在出行时段、席次等级、换乘时段方面均选择了最偏好的出行行为，证明了本研究构建的异质性画像的有效性。同时基于异质性画像的公铁联程出行方案票务与历史出行票务在出行方式属性上保持一致，奖励总和值也最高，说明能较好满足旅客的个性化出行需求; 基于出行耗时的票务方案效果略逊于基于异质性画像的票务方案，在火车类型、换乘时段上没有匹配旅客最偏好的出行行为; 基于出发时刻、出行价格的推荐方法则效果较差，推荐的票务方案中包含了旅客完全不偏好的出行行为，不符合旅客的心理预期。
3 结论本文研究基于旅客真实的历史出行订单脱敏数据，以公铁联程为研究场景，通过TF-IDF、K-means算法从个体维度和群体维度挖掘旅客异质性衍生的出行需求差异，发现公铁联程旅客在出行时段、换乘时段、火车车型、席次等级、价格敏感和时间敏感特性上均存在显著差异。使用Q-learning算法构建了基于上述异质性画像的公铁联程旅客个性化出行方案推荐方法，为旅客生成一个出行链完整、中转城市合理、换乘时间合适的公铁联程出行方案，该出行方案能够最大程度满足旅客的出行行为偏好，同时契合旅客的价格、时间敏感特性。与传统的基于出发时间、行程耗时、行程价格出行方案推荐方法相比，基于异质性画像的公铁联程出行方案在缩短行程耗时、降低行程费用、满足旅客个性化出行需求方面均有较好的表现。

参考文献

[1]	GIVONI M, CHEN X M. Airline and railway disintegration in China: The case of Shanghai Hongqiao integrated transport hub[J]. Transportation Letters, 2017, 9(4): 202-214. DOI:10.1080/19427867.2016.1252877
[2]	JIANG Y L, TIMMERMANS H J P, CHEN C, et al. Determinants of air-rail integration service of Shijiazhuang airport, China: Analysis of historical data and stated preferences[J]. Transportmetrica B: Transport Dynamics, 2019, 7(1): 1572-1587. DOI:10.1080/21680566.2019.1670117
[3]	LI Z C, SHENG D. Forecasting passenger travel demand for air and high-speed rail integration service: A case study of Beijing-Guangzhou corridor, China[J]. Transportation Research Part A: Policy and Practice, 2016, 94: 397-410. DOI:10.1016/j.tra.2016.10.002
[4]	芮海田, 吴群琪. 高铁运输与民航运输选择下的中长距离出行决策行为[J]. 中国公路学报, 2016, 29(3): 134-141. RUI H T, WU Q Q. Medium-and long-distance travel mode decision between high-speed rail and civil aviation[J]. China Journal of Highway and Transport, 2016, 29(3): 134-141. DOI:10.3969/j.issn.1001-7372.2016.03.017 (in Chinese)
[5]	YUAN Y L, YANG M, FENG T, et al. Heterogeneity in passenger satisfaction with air-rail integration services: Results of a finite mixture partial least squares model[J]. Transportation Research Part A: Policy and Practice, 2021, 147: 133-158. DOI:10.1016/j.tra.2021.03.003
[6]	李兴华, 李思雨, 成诚, 等. 空铁一体枢纽联运服务需求及偏好研究[J]. 综合运输, 2020, 42(6): 8-12. LI X H, LI S Y, CHENG C, et al. Analyzing the air-rail transfer service demand and preference for air-rail integrated hubs[J]. China Transportation Review, 2020, 42(6): 8-12. (in Chinese)
[7]	陈琳. 京津冀城市群枢纽间旅客联程出行行为研究[D]. 北京: 北京交通大学, 2020. CHEN L. Research on the intermodal behavior of passengers between the hubs of the Beijing-Tianjin-Hebei urban agglomeration[D]. Beijing: Beijing Jiaotong University, 2020. (in Chinese)
[8]	BOVY P H L. On modelling route choice sets in transportation networks: A synthesis[J]. Transport Reviews, 2009, 29(1): 43-68. DOI:10.1080/01441640802078673
[9]	LI D W, YANG M, JIN C J, et al. Multi-modal combined route choice modeling in the MaaS age considering generalized path overlapping problem[J]. IEEE Transactions on Intelligent Transportation Systems, 2021, 22(4): 2430-2441. DOI:10.1109/TITS.2020.3030707
[10]	LIU Z Y, MENG Q. Bus-based park-and ride-system: A stochastic model on multimodal network with congestion pricing schemes[J]. International Journal of Systems Science, 2014, 45(5): 994-1006. DOI:10.1080/00207721.2012.743617
[11]	WONG S C, TONG C O. Estimation of time-dependent origin-destination matrices for transit networks[J]. Transpor- tation Research Part B: Methodological, 1998, 32(1): 35-48. DOI:10.1016/S0191-2615(97)00011-8
[12]	HORN M E T. An extended model and procedural framework for planning multi-modal passenger journeys[J]. Transportation Research Part B: Methodological, 2003, 37(7): 641-660. DOI:10.1016/S0191-2615(02)00043-7
[13]	BARRETT C, BISSET K, HOLZER M, et al. Engineering label-constrained shortest-path algorithms[C]//Proceedings of the 4th International Conference on Algorithmic Aspects in Information and Management. Shanghai, China: Springer, 2008: 27-37.
[14]	BARRETT C, BISSET K, JACOB R, et al. Classical and contemporary shortest path problems in road networks: Implementation and experimental analysis of the TRANSIMS router[C]//10th Annual European Symposium on Algorithms. Rome, Italy: Springer, 2002: 126-138.
[15]	SONG Y C, LI D W, CAO Q, et al. The whole day path planning problem incorporating mode chains modeling in the era of mobility as a service[J]. Transportation Research Part C: Emerging Technologies, 2021, 132: 103360. DOI:10.1016/j.trc.2021.103360
[16]	RENJITH S, SREEKUMAR A, JATHAVEDAN M. An extensive study on the evolution of context-aware personalized travel recommender systems[J]. Information Processing & Management, 2020, 57(1): 102078.
[17]	ABOWD G D, ATKESON C G, HONG J, et al. Cyberguide: A mobile context‐aware tour guide[J]. Wireless Networks, 1997, 3(5): 421-433. DOI:10.1023/A:1019194325861
[18]	张学龙. 多式联运出行方案规划系统的设计与实现[D]. 大连: 大连理工大学, 2019. ZHANG X L. The design and implementation of multimodal travel scheme planning system[D]. Dalian: Dalian University of Technology, 2019. (in Chinese)
[19]	刘小燕, 陈艳丽, 贾宗璞, 等. 基于增强学习的旅行计划推荐系统[J]. 计算机工程, 2010, 36(21): 254-256, 259. LIU X Y, CHEN Y L, JIA Z P, et al. Recommender system for travel plan based on reinforcement learning[J]. Computer Engineering, 2010, 36(21): 254-256, 259. DOI:10.3969/j.issn.1000-3428.2010.21.091 (in Chinese)
[20]	WEN Y T, YEO J, PENG W C, et al. Efficient keyword-aware representative travel route recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2017, 29(8): 1639-1652. DOI:10.1109/TKDE.2017.2690421
[21]	高阳, 陈世福, 陆鑫. 强化学习研究综述[J]. 自动化学报, 2004, 30(1): 86-100. GAO Y, CHEN S F, LU X. Research on reinforcement learning technology: A review[J]. Acta Automatica Sinica, 2004, 30(1): 86-100. (in Chinese)
[22]	CHENG Y H, HUANG T Y. High speed rail passenger segmentation and ticketing channel preference[J]. Transportation Research Part A: Policy and Practice, 2014, 66: 127-143. DOI:10.1016/j.tra.2014.05.006
[23]	BORDAGARAY M, DELL'OLIO L, IBEAS A, et al. Modelling user perception of bus transit quality considering user and service heterogeneity[J]. Transportmetrica A: Transport Science, 2014, 10(8): 705-721. DOI:10.1080/23249935.2013.823579
[24]	RASOULI S, TIMMERMANS H J P. Covariates-dependent random parameters regret-rejoice models of choice behavior: Specification and performance assessment using experimental design data[J]. Transportmetrica A: Transport Science, 2019, 15(2): 485-525. DOI:10.1080/23249935.2018.1506524

基于旅客异质性画像的公铁联程出行方案推荐方法

本站小编 Free考研考试/2022-11-27

相关话题/

领限时大额优惠券,享本站正版考研考试资料!