专利 一种针对多源异构数据的城市交通行程时间预测方法

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111514594.4 (22)申请日 2021.12.13 (71)申请人中国电子科技集团公司第十五研究所地址 100083 北京市海淀区北四环中路21 1 号 (72)发明人刘丰恺　李牧　冯逸骏　 (74)专利代理机构北京中创阳光知识产权代理有限责任公司 1 1003 代理人尹振启 (51)Int.Cl. G06Q 10/04(2012.01) G08G 1/01(2006.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种针对多源异构数据的城市交通行程时间预测方法 (57)摘要本发明通过网络安全领域的方法，实现了一种针对多源异构数据的城市交通行程时间预测方法。分为三个实施步骤：步骤一：收集交通出行数据和外部属性信息，完成数据预处理和标注，构建适用于深度学习任务的训练集、验证集和测试集；步骤二：构建基于多视角卷积和注意力机制的深度神经网络模型，并在构建的数据集上进行训练得到深度神经网络模型；步骤三：输入待预测的行程轨迹，采用训练得到的深度神经网络模型进行推理，得到行程时间预测结果。本发明提供的方法能够提供一种能够综合考虑城市路网信息、 GPS轨迹信息、天气信息、驾驶者信息等多源异构数据的交通行程时间预测的方法，相对当前现有方法而言能够实现更准确和稳定的交通行程时间预测，从而为智能交通运输系统的建设提供支撑。权利要求书4页说明书10页附图2页 CN 114202120 A 2022.03.18 CN 114202120 A 1.一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：分为三个实施步骤：步骤一：收集交通出行数据和外部属性信息，完成数据预处理和标注，构建适用于深度学习任务的训练集、验证集和测试集；步骤二：构建基于多视角卷积和注意力机制的深度神经网络模型，并在构建的数据集上进行训练得到深度神经网络模型；步骤三：输入待预测的行程轨迹，采用训练得到的深度神经网络模型进行推理，得到行程时间预测结果。 2.如权利要求1所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：所述交通出行数据包括GPS轨迹、出行时间、出行日期、特定司机车辆编号、路径长度、路径真实行程时间。 3.如权利要求2所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：所述外部属性信息包括城市路网结构、天气信息。 4.如权利要求3所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：所述构建训练集、验证集和测试集的方法为：根据交通出行轨迹的共同特征，设置筛选条件，对明显的异常轨迹进行剔除；然后，通过Leuven.MapMatching地图匹配工具，将GPS 轨迹的每个点投影到相应的路段上，得到路段轨迹序列；之后按照2:1:1的比例，将数据分为训练数据集、验证数据集和测试数据集。 5.如权利要求4所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：所述筛选条件为：行驶距离大于100km或小于0.5km、平均速度大于100km/h或小于 5km/h、行驶时间大于720 0秒或小于 60秒。 6.如权利要求5所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：构建所述基于多视角卷积和注意力机制的深度神经网络模型的具体方法为：由交通信息融合组件、多视角卷积注意力机制组件和多任务学习组件三个组件构成模型架构。 7.如权利要求6所述的一种针对多源异构数据的城市交通行程时间预测方法，其特征在于：所述交通信息融合组件交通信息融合组件包括两个模块：路段向量映射模块和路径编码模块，所述路段向量映射模块使用skip ‑gram方法来实现路段向量的映射，对于一条路段序列{ri},i＝1...N， N为该序列的路段个数，设置长度为3的滑动窗口，得到对于一条路段序列中每一个路段ri的上下游路段点对，将每个上下游路段点对中的中心路段记为rc，上游路段记为ru，下游路段记为rd，则构造得到的上下游路段点对分别为(rc,ru)和(rc,rd)，然后，根据概率P(ri)采样构造伪邻接点对：其中， freq(ri)为路段ri在所有路段序列中的出现频率，然后，构建从路段编号到路段向量的向量映射神经网络h＝f(r)＝σ(Wx+b)，其中， b为待训练的偏置向量， W是待训练的映射矩阵， σ 是sigmoid激活函数；记分别针对每个中心路段rc、上游路段ru和下游路段rd的神经网络参数为Wc,bc、 Wu,bu和Wd,bd，分别得到的路段向量权　利　要　求　书 1/4 页 2 CN 114202120 A 2为hc、 hu和hd，定义上游关系打分函数为下游关系打分函数为定义向量映射神经网络的训练目标为尽量使得真实上下游路段的映射向量的内积尽量接近1，且伪上下游路段的映射向量的内积尽量接近0，即：其中， up/down(ri)分别代表路段ri的真实上游路段点和下游路段点， Neg(ri)代表路段 ri的伪邻接路段点，通过训练，得到分别针对中心路段、上游路段和下游路段的神经网络参数Wc,bc、 Wu,bu和 Wd,bd，从而分别得到路段向量映射神经网络fc、 fu和fd；所述路径编码模块对于轨迹上的每一个GPS轨迹点pi，通过预处理时的路网地图匹配，已经得到了其对应的路段编号pi.ri，则通过路段向量映射模块，可以得到该GPS轨迹点对应的路段向量，即： pi.evc＝fc(pi.ri) pi.evu＝fu(pi.ri) pi.evd＝fd(pi.ri) 然后，如下所示计算轨迹特征向量traji：其中， pi代表轨迹上的第i个轨迹点， pi.lon代表轨迹点的经度， pi.lat代表轨迹点的纬度， pi.evc,pi.evu,pi.evd分别代表中心路段、上游路段和下游路段的路段映射向量， pi.dis 代表轨迹点对应路段的长度， pi.spd代表轨迹点对应路段的限速， Wloc代表待训练的神经网络参数矩阵，代表拼接操作，然后，计算外部属性特征向量at tr如下：其中， Dis代表该轨迹路段的总长度， WeekIDem代表将轨迹出行日期经过简单embedding 操作后的向量， timeIDem代表将轨迹出行时间经过简单embedding操作后的向量， driverIDem代表将出租车司机编号经过简单emb edding操作后的向量， Weatherem代表将天气信息经过简单embedding操作后的向量， Wattr代表待训练的神经网络参数矩阵，然后，采用大小为3的一维卷积核对轨迹上的每一个轨迹点的轨迹特征向量tr aji和外部属性特征向量 a t t r 拼接后的向量进行卷积操作，得到融合特征矩阵如下所示：其中，代表融合特征矩阵locf的第i行，代表激活函数为ELU函数的、核大小为3的一维卷积操作，卷积核参数为待训练参数，最终，所述交通信息融合组件根据输入的轨迹信息{pi}，计算得到融合特征矩阵locf作权　利　要　求　书 2/4 页 3 CN 114202120 A 3

专利 一种针对多源异构数据的城市交通行程时间预测方法

专利一种针对多源异构数据的城市交通行程时间预测方法