(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111514594.4
(22)申请日 2021.12.13
(71)申请人 中国电子科技 集团公司第十五研究
所
地址 100083 北京市海淀区北四环中路21 1
号
(72)发明人 刘丰恺 李牧 冯逸骏
(74)专利代理 机构 北京中创阳光知识产权代理
有限责任公司 1 1003
代理人 尹振启
(51)Int.Cl.
G06Q 10/04(2012.01)
G08G 1/01(2006.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种针对多源异构数据的城市交通行程时
间预测方法
(57)摘要
本发明通过网络安全 领域的方法, 实现了一
种针对多源异构数据的城市交通行程时间预测
方法。 分为三个实施步骤: 步骤一: 收集交通出行
数据和外部属性信息, 完成数据预处理和标注,
构建适用于深度学习任务的训练集、 验证集和测
试集; 步骤二: 构建基于多视角卷积和注意力机
制的深度神经网络模型, 并在构建的数据集上进
行训练得到深度神经网络模型; 步骤三: 输入待
预测的行程轨迹, 采用训练得到的深度神经网络
模型进行推理, 得到行程时间预测结果。 本发明
提供的方法能够提供一种能够综合考虑城市路
网信息、 GPS轨迹信息、 天气信息、 驾驶者信息等
多源异构数据的交通行程时间预测的方法, 相对
当前现有方法而言能够实现更准确和稳定的交
通行程时间预测, 从而为智能交通运输系统的建
设提供支撑 。
权利要求书4页 说明书10页 附图2页
CN 114202120 A
2022.03.18
CN 114202120 A
1.一种针对多源异构数据的城市交通行程时间预测方法, 其特征在于: 分为三个实施
步骤:
步骤一: 收集交通出行数据和外部属性信 息, 完成数据预处理和标注, 构建适用于深度
学习任务的训练集、 验证集和 测试集;
步骤二: 构建基于多视角卷积和注意力机制的深度神经网络模型, 并在构建的数据集
上进行训练得到深度神经网络模型;
步骤三: 输入待预测的行程轨迹, 采用训练得到的深度神经网络模型进行推理, 得到行
程时间预测结果。
2.如权利要求1所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 所述交通出行数据包括GPS轨迹、 出行时间、 出行日期、 特定司机车辆编号、 路径长度、
路径真实行程时间。
3.如权利要求2所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 所述外 部属性信息包括城市路网结构、 天气信息 。
4.如权利要求3所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 所述构建训练集、 验证集和测试集的方法为: 根据交通出行轨迹的共同特征, 设置筛
选条件, 对明显的异常轨迹进行剔除; 然后, 通过Leuven.MapMatching地图匹配工具, 将GPS
轨迹的每个点投影到相应的路段上, 得到路段轨迹序列; 之后按照2:1:1的比例, 将数据分
为训练数据集、 验证数据集和 测试数据集。
5.如权利要求4所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 所述筛选条件为: 行驶距离大于100km或小于0.5km、 平均速度大于100km/h或小于
5km/h、 行驶时间大于720 0秒或小于 60秒。
6.如权利要求5所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 构建所述基于多视角卷积和注意力机制的深度神经网络模型 的具体方法为: 由交通
信息融合组件、 多视角卷积注意力机制组件和多任务学习组件三个组件构成模型架构。
7.如权利要求6所述的一种针对多源异构数据的城市交通行程时间预测方法, 其特征
在于: 所述交通信息融合组件交通信息融合组件包括两个模块: 路段向量映射模块和路径
编码模块, 所述路段向量映射模块使用skip ‑gram方法来实现路段向量的映射, 对于一条路
段序列{ri},i=1...N, N为该序列的路段个数, 设置长度为3的滑动窗口, 得到对于一条路
段序列中每 一个路段ri的上下游路段点对, 将每个上下游路段点对中的中心路段记为rc, 上
游路段记为ru, 下游路段记为rd, 则构造得到的上 下游路段点对分别为(rc,ru)和(rc,rd),
然后, 根据概 率P(ri)采样构造伪 邻接点对:
其中, freq(ri)为路段ri在所有路段序列中的出现频率,
然后, 构建从路段编号到路段向量的向量映射神经网络h=f(r)=σ(Wx+b), 其中, b为
待训练的偏置向量, W是待训练的映射矩阵, σ 是sigmoid激活函数; 记分别针对每个中心路
段rc、 上游路段ru和下游路段rd的神经网络参数为Wc,bc、 Wu,bu和Wd,bd, 分别得到的路段向量权 利 要 求 书 1/4 页
2
CN 114202120 A
2为hc、 hu和hd, 定义上游关系打分函数为
下游关系打分函数为
定义向量映射神经网络的训练目标为尽量使得真实上下游路段的映射向
量的内积尽量接 近1, 且伪上 下游路段的映射向量的内积尽量接 近0, 即:
其中, up/down(ri)分别代表路段ri的真实上游路段点和下游路段点, Neg(ri)代表路段
ri的伪邻接路段点,
通过训练, 得到分别针对中心路段、 上游路段和下游路段的神经网络参数Wc,bc、 Wu,bu和
Wd,bd, 从而分别得到路段向量映射神经网络fc、 fu和fd;
所述路径编码模块对于轨迹上的每一个GPS轨迹点pi, 通过预处理时的路网地图匹配,
已经得到了 其对应的路段编号pi.ri, 则通过路段向量映射模块, 可以得到该GPS轨迹点对应
的路段向量, 即:
pi.evc=fc(pi.ri)
pi.evu=fu(pi.ri)
pi.evd=fd(pi.ri)
然后, 如下 所示计算轨 迹特征向量traji:
其中, pi代表轨迹上的第i个轨迹点, pi.lon代表轨迹点的经度, pi.lat代表轨迹点的纬
度, pi.evc,pi.evu,pi.evd分别代表中心路段、 上游路段和下游路段的路段映射向量, pi.dis
代表轨迹点对应路段的长度, pi.spd代表轨迹点对应路段的限速, Wloc代表待训练的神经网
络参数矩阵,
代表拼接操作,
然后, 计算外 部属性特 征向量at tr如下:
其中, Dis代表该轨迹路段的总长度, WeekIDem代表将轨迹出行日期经过简单embedding
操作后的向量, timeIDem代表将轨迹出行时间经过简单embedding操作后的向量,
driverIDem代表将出租车司机编号经过简单emb edding操作后的向量, Weatherem代表将天
气信息经 过简单embedding操作后的向量, Wattr代表待训练的神经网络参数矩阵,
然后, 采用大小为3的一维卷积核对轨迹上的每一个轨迹点的轨迹特征向量tr aji和外
部 属 性 特 征 向 量 a t t r 拼 接 后 的 向 量 进 行 卷 积 操 作 , 得 到 融 合 特 征 矩 阵
如下所示:
其中,
代表融合特征矩阵locf的第i行,
代表激活函数为ELU函数的、 核大
小为3的一维卷积 操作, 卷积核参数为待训练参数,
最终, 所述 交通信息融合 组件根据输入的轨迹信息{pi}, 计算得到融合特征矩阵locf作权 利 要 求 书 2/4 页
3
CN 114202120 A
3
专利 一种针对多源异构数据的城市交通行程时间预测方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 23:43:08上传分享