(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210863061.5
(22)申请日 2022.07.21
(71)申请人 同济大学
地址 200092 上海市杨 浦区四平路1239号
(72)发明人 熊璐 李拙人 杨若霖 付志强
肖宏宇 冷搏
(74)专利代理 机构 上海科盛知识产权代理有限
公司 312 25
专利代理师 叶敏华
(51)Int.Cl.
B60W 30/18(2012.01)
B60W 60/00(2020.01)
B60W 50/00(2006.01)
B60W 40/105(2012.01)
B60W 40/10(2012.01)G06F 30/15(2020.01)
G06F 30/20(2020.01)
G06F 111/04(2020.01)
G06F 111/08(2020.01)
G06F 119/14(2020.01)
(54)发明名称
一种考虑不确定性的自动驾驶汽车换道决
策控制方法
(57)摘要
本发明涉及一种考虑不确定性的自动驾驶
汽车换道决策控制方法, 包括: 构建状态空间及
动作空间, 建立状态转移方程; 建立自车、 他车的
观测空间模 型及信念空间模型、 他车预测轨迹的
不确定性模型; 设定奖励函数, 结合POMDP模型,
求解自车的决策状态点集、 并解耦为横向空间决
策集及纵向时间决策集; 分别确定横向、 纵向可
行驶边界, 引入道路边界约束, 车速约束及障碍
物距离约束, 划分出横向可行驶区域及参考路
径、 纵向可行驶区域及参考速度曲线; 根据决策
结果, 车辆规划模块输出相应车辆最优轨迹, 使
车辆按照最优轨迹行驶。 与现有技术相比, 本发
明充分考虑他车预测轨迹的不确定性, 决策出的
自车状态 点集更加稳定可靠, 能有效增强车辆驾
驶的舒适性及安全性。
权利要求书3页 说明书9页 附图4页
CN 115257746 A
2022.11.01
CN 115257746 A
1.一种考虑不确定性的自动驾驶汽车 换道决策控制方法, 其特 征在于, 包括以下步骤:
S1、 基于感知到的自车状态及预测的他车状态, 结合车辆动力学模型, 构建状态空间及
动作空间, 并建立状态转移方程;
S2、 分别建立自车的观测空间模型及信念空间模型、 他车的观测空间模型及信念空间
模型、 他车 预测轨迹的不确定性模型;
S3、 设定奖励函数, 结合 步骤S1和S2构建得到POMD P模型, 求 解出自车的决策状态点 集;
S4、 将自车的决策状态点 集解耦为横向空间决策集及纵向时间决策集;
S5、 确定横向可行驶边界, 引 入道路边界约束, 车速约束及障碍物距离约束, 划分出横
向可行驶区域及参 考路径;
确定纵向可行驶边界, 引入道路边界约束, 车速约束及障碍物距离约束, 划分出纵向可
行驶区域及参 考速度曲线;
S6、 根据步骤S5划分出的横向可行驶区域及参考路径、 纵向可行驶区域及参考速度曲
线, 车辆规划模块输出相应车辆最优轨 迹, 使车辆按照最优轨 迹行驶。
2.根据权利要求1所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述 步骤S1具体包括以下步骤:
S11、 使用简化的车辆运动学模型, 将车辆的运动简化为Frenet坐标系中质点的运动,
以构建自车的状态空间及动作空间;
S12、 利用状态空间和动作空间, 建立自车及他车的状态转移函数。
3.根据权利要求2所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述 步骤S11具体包括以下步骤:
S111、 采集感知的自车的车辆位置、 纵向速度、 纵向加速度、 侧向速度信息, 构成自车的
状态空间;
采集预测的他车的航向角、 车辆位置、 纵向速度、 纵向加速度、 侧向速度信息, 结合车身
长宽, 构成他车的状态空间;
S112、 设定离散的横向加速度 序列及纵向加速度 序列, 以作为动作空间。
4.根据权利要求2所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S12的具体过程为: 假设自车和他车状态的演进过程是相互独立的, 根据
简化的车辆运动模型, 得到自车 的状态转移方程, 他车 的状态转移方程则由下一时刻不同
状态的概 率表达。
5.根据权利要求1所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S2中观测空间模 型的观测函数分为自车和他车, 其中, 自车观测函数由布
尔值表示, 若下一状态存在, 则设置为1, 否则设置为0;
他车的观测函数符合高斯分布;
所述步骤S2中他车 预测轨迹的不确定性模型采用多元高斯分布构建。
6.根据权利要求1所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述 步骤S3具体包括以下步骤:
S31、 设定奖励函数包括安全性奖励函数Rsafe、 舒适性奖励函数Rcomfort及效率性奖励函
数Refficiency, 其中, 安全性奖励函数Rsafe包括碰撞奖励函数Rcolli及距离奖励函数Rdis;
舒适性奖励函数Rcomfort包括速度相关舒适性奖励函数Rspeed、 侧向速度动作惩罚函数权 利 要 求 书 1/3 页
2
CN 115257746 A
2Rvlat以及连续 性指标Rcontinuity;
效率性奖励函数Refficiency包括目标任务奖励函数Rlane和目标速度函数Rv_tar;
S32、 基于构建的状态空间、 动作空间、 信念空间及奖励函数, 采用确定性稀疏可观测树
的方法, 求解POMDP模 型, 得到自车的决策状态 点集, 其中, 决策状态点集的内容包括自车的
位置信息以及不同时刻的速度和 加速度信息 。
7.根据权利要求6所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S31具体是根据碰撞发生的概率设计碰撞奖励函 数Rcolli, 即当碰撞概率超
过设定阈值时, 给予惩罚;
所述步骤S31具体是根据碰撞发生时间TTC模型设计距离奖励函数Rdis, 并设定最大安
全距离的上 下界限;
所述步骤S31中, 速度相关舒适性奖励函数Rspeed的影响因素包括当前的纵向速度
vloncur、 纵向加速度aloncur、 侧向速度vlatcur以及下一时刻的纵向速度vlonnext、 纵向加速
度alonnext、 侧向速度vlatnext;
所述步骤S31中, 侧向速度动作惩罚函数Rvlat只与侧向速度有关;
所述步骤S31中, 连续性指标Rcontinuity与前后两次决策的位置变化量正相关, 前后两次
决策的位置变化 量越大、 则Rcontinuity越大。
8.根据权利要求6所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S4中横向空间决策集包括自车的位置信息; 纵向时间决策集包括自车 的
速度及加速度信息 。
9.根据权利要求1所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S5中横向可行驶边界在选择时, 横向可行驶边界的节点到障碍物的距离
应大于安全距离, 同时横向可行驶边界值不超过结构化道路的原始边界, 并保持一个安全
阈值的距离;
所述横向参 考路径的建立过程具体为:
首先构建横向优化问题, 设计横向成本函数对每个节点进行评价, 取横向成本函数最
小处的点作为最优解, 其中, 所述横向优化问题的约束为航向角在最小及最大车轮转角之
间, 所述横向优化问题的目标函数为横向成本函数, 所述横向成本函数Cnode‑h为第一距离成
本Cd, 第一安全成本 Co及连续性成本Cc的加权和;
通过计算从节点到目标状态点的距离, 以作为第一距离成本; 计算从节点到障碍物的
距离, 以作为第一安全成本; 计算从前后节点之间的位置变化率, 以作为连续性成本; 结合
对应的权 重系数, 计算得到横向成本函数;
最终取横向成本函数最小处的值, 连线形成横向期望参 考路径。
10.根据权利要求9所述的一种考虑不确定性的自动驾驶汽车换道决策控制方法, 其特
征在于, 所述步骤S5中纵向可行驶边界的确定原则为: 纵向可行驶边界与障碍物车位置坐
标重合;
纵向可行驶边界的约束条件为: 纵向可行驶边界的s ‑t曲线不超过表示最高、 最低的平
均车速的s ‑t曲线;
所述纵向参 考速度曲线的建立过程具体为:
首先构建纵向优化问题, 设计纵向成本函数对每个节点进行评价, 取纵向成本函数最权 利 要 求 书 2/3 页
3
CN 115257746 A
3
专利 一种考虑不确定性的自动驾驶汽车换道决策控制方法
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:46:46上传分享