• • 上一篇
作者简介:
陈诗霖(2000—),硕士生,从事强化学习与车-路协同轨迹跟踪控制领域研究
摘要: 为了降低延迟对纯跟踪控制器的影响,提高纯跟踪控制器控制自动驾驶车辆沿规划轨迹行驶的准确性,提出了一种基于深度强化学习的纯跟踪控制器优化方法,利用深度确定性策略梯度(DDPG)模型实时预测车辆位置误差信息,动态控制纯跟踪控制器求得的转向控制信号与规划轨迹航向角信号的融合比例,以获得最佳的转向角控制信号。随机路径条件下的MATLAB仿真结果表明,使用DDPG模型调整转向控制信号与规划轨迹航向角信号的融合比例能有效提升纯跟踪控制器的控制效果,改进后的纯跟踪控制器控制车辆以介于1 m/s ~ 5 m/s之间的速度沿规划轨迹行驶时,车辆位置误差不超过0.2 m,航向角误差不超过0.1 rad,相对传统纯跟踪控制器,优化后的纯跟踪控制器控制车辆沿规划轨迹移动的横向误差减少了80%,航向角误差降低了90%。
中图分类号:
陈诗霖, 黄宏成. 基于深度强化学习的纯跟踪控制器响应延迟改进策略[J]. 上海交通大学学报, doi: 10.16183/j.cnki.jsjtu.2025.001.
CHEN Shilin, HUANG Hongcheng. Improved Strategy for Response Delay of Pure Pursuit Controller Based on Deep Reinforcement Learning[J]. Journal of Shanghai Jiao Tong University, doi: 10.16183/j.cnki.jsjtu.2025.001.
[1] | 赵莹莹, 仇越, 朱天晨, 李凡, 苏运, 邰振赢, 孙庆赟, 凡航. 基于分层强化学习的新型电力系统在线稳态调度[J]. 上海交通大学学报, 2025, 59(3): 400-412. |
[2] | 曹永吉, 张江丰, 王天宇, 郑可轲, 吴秋伟. 基于分布式模型预测控制的自适应二次调频策略[J]. 上海交通大学学报, 2025, 59(3): 333-341. |
[3] | . 基于数据驱动的永磁同步电机控制系统模型预测控制方法[J]. J Shanghai Jiaotong Univ Sci, 2025, 30(2): 270-279. |
[4] | 杨映荷, 魏汉迪, 范迪夏, 李昂. 基于高斯过程回归和深度强化学习的水下扑翼推进性能寻优方法[J]. 上海交通大学学报, 2025, 59(1): 70-78. |
[5] | 邱革非, 冯泽华, 沈赋, 何超, 何虹辉, 刘铠铭. 考虑车网互动的园区电网动态双层能量管理策略[J]. 上海交通大学学报, 2024, 58(6): 916-925. |
[6] | 刘月笙, 贺宁, 贺利乐, 张译文, 习坤, 张梦芮. 基于机器学习的移动机器人路径跟踪MPC控制器参数自整定[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(6): 1028-1036. |
[7] | 周毅, 周良才, 史迪, 赵小英, 闪鑫. 基于安全深度强化学习的电网有功频率协同优化控制[J]. 上海交通大学学报, 2024, 58(5): 682-692. |
[8] | 刘华华, 王青. 基于强化学习的多飞行器目标分配方法[J]. 空天防御, 2024, 7(5): 65-72. |
[9] | 张啸天1,何德峰1,廖飞2. 复杂环境及约束下舰载机自动着舰迭代模型预测控制[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(4): 712-724. |
[10] | 穆建彬,杨海丽,何德峰. 基于控制屏障函数的自主移动机器人安全编队分布式模型预测控制[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(4): 678-688. |
[11] | 董玉博1, 崔涛1, 周禹帆1, 宋勋2, 祝月2, 董鹏1. 基于长周期极坐标系追击问题的多智能体强化学习奖赏函数设计方法[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(4): 646-655. |
[12] | 李舒逸, 李旻哲, 敬忠良. 动态环境下基于改进DQN的多智能体路径规划方法[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(4): 601-612. |
[13] | 赵英策1,张广浩2,邢正宇2,李建勋2. 面向确定进攻对手策略的层次强化学习对抗算法研究[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(3): 471-479. |
[14] | 苗镇华1, 黄文焘2, 张依恋3, 范勤勤1. 基于深度强化学习的多模态多目标多机器人任务分配算法[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(3): 377-387. |
[15] | 全家乐, 马先龙, 沈昱恒. 基于近端策略动态优化的多智能体编队方法[J]. 空天防御, 2024, 7(2): 52-62. |
阅读次数 | ||||||||||||||||||||||||||||||||||||||||||||||||||
全文 28
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
摘要 54
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||