上海交通大学学报(自然版) ›› 2012, Vol. 46 ›› Issue (12): 1931-1935.
郝钏钏a,方舟b,李平a
收稿日期:
2012-05-28
出版日期:
2012-12-29
发布日期:
2012-12-29
基金资助:
国家自然科学基金资助项目(61004066),中央高校基本科研业务费专项资金资助项目(2011FZA4031)
HAO Chuan-Chuan-a, FANG Zhou-b, LI Ping-a
Received:
2012-05-28
Online:
2012-12-29
Published:
2012-12-29
摘要: 针对现有的基于强化学习的无人机航迹规划方法因无法充分考虑无人机的航迹约束而使规划获得的航迹可用性较差的问题,提出一种更有效的无人机三维航迹规划算法.该算法利用无人机的航迹约束条件指导规划空间离散化,不仅降低了最终的离散规划问题的规模,而且也在一定程度上提高了规划获得的航迹的可用性,通过在回报函数中引入回报成型技术,使算法具有满意的收敛速度.无人机三维航迹规划的典型仿真结果表明了所提出算法的有效性.
中图分类号:
郝钏钏a, 方舟b, 李平a. 基于Q学习的无人机三维航迹规划算法[J]. 上海交通大学学报(自然版), 2012, 46(12): 1931-1935.
HAO Chuan-Chuan-a, FANG Zhou-b, LI Ping-a. A 3-D Route Planning Algorithm for Unmanned Aerial Vehicle Based on Q-Learning[J]. Journal of Shanghai Jiaotong University, 2012, 46(12): 1931-1935.
[1]丁明跃, 郑昌文, 周程平, 等.无人飞行器航迹规划 [M].北京:电子工业出版社, 2009. [2]毛勇. 半被动双足机器人的设计和再励学习控制 [D]. 北京:清华大学计算机科学与技术系, 2007. [3]Xie L J, Xie G R, Chen H W, et al. Solution to reinforcement learning problems with artificial potential field [J]. Journal of Central South University of Technology, 2008, 5(4): 552557. [4]Szczerba R J, Galkowski P, Glickstein I S, et al. Robust algorithm for realtime route planning [J]. IEEE Transactions on Aerospace and Electronic System, 2000, 36(3): 869878. [5]Watkins P D. Qlearning [J]. Machine Learning, 1992, 8(3): 279292. [6]闵昌万, 袁建平. 军用飞行器航迹规划综述 [J]. 飞行力学, 1998, 16(4): 1419. MIN Changwan, YUAN Jianping. Introduction of military aircraft route planning [J]. Flight Dynamics, 1998, 16(4): 1419 [7]Ng A Y. Shaping and policy search in reinforcement learning [D]. Berkeley: University of California, 2003. [8]李伟,何雪松,叶庆泰,等. 基于先验知识的清华学习系统 [J]. 上海交通大学学报, 2004,38(8):13621365. LI Wei, HE Xuesong, YE Qingtai, et al. Prior knowledge based reinforcement learning system [J]. Journal of Shanghai Jiaotong University, 2004, 38(8): 13621365. |
[1] | 黄宇昊, 韩超, 赵明辉, 杜乾坤, 王石刚. 考虑安全飞行通道约束的无人机飞行轨迹多目标优化策略[J]. 上海交通大学学报, 2022, 56(8): 1024-1033. |
[2] | 李登攀, 任晓明, 颜楠楠. 基于无人机航拍的绝缘子掉串实时检测研究[J]. 上海交通大学学报, 2022, 56(8): 994-1003. |
[3] | 罗菁, 张逸楠. 基于改进Grey-AHP的察打一体无人机作战效能评估方法[J]. 空天防御, 2022, 5(2): 1-7. |
[4] | 聂瑞, 王红茹. 基于神经网络观测器的无人机编队执行器故障诊断[J]. 空天防御, 2022, 5(2): 32-41. |
[5] | 李伟湋, 高培雪, 陈进, 路玉卿. 基于累积前景理论和三支决策的无人机态势评估[J]. 上海交通大学学报, 2022, 56(11): 1479-1490. |
[6] | 郭鹏军, 张睿, 高关根, 许斌. 基于相对速度和位置辅助的无人机编队协同导航[J]. 上海交通大学学报, 2022, 56(11): 1438-1446. |
[7] | 周齐贤, 王寅, 孙学安. 基于增益自适应超螺旋滑模理论的无人机控制[J]. 上海交通大学学报, 2022, 56(11): 1453-1460. |
[8] | 王克帆, 邱潇颀, 高长生, 荆武兴. 临近空间太阳能无人机横航向变质心控制技术[J]. 空天防御, 2021, 4(4): 29-36. |
[9] | 吴诗辉, 贾军, 鲍然, 周宇, 夏青元. 面向集群对抗的多弹协同目标分配模型与仿真分析[J]. 空天防御, 2021, 4(3): 1-9. |
[10] | 姚天成, 赵永生, 王红雨, 何炎平, 丁子龙, 池哲瀛, 蔡炜锴. 风光混合驱动长航程无人海空立体探测船研发[J]. 上海交通大学学报, 2021, 55(2): 215-220. |
[11] | 王晓军, 管宇锋. 基于TOPSIS法和仿真法的反集群无人机装备体系贡献率研究[J]. 空天防御, 2021, 4(1): 33-40. |
[12] | 李征, 陈建伟, 彭博. 基于伪谱法的无人机集群飞行路径规划[J]. 空天防御, 2021, 4(1): 52-59. |
[13] | 刘晨, 谢宝娣, 董国宝, 霍达, 段雨昕, 夏川. 基于自适应积分滑模的无人机编队控制器设计[J]. 空天防御, 2021, 4(1): 65-70. |
[14] | 王程, 倪旖, 李亮, 郭正勇, 陈兵. 针对小型商业无人机的预警技术发展现状与思考[J]. 空天防御, 2021, 4(1): 83-90. |
[15] | 梁烽杨, 杨毅钧, 刘功龙, 万兵, 高王升. 多无人机系统协同侦察规划算法研究[J]. 空天防御, 2021, 4(1): 103-108. |
阅读次数 | ||||||||||||||||||||||||||||||||||||||||||||||||||
全文 490
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||
摘要 3406
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||