%A 李鹏, 阮晓钢, 朱晓庆, 柴洁, 任顶奇, 刘鹏飞 %T 基于深度强化学习的区域化视觉导航方法 %0 Journal Article %D 2021 %J 上海交通大学学报 %R 10.16183/j.cnki.jsjtu.2019.277 %P 575-585 %V 55 %N 5 %U {https://xuebao.sjtu.edu.cn/CN/abstract/article_43348.shtml} %8 2021-05-28 %X

针对移动机器人在分布式环境中的导航问题,提出一种基于深度强化学习的区域化视觉导航方法.首先,根据分布式环境特征,在不同区域内独立学习控制策略,同时构建区域化模型, 实现导航过程中控制策略的切换和结合.然后,为使机器人具有更好的目标导向行为,在区域导航子模块中增加奖励预测任务,并结合经验池回放奖励序列.最后,在原有探索策略的基础上添加景深约束,防止因碰撞导致的遍历停滞.结果表明: 奖励预测和景深避障的应用有助于提升导航性能.在多区域环境测试过程中,区域化模型在训练时间和所获奖励上展现出单一模型不具备的优势,表明其能更好地应对大范围导航.此外,实验在第一人称视角的3D环境下进行,状态是部分可观察的,利于实际应用.