基于深度强化学习的区域化视觉导航方法
李鹏, 阮晓钢, 朱晓庆, 柴洁, 任顶奇, 刘鹏飞

A Regionalization Vision Navigation Method Based on Deep Reinforcement Learning
LI Peng, RUAN Xiaogang, ZHU Xiaoqing, CHAI Jie, REN Dingqi, LIU Pengfei
表1 神经网络参数
Tab.1 Neural network parameters
网络部分 动作选取 奖励预测
卷积层1 16, 8, 4 16, 8, 4
卷积层2 32, 4, 2 32, 4, 2
全连接层 256 128
LSTM 256