基于高斯过程回归和深度强化学习的水下扑翼推进性能寻优方法

杨映荷, 魏汉迪, 范迪夏, 李昂

Optimization Method of Underwater Flapping Foil Propulsion Performance Based on Gaussian Process Regression and Deep Reinforcement Learning

YANG Yinghe, WEI Handi, FAN Dixia, LI Ang

图6 推进速度平均奖励曲线和推进效率最优奖励曲线

Fig.6 Average reward curve for propulsion speed and optimal reward curves for propulsion efficiency