基于高斯过程回归和深度强化学习的水下扑翼推进性能寻优方法 |
||||||||||||||||||||||||
杨映荷, 魏汉迪, 范迪夏, 李昂 | ||||||||||||||||||||||||
Optimization Method of Underwater Flapping Foil Propulsion Performance Based on Gaussian Process Regression and Deep Reinforcement Learning |
||||||||||||||||||||||||
YANG Yinghe, WEI Handi, FAN Dixia, LI Ang | ||||||||||||||||||||||||
表5 传统TD3算法与GPR-TD3方法所需样本数量及习得动作 |
||||||||||||||||||||||||
Tab.5 Number of samples and learned actions required by traditional reinforcement learning and GPR-TD3 methods |
||||||||||||||||||||||||
|
||||||||||||||||||||||||