作者简介:李洪森(2001—),硕士生,从事机器人调度研究
基金资助:
摘要: 针对带设备预防性维护的焊接流水车间调度问题,以最小化最大完工时间为优化目标,考虑设备故障冲击、有限缓冲区及高维状态空间致表征模糊等难点,提出基于表征增强多智能体强化学习的调度与维护联合优化方法。将问题拆分为加工调度和预防性维护两个子问题,构建调度-维护双智能体架构;由于子问题强耦合性(调度影响设备故障风险,维护改变设备可用状态),双智能体通过价值分解多智能体演员-评论家(value-decomposition multi-agent actor-critics,VDAC)算法将全局价值函数分解为双智能体的局部价值函数,使两者在优化各自局部价值时自然嵌入对对方子问题的考量,从而实现协同求解;表征增强通过自编码器提炼高维状态的关键信息,解决了高维状态空间信息冗余、表征模糊问题,使智能体能基于关键表征信息决策,提升调度与维护联合优化性能。算例验证显示,与其他算法相比,最小化最大完工时间平均减少4.13%,较规则算法平均减少13.34%。
中图分类号:
李洪森a, b, c, d, 张朋b, c, d, 王明a, b, c, d, 张洁b, c, d, 相文彬b, c, d, e. 基于表征增强多智能体强化学习的焊接流水车间调度与维护联合优化方法[J]. 上海交通大学学报, doi: 10.16183/j.cnki.jsjtu.2025.227.
LI Hongsena, b, c, d, ZHANG Pengb, c, d, WANG Minga, b, c, d, ZHANG Jieb, c, d, XIANG Wengbinb, c, d, e. Integrated Optimization Method for Scheduling and Maintenance in Welding Flow Shops Based on Representation-Enhanced Multi-Agent Reinforcement Learning[J]. Journal of Shanghai Jiao Tong University, doi: 10.16183/j.cnki.jsjtu.2025.227.
| [1] | 李奕佳, 李嘉诺, 柯良军. 基于强化学习的无人机协作防守策略设计与验证[J]. 空天防御, 2025, 8(3): 73-85. |
| [2] | 陈洪伟, 谢小波, 李勇, 范志强, 张宁. 某型空压机一级安全阀起跳问题解决及措施[J]. 海洋工程装备与技术, 2025, 12(2): 44-47. |
| [3] | 董玉博1, 崔涛1, 周禹帆1, 宋勋2, 祝月2, 董鹏1. 基于长周期极坐标系追击问题的多智能体强化学习奖赏函数设计方法[J]. J Shanghai Jiaotong Univ Sci, 2024, 29(4): 646-655. |
| [4] | 司国锦, 林泽宇, 郑宇, 夏唐斌, 奚立峰. 面向多中心租赁制造网络的成组维护与团队协同调度策略[J]. 上海交通大学学报, 2023, 57(3): 273-284. |
| [5] | 张素君, 杨文强, 顾幸生. 基于改进多种群候鸟迁徙算法的混合流水车间调度[J]. 上海交通大学学报, 2023, 57(10): 1378-1388. |
| [6] | 汤洪涛, 王丹南, 邵益平, 赵文彬, 江伟光, 陈青丰. 基于改进候鸟迁徙优化的多目标批量流混合流水车间调度[J]. 上海交通大学学报, 2022, 56(2): 201-213. |
| [7] | 叶鸿庆, 苏华德, 郑美妹, 夏唐斌. 考虑双供应商的维护和备件订购联合决策优化[J]. 上海交通大学学报, 2022, 56(10): 1359-1367. |
| [8] | 王金凤, 陈璐, 杨雯慧. 考虑设备可用性约束的单机调度问题[J]. 上海交通大学学报, 2021, 55(1): 103-110. |
| [9] | 赵芮, 顾幸生. 求解零空闲流水车间调度问题的离散正弦优化算法[J]. 上海交通大学学报, 2020, 54(12): 1291-1299. |
| [10] | 胡家文,蒋祖华,韩李杰. 工况时变下设备预防维护策略[J]. 上海交通大学学报(自然版), 2016, 50(05): 736-741. |
| [11] | 王红,杜维鑫,刘志龙,杨欣翥,李忠学. 联合故障与经济相关性的动车组多部件系统维护[J]. 上海交通大学学报(自然版), 2016, 50(05): 660-667. |
| [12] | 丁珮雯,蒋祖华,胡家文,韩李杰. 带有交货期时间窗的生产与维护联合调度优化[J]. 上海交通大学学报(自然版), 2015, 49(04): 524-530. |
| [13] | 余佳迪,周炳海. 带缓冲的串行生产系统预防性维护策略[J]. 上海交通大学学报(自然版), 2014, 48(12): 1694-1699. |
| [14] | 綦法群,周炳海. 基于Markov过程的集束型设备预防维护策略[J]. 上海交通大学学报(自然版), 2014, 48(10): 1461-1467. |
| [15] | 陶辛阳,夏唐斌,奚立峰. 基于健康指数的预防性维护与多目标生产调度联合优化建模[J]. 上海交通大学学报(自然版), 2014, 48(08): 1170-1174. |
| 阅读次数 | ||||||
|
全文 |
|
|||||
|
摘要 |
|
|||||