%A 刘亚辉, 申兴旺, 顾星海, 彭涛, 鲍劲松, 张丹 %T 面向柔性作业车间动态调度的双系统强化学习方法 %0 Journal Article %D 2022 %J 上海交通大学学报 %R 10.16183/j.cnki.jsjtu.2021.215 %P 1262-1275 %V 56 %N 9 %U {https://xuebao.sjtu.edu.cn/CN/abstract/article_46037.shtml} %8 2022-09-28 %X

航天结构件生产过程中批产任务与研发任务并存,个性化小批量研发生产任务导致紧急插单现象频发.为了保障任务如期完成,解决柔性作业车间面临的动态调度问题,以最小化设备平均负载和最小化总完工时间为优化目标,提出了感知-认知双系统驱动的双环深度Q网络方法.感知系统基于知识图谱实现对车间知识的表示并生成多维信息矩阵;认知系统将调度过程分别抽象为资源配置智能体和工序排序智能体两个阶段,分别对应两个优化目标,设计了车间状态矩阵对问题和约束进行描述,调度决策中分步骤引入动作指令;最后分别设计奖励函数实现资源配置决策和工序排序决策的评价.经某动力所航天壳体加工的实例验证和算法对比分析,验证了所提方法的优越性.