面向柔性作业车间动态调度的双系统强化学习方法
刘亚辉, 申兴旺, 顾星海, 彭涛, 鲍劲松, 张丹

A Dual-System Reinforcement Learning Method for Flexible Job Shop Dynamic Scheduling
LIU Yahui, SHEN Xingwang, GU Xinghai, PENG Tao, BAO Jinsong, ZHANG Dan
表2 调度状态参数
Tab.2 Parameters of scheduling status
调度状态 参数类型 表达式 含义
资源配置状态 人员状态 f 1 , 1 1 f 1,1 , 1 1=Pk, i, j 人员类型
物料状态 f 1 , 2 1 f 1 , 2 , 1 1=Sk, i, j 物料类型
设备状态 f 1,3 1 f 1 , 3 , 1 1=Mk, i, j 设备类型
f 1 , 3 , 2 1 = B M k , i , j J k , i = 0 ,   k i M k , i , j 1 ,   k i M k , i , j (Mk, i, jM) 设备状态
工序排序状态 工艺状态 f 1 , 1 2 f 1 , 1 , 1 2=ok, i, j 工艺状态
f 1 , 1 , 2 2=Gk, i, j 设备组状态
时间状态 f 1 , 2 2 f 1 , 2 , 1 2= s o k , i , j t 开始时间
f 1 , 2 , 2 2= e o k , i , j t 结束时间
f 1 , 2 , 3 2= r o k , i , j t 运输时间
f 1 , 2 , 4 2= D P k 交付期