面向柔性作业车间动态调度的双系统强化学习方法
刘亚辉, 申兴旺, 顾星海, 彭涛, 鲍劲松, 张丹

A Dual-System Reinforcement Learning Method for Flexible Job Shop Dynamic Scheduling
LIU Yahui, SHEN Xingwang, GU Xinghai, PENG Tao, BAO Jinsong, ZHANG Dan
表1 符号与变量
Tab.1 Symbols and variables
符号 符号描述
J 工件集合
G 设备组集合
M 设备集合
P 人员集合
S 物料集合
ok, i, j k个任务中工件Ji的第j道工序
j 工序索引j=1, 2, …, m
Rk, i, j k个任务中工件Ji的第j道工序配置资源,Rk, i, j={Mk, i, j, Pk, i, j, Sk, i, j}
Mk, i, j 工序ok, i, j的配置设备
Pk, i, j 工序ok, i, j的配置操作人员
Sk, i, j 工序ok, i, j的配置物料
S k , i T k个任务中工件Ji的到达时间
s o k , i , j t 工序ok, i, j的开始时间
e o k , i , j t 工序ok, i, j的结束时间
r o k , i , j t 工序ok, i, j与下道工序的准备时间
B k , i T k个任务中工件Ji的总加工时间
Wl, t(Wk, i) 设备组Gl中设备Mt的加工负载(以设备为目标计算得到Wl,t,以工序为单位计算得到Wk,i)
L l , t W 设备组Gl中设备Mt的最大加工负载
B M k , i , j J k , i 0-1决策变量,取1时表示第k个任务中工件Ji在设备Mi, j上加工
DP 交付期