面向柔性作业车间动态调度的双系统强化学习方法
刘亚辉, 申兴旺, 顾星海, 彭涛, 鲍劲松, 张丹

A Dual-System Reinforcement Learning Method for Flexible Job Shop Dynamic Scheduling
LIU Yahui, SHEN Xingwang, GU Xinghai, PENG Tao, BAO Jinsong, ZHANG Dan
表3 资源配置决策动作
Tab.3 Decision-making action of resource allocation
决策方法 描述
决策1 若人员、设备当前工作环境中空闲且资源配料充足,选择某工件所需人员、设备、物料等资源,然后将其组合为资源配置方案.
决策2 若人员、设备当前工作环境中忙碌且资源配料不充足,分别判断人员已工作工时与技能参数、设备的负载量和资源的存储量,在满足设备负载量最优的情况下将其组合为资源配置方案.