摘要: 针对智能工厂中基于数据的作业车间调度问题,提出结合新的复合调度规则和深度强化学习的调度方法。对车间数据进行预处理并得到对应的系统状态,以连续系统状态值为深度强化学习算法的输入,设计4种新的复合调度规则以应对更为复杂和冲突的车间环境,将复合调度规则和其他8种著名调度规则作为候选调度规则,依据贪婪选择策略选择调度规则并存储和更新状态动作值,最终为每次决策选取出最优调度规则。实验验证了结合复合调度规则和深度Q学习网络(Deep Q-Network, DQN)算法,在均衡权重下相比其他著名调度规则以及标准Q学习算法更具优势。
中图分类号:
钟敬伟,石宇强. 基于DQN的智能工厂作业车间调度[J]. 现代制造工程, 2021, 492(9): 17-23.