论文阅读|《基于Q学习的超启发式模型及算法求解多模式资源约束项目调度问题》

Posted 码丽莲梦露

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文阅读|《基于Q学习的超启发式模型及算法求解多模式资源约束项目调度问题》相关的知识,希望对你有一定的参考价值。

《基于Q学习的超启发式模型及算法求解多模式资源约束项目调度问题》

计算机集成制造/2021/北京科技大学

各种优化算法存在下列现象:

(1)同一种算法对于类型相近的问题或类型相同但数据不同的算例,在效率和效果上差异很大。为了达到理想的优化目标,人们不得不进行算法定制。基于个人经验和灵动、尝试不同的参数、拓扑结构和搜 索策略,缺乏理论层次的指导,导致算法应用成本居高不下。

(2)虽然不同算法的寻优策略各有千秋,但许多算法展现出相同或相似的实现机制。例如,受自然现象启发、利用群集智能、包含随机成分、不使用梯度信息、有若干可调参数等。这些现象无疑为开发通用型算法、实现算法软件重用、转换即用型算法等需求提供了契机。人们有理由提出并尝试各种算法融合技术,研发一类适应性更强且结果令人可接受的“超启发式”算法。

1 超启发式算法与Q-学习机制

1.1 超启发式算法

超启发式算法的动机之一就是开发更普遍适用的算法,通过自动化设计和调整启发式算子更高效地解决搜索计算问题。与手动算法定制不同,超启发式算法可被视为根据问题自动化地定制算法。因此,一个重要的目标是其通用性,基于一组易于实现地低级启发式方法生成质量可接受地解决方案。

目前,大多数研究属于在线扰动(或称移动)的选择启发式,其模型由两个层次组成,如下图所示:

底层包含问题的表示、评估函数和一组特定于问题的LLH(Low Level Heuristic,LLH),通过启发式扰动修改当前解;

高层则控制LLH选择并依据既定规则判断是否接受所做出的扰动选择。LLH选择方法包括简单随机、选择函数、禁忌搜索和强化学习等。

 

以上是关于论文阅读|《基于Q学习的超启发式模型及算法求解多模式资源约束项目调度问题》的主要内容,如果未能解决你的问题,请参考以下文章

论文阅读|《 基于强化学习的自适应遗传算法求解柔性作业车间调度问题》

论文阅读|《基于加权Q学习算法的自适应车间调度策略》

Python机器学习及实践——进阶篇6(超参数搜索)

Python机器学习及实践——进阶篇6(超参数搜索)

机器学习(二十七)— EM算法

论文阅读|《一种基于非支配排序的改进生物地理学优化算法求解多目标FJSP》