欢迎访问学兔兔,学习、交流 分享 !

返回首页 |

基于增强学习的制造系统调度 张智聪,郑力 著 2016年版

收藏
  • 大小:40.08 MB
  • 语言:中文版
  • 格式: PDF文档
  • 阅读软件: Adobe Reader
资源简介
基于增强学习的制造系统调度
作 者: 张智聪,郑力 著
出版时间: 2016

内容简介
  增强学习是人工智能领域一种应用越来越广泛的机器学习算法。《基于增强学习的制造系统调度》对增强学习的基本原理、主要经典算法及其在制造系统调度领域若干问题的应用进行阐述。主要内容包括:Sarsa(λ,k)增强学习算法等增强学习算法的介绍及相关理论证明;增强学习架构及面向生产调度问题的增强学习模型构建方式;流水车间调度问题、平行机调度问题、半导体测试调度问题等制造系统调度问题与自组织型排队网络调度问题的增强学习模型及解决方案;增强学习在以上调度问题应用的实验结果及相关分析等。《基于增强学习的制造系统调度》适合管理科学与工程、工业工程等专业的研究生和本科生使用,也可供从事制造系统分析与优化、智能调度等领域工作的研究人员和工程技术人员参考。
目录
前言
第1章 绪论
1.1 增强学习基本原理
1.1.1 马尔可夫决策过程
1.1.2 增强学习系统
1.1.3 增强学习算法的分类与发展概述
1.2 增强学习算法应用引例——最短路问题
1.3 增强学习算法在调度领域的应用研究
1.4 本书组织结构
第2章 增强学习算法
2.1 经典的增强学习算法
2.1.1 TD/TD(λ)学习算法
2.1.2 Q学习
2.1.3 Sarsa算法
2.1.4 R学习
2.2 Sarsa(λ,k)算法
2.2.1 Sarsa(λ,k)算法的基本原理
2.2.2 前视与后视Sarsa(λ,k)算法
2.2.3 Sarsa(λ,k)算法的性质
2.3 SMDP型Sarsa(λ,k)算法
2.4 多维行为的增强学习算法
2.5 一种自适应步长的增强学习算法
第3章 流水车间调度问题
3.1 问题描述
3.2 流水车间调度问题的增强学习模型
3.2.1 系统状态表示
3.2.2 行为
3.2.3 报酬函数
3.3 结合线性函数泛化器的TD(λ)算法及实验结果
3.3.1 结合线性函数泛化器的TD(λ)算法
3.3.2 实验结果
第4章 平行机调度问题
4.1 最小化加权平均流程时间的离线平行机调度
4.1.1 问题描述
4.1.2 增强学习模型
4.1.3 实验结果
4.2 最小化加权平均误工时间的离线平行机调度
4.2.1 问题描述
4.2.2 增强学习建模
4.2.3 实验结果
4.3 最小化加权平均流程时间的在线平行机调度
4.3.1 问题描述
4.3.2 增强学习模型
4.3.3 实验结果
4.4 最小化加权平均误工时间的在线平行机调度
4.4.1 问题描述
4.4.2 增强学习模型
4.4.3 求解变速机调度问题的R学习
4.4.4 实验结果
第5章 半导体测试调度问题
5.1 半导体测试调度问题描述
5.2 关于半导体测试调度的研究
5.2.1 附加资源充足的半导体测试调度
5.2.2 附加资源受限的半导体测试调度
5.2.3 和半导体测试调度相关的调度问题
5.2.4 小结
5.3 整数规划模型
5.3.1 符号定义
5.3.2 决策变量
5.3.3 目标函数和约束
5.3.4 问题性质分析
5.4 半导体测试调度问题的增强学习模型
5.4.1 状态变量及状态转移机制
5.4.2 行为
5.4.3 报酬函数
5.5 结合函数泛化器的Sarsa(λ,k)算法
5.5.1 径向基神经网络函数泛化器
5.5.2 神经网络的构造
5.5.3 函数泛化器的权重更新法则
5.5.4 结合径向基神经网络函数泛化器的Sarsa(λ,k)算法
5.6 演示算例
5.7 参数设置与函数泛化器性能分析
5.7.1 行为选择
5.7.2 参数设置
5.7.3 函数泛化器性能分析
5.8 半导体测试调度实验结果与分析
5.8.1 与工业方法及各行为策略对比
5.8.2 与其他增强学习算法对比
5.8.3 与能力约束调度方法对比
5.9 讨论
5.10 可重构制造系统调度
5.10.1 具有可重构特性的调度系统机制
5.10.2 增强学习模型架构
第6章 排队网络控制问题
6.1 多服务台排队系统控制的半马尔可夫决策模型
6.1.1 问题描述
6.1.2 半马尔可夫决策模型建模
6.1.3 排队控制系统的性质
6.1.4 数值例子
6.2 自组织型排队网络控制问题
6.2.1 自组织型排队网络控制问题描述
6.2.2 自组织型排队网络控制问题的增强学习模型
6.2.3 解决自组织型排队网络控制问题的增强学习算法
第7章 结束语
参考文献
其他参考文献
下载地址