基于自适应动态规划的智能优化控制
出版时间:2013年版
内容简介
自适应动态规划以传统的最优控制为理论基础,融合人工智能的先进方法,基于强化学习原理,模拟人通过环境反馈进行学习的思路,采用非 线 性函数拟合方法逼近动态规划的性能指标,有效地解决了动态规划“维数灾”的难题,为高维复杂非线性系统的最优控制提供了一种切实可行的理 论 和方法。自适应动态规划体现了人工智能和控制领域的一个重要发展方向。 《基于自适应动态规划的智能优化控制》对基于白适应动态规划的智能优化控制进行了较为详尽的分析和 论述,主要内容包括:动态规划、强化学习理论、自适应动态规划的基本 原理、自适应动态规划的基本结构、自适应动态规划的主要算法和实现技术 、 自适应动态规划的应用实例,以及自适应动态规划的发展趋势。 林小峰等专著的《基于自适应动态规划的智能优化控制》可供从事智能控制、优化控制、计算智能、人工智能与智能信息处 理的科技人员使用,也可供高等院校有关专业师生参考。
目录
第1章 动态规划 1.1 动态规划的基本方法 1.1.1 多级决策过程 1.1.2 最优性原理 1.1.3 动态规划的基本递推方程 1.2 离散系统的动态规划 1.2.1 离散最优问题的动态规划解 1.2.2 动态规划的数值计算法 1.2.3 离散系统动态规划的特点 1.3 连续动态规划 1.3.1 连续时间系统的最优控制问题 1.3.2 哈密顿一雅可比贝尔曼方程 1.3.3 连续动态规划的基本方程 参考文献 第2章 强化学习 2.1强化学习的基本概念 2.2 强化学习的形成和发展 2.2.1 强化学习的学科基础 2.2.2 强化学习的形成阶段 2.2.3 强化学习的发展阶段 2.3 强化学习的主要算法 2.3.1 蒙特卡罗算法 2.3.2 时序差分算法 2.3.3 自适应启发评价算法 2.3.4 Q一学习算法 参考文献 第3章 自适应动态规划 3.1 自适应动态规划的研究概况 3.2 大脑智能与优化 3.2.1 神经系统 3.2.2 大脑的分区功能与统一协调 3.2.3 大脑是智能控制器 3.2.4 大脑的渐进学习 3.2.5 强化学习与最优化 3.2.6 大脑优化的两个问题 3.2.7 仿脑智能优化控制的实现 3.3 自适应动态规划的基本原理 3.3.1 自适应动态规划的基本思想 3.3.2 动态规划的前向、后向算法 3.3.3 自适应动态规划迭代算法 3.3.4 函数近似结构 3.3.5 自适应动态规划的优点 3.4 自适应动态规划的基本结构与分类 3.4.1 启发式动态规划 3.4.2 双启发式动态规划 3.4.3 执行依赖启发式动态规划 3.4.4 执行依赖双启发式动态规划 3.5 自适应动态规划的发展趋势 3.5.1 三代大脑智能ADP模型 3.5.2 自适应动态规划的研究动态 参考文献 第4章 基于BP网络的自适应动态规划算法及实现 4.1 基于BP网络的HDP算法及实现 4.1.1 HDP的结构和基本原理 4.1.2 模型网络 4.1.3 评价网络 4.1.4 执行网络 4.1.5 相关参数的选择 4.2 基于BP网络的DHP算法及实现 4.2.1 DHP的结构和基本原理 4.2.2 模型网络 4.2.3 评价网络 4.2.4 执行网络 4.3 基于BP网络的ADHDP算法及实现 4.3.1 ADHDP结构和基本原理 4.3.2 评价网络 4.3.3 执行网络 参考文献 第5章 自适应动态规划的应用 5.1 水泥预分解窑系统的HDP控制 5.1.1 水泥预分解窑系统 5.1.2 水泥预分解窑的神经网络建模 5.1.3 水泥预分解窑HI)I算法 5.1.4 HDP训练策略及控制系统仿真 5.1.5 小结 5.2 糖厂澄清过程pH值的DHP控制 5.2.1 糖厂澄清过程工艺流程 5.2.2 制糖澄清过程系统建模 5.2.3 制糖澄清过程DHP算法 5.2.4 DHP算法控制清汁pH值 5.2.5 小结 5.3 同步发电机励磁系统的ADP控制 5.3.1 同步发电机及其励磁系统 5.3.2 基于ADHDP的励磁控制 5.3.3 基于多目标ADHI)P的励磁控制 5.4 基于DHP方法的发电商竞价策略模型 5.4.1 竞价策略研究 5.4.2 发电商市场竞价策略模型 5.4.3 仿真试验及分析 5.4.4 小结 5.5 ADHDP在高压直流输电整流控制中的应用 5.5.1 高压直流输电系统 5.5.2 ADHDP整流控制器漫计 5.5.3 整流侧定电流、逆变侧定电压控制模型仿真 5.5.4 小结 5.6 三容液位系统的ADHDP控制 5.6.1 三容液位系统简介及其模型 5.6.2 三容液位系统ADHI)P控制器设计 5.6.3 控制仿真及分析 5.6.4 实时控制 5.6.5 小结 参考文献