人工智能:计算agent基础
作者:(加)普尔,(加)麦克沃思 著; 董红斌,董兴业,童向荣,汪廷华 译; 黄厚宽 校
出版时间:2015
丛编项: 计算机科学丛书
内容简介
《人工智能:计算agent基础》有机地将理论与实践结合起来,既详细地介绍了各种人工智能理论,又提供了实现的思路和程序,这将有利于本科生或研究生在学习人工智能时把对人工智能的理性认识转化为对具体程序的感性认识,从而弥补大部分人工智能教材偏重于理论的缺陷。本书可供计算机科学或计算机工程、哲学、认知科学和心理学等相关学科的高年级本科生或研究生学习。
目录
出版者的话
译者序
前 言
第一部分 世界中的Agent:什么是Agent及如何创建它们
第1章 人工智能与Agent2
1.1 什么是人工智能2
1.2 人工智能简史4
1.3 环境中的Agent6
1.4 知识表示7
1.4.1 定义解8
1.4.2 表示9
1.4.3 推理与行为10
1.5 复杂性维度12
1.5.1 模块性12
1.5.2 表示方案13
1.5.3 规划期14
1.5.4 不确定性15
1.5.5 偏好15
1.5.6 Agent数量16
1.5.7 学习16
1.5.8 计算限制17
1.5.9 多维交互18
1.6 原型应用19
1.6.1 自主传送机器人19
1.6.2 诊断助手21
1.6.3 智能指导系统23
1.6.4 交易Agent24
1.7 本书概述25
1.8 本章小结26
1.9 参考文献及进一步阅读26
1.10 习题27
第2章 Agent体系结构和分层控制28
2.1 Agent28
2.2 Agent系统29
2.3 分层控制32
2.4 嵌入式和仿真Agent37
2.5 通过推理来行动38
2.5.1 设计时间与离线计算39
2.5.2 在线计算40
2.6 本章小结41
2.7 参考文献及进一步阅读42
2.8 习题42
第二部分 表达和推理
第3章 状态和搜索46
3.1 用搜索进行问题求解46
3.2 状态空间47
3.3 图搜索48
3.4 一个通用搜索算法50
3.5 无信息搜索策略51
3.5.1 深度优先搜索51
3.5.2 宽度优先搜索55
3.5.3 最低花费优先搜索56
3.6 启发式搜索56
3.6.1 A*搜索58
3.6.2 搜索策略总结59
3.7 更复杂的搜索方法60
3.7.1 环检查60
3.7.2 多路径剪枝60
3.7.3 迭代深化62
3.7.4 分支界限法63
3.7.5 搜索方向65
3.7.6 动态规划法66
3.8 本章小结68
3.9 参考文献及进一步阅读68
3.10 习题69
第4章 特征和约束71
4.1 特征和状态71
4.2 可能世界、变量和约束72
4.2.1 约束74
4.2.2 约束满足问题75
4.3 生成测试算法76
4.4 使用搜索求解CSP76
4.5 一致性算法78
4.6 域分割81
4.7 变量消除83
4.8 局部搜索85
4.8.1 迭代最佳改进86
4.8.2 随机算法87
4.8.3 评估随机算法90
4.8.4 局部搜索中利用命题结构92
4.9 基于种群的方法92
4.10 最优化94
4.10.1 最优化的系统方法96
4.10.2 局部搜索最优化98
4.11 本章小结99
4.12 参考文献及进一步阅读100
4.13 习题100
第5章 命题和推理103
5.1 命题103
5.1.1 命题演算的语法103
5.1.2 命题演算的语义104
5.2 命题确定子句107
5.2.1 问题与解答109
5.2.2 验证110
5.3 知识表示问题115
5.3.1 背景知识与观察115
5.3.2 询问用户116
5.3.3 知识层的解释117
5.3.4 知识层的调试119
5.4 反证法验证122
5.4.1 Horn子句122
5.4.2 假说与冲突123
5.4.3 基于一致性的诊断124
5.4.4 通过假设和Horn子句推理126
5.5 完备知识假设127
5.5.1 非单调推理130
5.5.2 完备知识的验证程序130
5.6 溯因推理132
5.7 因果模型135
5.8 本章小结137
5.9 参考文献及进一步阅读137
5.10 习题138
第6章 不确定推理145
6.1 概率145
6.1.1 概率的语义146
6.1.2 概率公理147
6.1.3 条件概率149
6.1.4 期望值152
6.1.5 信息理论153
6.2 独立性153
6.3 信念网络155
6.4 概率推理164
6.4.1 信念网络中的变量消除164
6.4.2 通过随机模拟进行近似推理169
6.5 概率和时间176
6.5.1 马尔可夫链176
6.5.2 隐马尔可夫模型176
6.5.3 监听和平滑算法179
6.5.4 动态信念网络180
6.5.5 时间粒度181
6.6 本章小结181
6.7 参考文献及进一步阅读181
6.8 习题182
第三部分 学习与规划
第7章 学习概述与有监督学习186
7.1 学习问题186
7.2 有监督学习189
7.2.1 评估预测190
7.2.2 无输入特征的点估计193
7.2.3 概率学习195
7.3 有监督学习的基本模型196
7.3.1 决策树学习196
7.3.2 线性回归与分类200
7.3.3 贝叶斯分类器203
7.4 组合模型206
7.4.1 神经网络207
7.4.2 集成学习210
7.5 避免过拟合210
7.5.1 最大后验概率和最小描述长度211
7.5.2 交叉验证213
7.6 基于案例的推理213
7.7 改进假设空间的学习215
7.7.1 变型空间学习216
7.7.2 可能近似正确学习218
7.8 贝叶斯学习220
7.9 本章小结224
7.10 参考文献及进一步阅读225
7.11 习题225
第8章 确定性规划229
8.1 状态、动作以及目标的表示229
8.1.1 显式状态空间表示法230
8.1.2 基于特征的动作表示231
8.1.3 STRIPS表示法232
8.1.4 初始状态和目标233
8.2 前向规划233
8.3 回归规划235
8.4 CSP规划236
8.5 偏序规划238
8.6 本章小结241
8.7 参考文献及进一步阅读241
8.8 习题241
第9章 不确定性规划244
9.1 偏好和效用245
9.2 一次性的决策252
9.3 序贯决策255
9.3.1 决策网络256
9.3.2 策略258
9.3.3 决策网络的变量消除259
9.4 信息与控制的价值262
9.5 决策过程264
9.5.1 策略值267
9.5.2 最优策略值267
9.5.3 值迭代268
9.5.4 策略迭代270
9.5.5 动态决策网络271
9.5.6 部分可观察决策过程273
9.6 本章小结273
9.7 参考文献及进一步阅读274
9.8 习题274
第10章 多Agent系统280
10.1 多Agent框架280
10.2 博弈的表示281
10.2.1 博弈的标准形式281
10.2.2 博弈的扩展形式282
10.2.3 多Agent决策网络283
10.3 完全信息的计算策略284
10.4 部分可观察的多Agent推理286
10.4.1 纳什均衡计算290
10.4.2 学习协调292
10.5 群体决策294
10.6 机制设计294
10.7 本章小结296
10.8 参考文献及进一步阅读297
10.9 习题297
第11章 有监督之外的其他学习模型298
11.1 聚类298
11.1.1 期望最大化298
11.1.2 k-均值299
11.1.3 用于软聚类的期望最大化300
11.2 信念网络学习303
11.2.1 概率学习303
11.2.2 未观察到的变量304
11.2.3 缺失数据304
11.2.4 结构学习305
11.2.5 信念网络学习的一般情形306
11.3 增强学习306
11.3.1 演化算法308
11.3.2 时间差308
11.3.3 Q-学习309
11.3.4 探索与利用312
11.3.5 增强学习算法的评估313
11.3.6 在策略学习314
11.3.7 为路径分配信用和责任315
11.3.8 基于模型的方法317
11.3.9 基于特征的增强学习319
11.4 本章小结320
11.5 参考文献及进一步阅读321
11.6 习题321
第四部分 个体与关系的推理
第12章 个体与关系324
12.1 在特征之外利用结构324
12.2 符号与语义325
12.3 Datalog:一个关联规则语言326
12.3.1 基Datalog的语义328
12.3.2 解释变量329
12.3.3 带变量的查询333
12.4 证明与替换334
12.4.1 带变量的自底向上过程335
12.4.2 带变量的确定性归结337
12.5 函数符号339
12.6 在自然语言处理中的应用344
12.6.1 在上下文无关文法中使用限定子句345
12.6.2 增强文法347
12.6.3 为非终结符号建立结构348
12.6.4 封装的文本输出348
12.6.5 强制约束349
12.6.6 建立自然语言与数据库的接口350
12.6.7 局限351
12.7 相等352
12.7.1 允许相等断言352
12.7.2 唯一名字假设353
12.8 完备知识假设355
12.9 本章小结358
12.10 参考文献及进一步阅读358
12.11 习题359
第13章 本体和基于知识的系统363
13.1 知识共享363
13.2 灵活的表示363
13.2.1 选择个体和关系364
13.2.2 图形化表示366
13.2.3 原始关系与导出关系369
13.3 本体与知识共享373
13.3.1 描述逻辑376
13.3.2 顶层本体380
13.4 查询用户和其他知识来源382
13.4.1 函数化关系383
13.4.2 更普遍的问题383
13.5 实现基于知识的系统384
13.5.1 基语言和元语言385
13.5.2 普通的元解释器386
13.5.3 扩展基语言387
13.5.4 深度有限搜索388
13.5.5 元解释器构建证明树389
13.5.6 可询问用户的元解释器390
13.5.7 推迟目标391
13.6 本章小结391
13.7 参考文献及进一步阅读392
13.8 习题392
第14章 关系规划、学习和概率推理396
14.1 规划个体与关系396
14.1.1 情景演算396
14.1.2 事件演算401
14.2 个体与关系的学习402
14.3 概率关系模型406
14.4 本章小结410
14.5 参考文献及进一步阅读411
14.6 习题411
第五部分 宏观图景
第15章 回顾与展望416
15.1 复杂性维度回顾416
15.2 社会与道德后果418
15.3 参考文献及进一步阅读420
附录A 数学基础与记号421
参考文献425
索引439