数据挖掘理论、方法与应用
作者:罗泽举 著
出版时间:2014年版
内容简介
本书共分10章。第1章介绍了数据挖掘方法的历史,另外讨论了统计学习的一般模型。第2、3、4章介绍了三种数据挖掘模型:人工神经网络、支持向量机和隐马尔可夫模型。第5章介绍了一种新型支持向量诱导回归模型,第6章介绍了一种基于快速训练算法的HMM/SVM混合系统,第7章介绍了分解向前算法及PCA/ICA降维SVM模型,第8章介绍了不对称支持向量机改进算法,第9章介绍了一种基于隐马尔可夫模型的多重序列分析方法,第10章介绍了一类基于SVM/RBF的气象模型预测系统。
目录
第1章 绪论1
1.1 研究背景2
1.2 数据挖掘的基本数学问题5
1.2.1 相关概念5
1.2.2 统计学习的一般模型10
1.3 数据的变换11
参考文献13
第2章 神经网络挖掘理论19
2.1 神经智能19
2.2 生物神经元和人工神经元21
2.2.1 生物神经元21
2.2.2 人工神经元23
2.2.3 建立数学模型24
2.2.4 单层与多层网络结构27
2.2.5 网络学习方式32
2.2.6 经典学习规则34
2.3 LMS和SDA方法35
2.3.1 平均平方误差函数36
2.3.2 LMS和SDA算法39
2.4 后向传播算法43
2.4.1 概况43
2.4.2 多层网络BP算法44
参考文献50
第3章 基于支持向量的挖掘理论52
3.1 支持向量与分类超平面52
3.1.1 一维情形52
3.1.2 二维情形54
3.1.3 三维情形56
3.1.4 n维情形57
3.1.5 核函数(内积回旋)思想58
3.1.6 核函数定义63
3.2 风险控制策略65
3.2.1 VC维概念65
3.2.2 经验风险最小化原则66
3.2.3 结构风险最小化原则67
3.3 样本被错分的讨论68
3.3.1 最大间隔分类超平面68
3.3.2 数据被错分的条件70
3.4 最优化策略71
3.5 分类与回归74
3.5.1 分类算法74
3.5.2 回归算法78
3.5.3 解的全局最优讨论80
3.6 几种经典算法描述82
3.6.1 分解算法82
3.6.2 分块算法83
3.6.3 序贯最小化算法84
3.6.4 核函数构造算法85
参考文献85
第4章 隐马尔可夫挖掘理论87
4.1 马尔可夫思想87
4.2 隐马尔可夫链90
4.3 隐马尔可夫模型94
4.3.1 隐马尔可夫模型定义94
4.3.2 三个基本算法95
参考文献102
第5章 新型支持向量诱导回归模型及应用104
5.1 新型支持向量诱导回归模型104
5.1.1 不敏感损失函数104
5.1.2 系统模型106
5.2 时间序列分析的相空间重构108
5.2.1 相空间重构108
5.2.2 性能评价指标109
5.2.3 重构模式的近似算法110
5.3 预测置信度估计110
5.4 实验结果111
5.4.1 参数的确定111
5.4.2 预测指数分析112
5.4.3 预测结果113
5.4.4 SVM和传统神经网络的比较115
5.4.5 讨论116
参考文献117
第6章 基于快速训练算法的HMM/SVM混合系统118
6.1 L值定义118
6.2 快速训练算法和HMM/SVM混合过滤模型119
6.2.1 基于HMM的快速训练算法119
6.2.2 HMM/SVM的双层混合系统模型120
6.3 实验结果121
6.3.1 数据的获取及序列的编码122
6.3.2 DNA的两类和多类分类识别123
6.3.3 讨论126
参考文献127
第7章 分解向前算法及PCA/ICA降维SVM模型129
7.1 主成分分析(PCA)的数学模型129
7.2 独立成分分析(ICA)的数学模型131
7.3 分解向前支持向量机133
7.3.1 三个距离区域133
7.3.2 分解向前算法134
7.3.3 DFSVM算法复杂度分析136
7.3.4 PCA—DFSVM及ICA—DFSVM降维模型137
7.4 实验结果138
7.4.1 SCOP数据库138
7.4.2 实验1138
7.4.3 实验2139
7.4.4 各项实验指标比较140
7.4.5 讨论141
参考文献141
第8章 不对称支持向量机改进算法及应用143
8.1 不对称支持向量机143
8.1.1 样本的不对称性143
8.1.2 不对称支持向量机算法143
8.1.3 不对称SVM分类迭代模型146
8.2 几种多分类问题的算法复杂度估计146
8.3 实验结果149
8.3.1 实验1150
8.3.2 实验2151
8.3.3 MISVM和标准SVM实验指标比较153
参考文献155
第9章 基于隐马尔可夫模型的多重序列分析156
9.1 研究背景156
9.2 多重序列比对157
9.2.1 多重序列比对的描述157
9.2.2 特征序列158
9.3 隐马尔可夫模型的序列描述158
9.4 建立多重序列隐马尔可夫轮廓图160
9.5 实验结果和讨论161
9.5.1 Pfam数据库简介161
9.5.2 建立隐马尔可夫模型162
9.5.3 检验HMMS模型162
9.5.4 用HMMS进行蛋白质家族的模式分类163
9.6 关于模型的局限性讨论164
参考文献165
第10章 一类基于SVM/RBF的气象模型预测系统167
10.1 支持向量机回归模型167
10.1.1 回归支持向量机167
10.1.2 模型中几个重要参数分析168
10.2 温度序列数据分析169
10.3 决策函数的确定170
10.4 预测结果分析171
10.5 结论173
参考文献173