医学数据挖掘案例与实践
作者:华琳,李林主编;夏翃等副主编
出版时间:2016年版
内容简介
基于大数据时代生物医学数据的爆炸式增长,本书从医学科研中的实际问题出发,以案例的形式深入浅出地介绍了近年来崭新的医学数据挖掘技术,包括决策树模型、支持向量机、随机森林分类、关联规则、贝叶斯网络构建等,并详细介绍了数据挖掘软件(SPSS、SAS、R等)的操作步骤,重点突出实用性和可操作性,以期提高读者对医学科研数据的深层次处理与分析的能力。
本书主要取材于编者近年来从事生物医学数据深度挖掘方面的研究与教学工作内容,既适用于医学院校本科生及研究生、医学基础及临床科研工作者和相关技术人员作为教材,也可作为科学研究的参考用书。
内页插图
目录
第1章 数据预处理 1
1.1 异常值的常见处理方法 1
1.2 缺失值的填补 8
第2章 多元线性回归分析 14
2.1 多元线性回归的概念 14
2.2 多元线性回归的模型结构 14
2.3 多元逐步线性回归 17
第3章 Logistic回归分析 22
3.1 Logistic回归分析的基本概念 22
3.2 Logistic回归的模型结构 22
3.3 应用实例1:一般资料的Logistic回归 23
3.4 应用实例2:列联表资料的Logistic回归 27
3.5 应用实例3:多项Logistic回归分析 29
第4章 非线性回归拟合分析 32
4.1 非线性回归基本概念 32
4.2 应用实例1:对新增SARS病例数的预测分析 32
4.3 应用实例2:对累计SARS病例数的预测分析 37
第5章 生存分析 41
5.1 生存分析的基本概念 41
5.2 生存分析的资料特点 41
5.3 生存资料的分析方法 42
5.4 应用实例1:累积生存率的计算 42
5.5 应用实例2:小样本生存率的Kaplan-Meier估计 45
5.6 应用实例3:生存曲线比较的Log-rank检验 47
5.7 应用实例4:Cox回归 51
5.7.1 Cox模型结构与参数估计 51
5.7.2 应用实例:Cox回归分析 51
第6章 基于竞争风险模型的生存分析 56
6.1 竞争风险模型 56
6.2 应用实例:竞争风险模型的生存分析 56
第7章 Meta分析 62
7.1 Meta分析概述 62
7.2 Meta分析的方法与步骤 62
7.3 应用实例1:二分类资料的Meta分析 63
7.4 应用实例2:连续资料的Meta分析 71
第8章 剂量-反应模型的Meta分析 77
8.1 剂量-反应关系的数据结构 77
8.2 线性拟合 78
8.3 非线性拟合-三次曲线拟合 79
第9章 决策树模型分析 82
9.1 分类的概念 82
9.2 分类的步骤 82
9.3 分类器性能的评估 83
9.4 决策树分类器简介 83
9.5 应用实例:决策树分析 85
第10章 随机森林法提取特征属性 88
10.1 随机森林方法基本概念 88
10.2 基于平均基尼指数减少量的特征属性选择 88
10.3 应用实例:随机森林法提取特征属性 90
第11章 倾向性得分匹配方法 94
11.1 倾向性得分匹配方法 94
11.2 倾向性得分匹配方法的步骤 94
11.3 应用实例:倾向性得分匹配 95
第12章 用广义估计方程分析重复测量的定性资料 102
12.1 广义估计方程的基本概念 102
12.2 广义线性模型的结构 102
12.3 GEE算法 103
12.4 应用实例1:重复测量的实验数据 103
12.5 应用实例2:问卷调查中的多选题数据 105
第13章 基于支持向量机的微阵列数据分类 109
13.1 支持向量机简介 109
13.2 支持向量机的基本原理 109
13.3 应用实例:支持向量机分类 111
第14章 时间序列分析 113
14.1 时间序列分析的基本概念 113
14.2 时间序列分析的主要步骤 113
14.3 应用实例:时间序列分析 114
第15章 路径图分析 118
15.1 路径图分析基本理论 118
15.2 路径图分析的基本步骤 118
15.3 应用实例:路径图分析 119
15.3.1 第一个回归分析 119
15.3.2 第二个回归分析 121
15.3.3 第三个回归分析 122
第16章 主成分分析与因子分析 124
16.1 主成分分析概念 124
16.2 应用实例1:主成分分析 124
16.3 因子分析概念 129
16.4 应用实例2:因子分析 129
第17章 判别分析 134
17.1 判别分析的概念 134
17.2 常用的判别分析方法 134
17.3 判别函数的验证 135
17.4 应用实例:判别分析 135
第18章 聚类分析 144
18.1 聚类分析的概念 144
18.2 K均值聚类法 144
18.3 应用实例1:K均值聚类 145
18.4 系统聚类法 148
18.5 应用实例2:系统聚类 149
18.6 绘制双向聚类热图 153
第19章 关联规则 156
19.1 关联规则的基本概念 156
19.2 关联规则的质量和重要性 156
19.3 关联规则分析的基本方法 157
19.4 应用实例:关联规则分析 157
第20章 两组ROC曲线下的面积比较 161
20.1 ROC曲线的构建 161
20.2 ROC曲线下面积 162
20.3 两组ROC曲线下面积比较 162
20.4 应用实例:两组ROC曲线下面积比较 162
第21章 诊断准确性试验Meta分析 166
21.1 诊断准确性试验Meta分析基本概念 166
21.2 诊断准确性试验Meta分析的相关评价指标 166
21.3 应用实例:诊断准确性试验Meta分析 167
第22章 贝叶斯网络分析 173
22.1 贝叶斯网络的概念 173
22.2 应用实例:贝叶斯网络构建 174
第23章 偏最小二乘回归分析 179
23.1 偏最小二乘回归的基本步骤和原理 179
23.2 应用实例:偏最小二乘回归分析 180
参考文献 185