数据科学与工程技术丛书 计算机时代的统计推断 算法、演化和数据科学
作者:(美)布拉德利·埃夫隆,(美)特雷福·黑斯蒂 著
出版时间:2019年版
丛编项: 数据科学与工程技术丛书
内容简介
本书以丰富的案例介绍了计算机时代下的统计推断的发展脉络,从理论的角度剖析统计推断的各类算法、证据等,揭示统计推断如何推动当今大数据、数据科学、机器学习等领域的快速发展并数据分析的变革,*后展望了统计学和数据科学的未来方向。
目录
赞誉
译者序
前言
致谢
第一部分 经典统计推断
第1章 算法与推断2
1.1 一个回归的例子3
1.2 假设检验5
1.3 注释7
注释7
第2章 频率学派推断8
2.1 实践中的频率学派9
2.2 频率学意义下的最优化12
2.3 注释与细节13
注释13
第3章 贝叶斯推断14
3.1 两个例子15
3.2 无信息先验分布18
3.3 频率学派推断的缺陷19
3.4 贝叶斯学派/频率学派的对比列表21
3.5 注释与细节23
注释23
第4章 Fisher推断和最大似然估计24
4.1 似然和最大似然24
4.2 Fisher信息和MLE26
4.3 条件推断28
4.4 排列和随机化31
4.5 注释与细节32
注释32
第5章 参数模型和指数族34
5.1 单变量族34
5.2 多元正态分布36
5.3 多参数分布族的Fisher信息量边界38
5.4 多项分布39
5.5 指数型分布族41
5.6 注释与细节44
注释44
第二部分 计算机时代早期方法
第6章 经验贝叶斯48
6.1 Robbins公式48
6.2 物种遗漏问题50
6.3 一个医学上的例子54
6.4 间接证据156
6.5 注释与细节57
注释57
第7章 James-Stein估计和岭回归59
7.1 James-Stein估计59
7.2 棒球运动员61
7.3 岭回归63
7.4 间接证据266
7.5 注释和细节68
注释68
第8章 广义线性模型与回归树70
8.1 逻辑回归70
8.2 广义线性模型75
8.3 泊松回归78
8.4 回归树80
8.5 注释与细节82
注释83
第9章 生存分析和EM算法85
9.1 生命表和风险率85
9.2 删失数据和Kaplan-Meier估计87
9.3 对数秩检验91
9.4 比例风险模型93
9.5 缺失数据和EM算法95
9.6 注释与细节98
注释98
第10章 刀切法与自助法101
10.1 标准差的刀切法估计101
10.2 非参数的自助法103
10.3 重抽样方案106
10.4 参数自助法110
10.5 影响函数与鲁棒估计112
10.6 注释与细节115
注释115
第11章 自助法置信区间117
11.1 Neyman的单参数问题的构建117
11.2 百分位方法120
11.3 偏差校正置信区间122
11.4 二阶精度124
11.5 自助t区间126
11.6 目标贝叶斯区间和置信分布127
11.7 注释与细节131
注释131
第12章 交叉验证与预测误差的Cp估计134
12.1 预测规则134
12.2 交叉验证137
12.3 协方差惩罚140
12.4 训练、验证与短期预测因子146
12.5 注释与细节148
注释148
第13章 客观贝叶斯推断和马尔可夫链蒙特卡罗方法150
13.1 客观先验分布150
13.2 共轭先验分布152
13.3 模型选择与贝叶斯信息准则156
13.4 Gibbs抽样和MCMC161
13.5 示例:模拟人口混合165
13.6 注释与细节167
注释167
第14章 战后时代的统计推断与方法论169
注释171
第三部分 21世纪的话题
第15章 大规模假设检验和错误发现率174
15.1 大规模假设检验174
15.2 错误发现率176
15.3 经验贝叶斯大规模假设检验178
15.4 局部错误发现率181
15.5 原假设分布的选择183
15.6 关联性186
15.7 注释与细节188
注释188
第16章 稀疏建模和套索191
16.1 前向逐步回归191
16.2 套索194
16.3 拟合套索模型197
16.4 最小角回归198
16.5 拟合广义的套索模型200
16.6 套索的选择后推断202
16.7 联系和扩展203
16.8 注释与细节205
注释205
第17章 随机森林和提升207
17.1 随机森林207
17.2 平方误差损失的提升212
17.3 梯度提升216
17.4 Adaboost:原始的提升算法218
17.5 联系和扩展220
17.6 注释与细节221
注释222
第18章 神经网络与深度学习224
18.1 神经网络与手写数字问题225
18.2 拟合一个网络226
18.3 自动编码器230
18.4 深度学习231
18.5 学习一个深层网络234
18.6 注释与细节235
注释236
第19章 支持向量机和核方法238
19.1 最优超平面238
19.2 软间隔分类器240
19.3 作为损失加惩罚的支持向量机准则241
19.4 计算以及核技巧242
19.5 利用核的函数拟合244
19.6 实例:用于蛋白质分类的字符串核函数244
19.7 支持向量机:结束语245
19.8 核平滑和局部回归246
19.9 注释与细节247
注释248
第20章 模型选择后的推断250
20.1 同时置信区间251
20.2 模型选择后的准确率255
20.3 选择的偏差258
20.4 贝叶斯频率学组合估计260
20.5 注释与细节263
注释264
第21章 经验贝叶斯估计策略266
21.1 贝叶斯反卷积266
21.2 g-建模和估计267
21.3 似然、正则化和准确性269
21.4 两个例子272
21.5 广义线性混合模型276
21.6 反卷积和f-建模278
21.7 注释与细节280
注释280
后记282
参考文献286