R语言统计分析与应用
作者:汪海波
出版时间: 2018年版
内容简介
R统计软件是目前应用* 广泛的统计软件之一,已广泛应用于医学、财经和社会科学等领域中进行数据管理和数据分析处理。本书以Windows操作系统下的R软件为基础,以实践中常用的统计分析方法为基本内容,介绍了R语言的编写以及结果解释。本书重点介绍了各种多元统计分析方法的基本原理及其应用,包括方差分析、多元线性回归、Logistic回归分析、生存分析、主成分分析、因子分析、聚类分析、判别分析以及典型相关分析等。每一章详细讨论了统计分析方法的基本原理和分析过程,介绍了R语言的使用方法及应用实例说明、结果解释及结论分析等。
目录
* 一篇 R基础与入门篇
* 1章 R入门 2
1.1 R简介 2
1.1.1 R特点 2
1.1.2 R支持资料 3
1.2 R的获取、安装和启动 4
1.2.1 R的获取 4
1.2.2 R的安装 5
1.2.3 R的启动 7
1.3 R菜单操作 7
1.4 工作空间 10
1.5 程序包 11
1.5.1 什么是程序包 11
1.5.2 安装程序包 11
1.6 R使用以及图形界面 12
1.7 本章小结 13
* 2章 R编程入门 14
2.1 R语言 14
2.1.1 数据集的概念 14
2.1.2 R运算符 21
2.2 R常用函数及其应用 23
2.2.1 数学函数 24
2.2.2 样本统计函数 26
2.2.3 概率函数 27
2.2.4 字符处理函数 28
2.2.5 其他实用函数 30
2.3 数据的输入 31
2.3.1 使用键盘输入数据 31
2.3.2 数据集的导入 32
2.4 本章小结 34
第3章 基本数据管理 35
3.1 创建新变量 36
3.2 向量运算 37
3.2.1 添加或删除向量元素 37
3.2.2 向量运算和逻辑运算 37
3.2.3 用∶运算符创建向量 37
3.2.4 使用seq()函数创建向量 38
3.3 处理数据对象的实用函数 38
3.4 变量的重编码 39
3.5 变量的重命名 40
3.6 缺失值 41
3.7 日期值 42
3.8 类型转换 44
3.9 数据排序 45
3.10 数据集的合并 45
3.11 数据集取子集 46
3.11.1 选入观测 46
3.11.2 选入变量 47
3.11.3 剔除变量 48
3.11.4 subset()函数 49
3.12 本章小结 49
第4章 样本量和检验效能估计 50
4.1 样本量估算以及R程序包 50
4.1.1 样本量影响因素 50
4.1.2 检验效能分析pwr包 52
4.2 t检验 53
4.2.1 单样本与已知总体检验时样本
量的估计及R程序 53
4.2.2 两总体均数比较样本量的估计
及R程序 54
4.2.3 配对设计两样本均数比较样本
量的估计及R程序 55
4.3 方差分析 56
4.4 相关分析 57
4.5 线性模型 58
4.6 分类资料的样本量估计 59
4.6.1 单样本与已知总体检验时样
本量的估计及R程序 59
4.6.2 两样本率比较样本量的估计及
R程序 60
4.6.3 配对设计总体率比较样本量的
估计及R程序 61
4.7 本章小结 62
第5章 高 级数据管理 63
5.1 控制语句 63
5.1.1 重复和循环 63
5.1.2 条件执行 65
5.2 数据处理综合实例 67
5.3 转置与整合 70
5.3.1 转置 70
5.3.2 整合数据 71
5.4 本章小结 72
* 二篇 统计方法与R分析实例
第6章 定量资料的统计描述 74
6.1 统计描述基础理论知识 74
6.1.1 集中趋势描述 75
6.1.2 离散趋势描述 77
6.1.3 正态分布 79
6.2 统计描述分析实例 81
6.2.1 summary()函数分析实例 81
6.2.2 sapply()函数分析实例 83
6.2.3 describe()函数分析实例 85
6.2.4 stat.desc()函数分析实例 89
6.2.5 分组计算描述性统计量 91
6.2.6 对数正态分布资料的统计
描述 94
6.3 本章小结 95
第7章 t检验 96
7.1 单样本t检验 96
7.1.1 单样本t检验的基础理论 96
7.1.2 单样本t检验分析实例 97
7.1.3 无原始数据的单样本t检验R
程序 98
7.2 配对设计资料的t检验 98
7.2.1 配对设计资料t检验的基础
理论 98
7.2.2 配对t检验实例 100
7.2.3 无原始数据的配对设计的
t检验分析实例 102
7.3 两独立样本的t检验 103
7.3.1 两独立样本t检验的基础
理论 103
7.3.2 独立样本t检验分析
实例 105
7.3.3 无原始数据的两独立样本
t检验分析实例 107
7.4 本章小结 107
第8章 方差分析 108
8.1 方差分析及ANOVA模型拟合概述 108
8.1.1 方差分析的基本思想 108
8.1.2 方差分析基本术语 110
8.1.3 ANOVA模型拟合 111
8.2 完全随机设计资料的方差分析 112
8.2.1 单因子方差分析介绍 113
8.2.2 单因子方差分析的R程序
实例 113
8.3 随机区组设计资料的方差分析 118
8.3.1 随机区组方差分析介绍 119
8.3.2 随机区组方差分析的R程序
实例 121
8.4 拉丁方设计资料的方差分析 126
8.4.1 拉丁方方法介绍 126
8.4.2 拉丁方分析的R程序实例 128
8.5 析因设计资料的方差分析 131
8.5.1 析因设计方法介绍 131
8.5.2 析因方差分析的R程序实例 134
8.6 正交试验设计资料的方差分析 136
8.6.1 正交试验设计方法介绍 136
8.6.2 正交试验设计资料分析的R
程序实例 138
8.7 重复测量资料的方差分析 139
8.7.1 重复测量设计方法介绍 140
8.7.2 重复测量资料分析的R
程序实例 141
8.8 协方差分析 144
8.8.1 协方差分析方法介绍 144
8.8.2 协方差分析的R程序实例 145
8.9 本章小结 148
第9章 直线回归与相关 149
9.1 直线相关分析 149
9.1.1 直线相关分析介绍 149
9.1.2 直线相关分析的R实例 151
9.2 直线回归分析 154
9.2.1 直线回归分析介绍 155
9.2.2 直线回归分析的R程序实例 157
9.3 本章小结 162
* 10章 多元线性回归与相关 163
10.1 多元线性回归与相关的基础理论 163
10.1.1 多元线性回归 163
10.1.2 复相关系数与偏相关系数 176
10.2 分析实例 178
10.2.1 多元线性回归方程的建立 178
10.2.2 复相关系数与偏相关系数的
R程序实例 183
10.3 本章小结 185
* 11章 Logistic回归分析 186
11.1 非条件Logistic回归 186
11.1.1 非条件Logistic回归介绍 187
11.1.2 非条件Logistic回归模型的
建立和检验 188
11.1.3 非条件Logistic回归的R
程序 190
11.2 条件Logistic回归 205
11.2.1 条件Logistic回归介绍 205
11.2.2 条件Logistic回归的R
程序 206
11.3 本章小结 207
* 12章 相对数 208
12.1 相对数简介 208
12.1.1 率的标准化 210
12.1.2 率的假设检验 212
12.2 R分析实例 214
12.2.1 率的标准化R程序 214
12.2.2 率的Z(U)检验的R
程序 215
12.3 本章小结 216
* 13章 行×列表分析 217
13.1 四格表资料 217
13.1.1 四格表卡方检验介绍 218
13.1.2 四格表卡方检验的R
程序 220
13.2 配对计数资料的卡方检验 224
13.2.1 四格表配对卡方检验介绍 224
13.2.2 四格表配对卡方检验的R
程序 225
13.3 列变量为顺序变量的行均分检验 226
13.3.1 行均分检验介绍 227
13.3.2 行均分检验的R程序 227
13.4 行列均为顺序变量的相关检验 230
13.4.1 行列均为顺序变量的相关
检验介绍 230
13.4.2 行列均为顺序变量的相关
检验的R程序 231
13.5 分层行列表的分析 235
13.5.1 分层行列表的分析简介 235
13.5.2 分层行列表的分析的R
程序 236
13.6 趋势卡方检验 239
13.6.1 趋势卡方检验简介 239
13.6.2 趋势卡方检验的R程序 239
13.7 卡方分割与卡方合并 241
13.7.1 卡方的分割与合并简介 241
13.7.2 卡方分割与卡方合并分析
实例 241
13.8 本章小结 243
* 14章 非参数统计 244
14.1 单样本资料与已知总体参数的非
参数检验 245
14.1.1 单组资料的符号及符号秩和
检验 245
14.1.2 单组资料的非参数检验R
程序 247
14.2 配对设计资料的非参数检验 248
14.2.1 配对设计资料的符号及符号
秩和检验 248
14.2.2 配对设计资料的非参数检验
R程序 249
14.3 两组定量资料的非参数检验 250
14.3.1 两组定量资料的非参数检验
方法概述 251
14.3.2 两组定量资料非参数检验的
R程序 252
14.4 多组定量资料的非参数检验 253
14.4.1 多组定量资料的非参数检验
方法概述 253
14.4.2 多组定量资料非参数检验的
R程序 255
14.5 等级分组资料的非参数检验 260
14.5.1 等级分组资料的非参数检验
方法概述 260
14.5.2 等级分组资料非参数检验的
R程序 261
14.6 随机区组资料的非参数检验 264
14.6.1 随机区组资料的非参数检验
方法概述 264
14.6.2 随机区组资料非参数检验的
R程序 265
14.7 等级相关(秩相关) 266
14.7.1 秩相关概述 266
14.7.2 spearman秩相关的R程序 267
14.8 本章小结 268
* 15章 生存分析 269
15.1 生存分析简介 269
15.1.1 生存数据 269
15.1.2 生存时间函数 270
15.1.3 均数、中位数和半数
生存期 271
15.1.4 生存分析的基本方法 271
15.2 生存曲线 272
15.2.1 寿命表法及R分析实例 273
15.2.2 乘积极限法(Kaplan-Meier)及
R分析实例 278
15.2.3 Cox回归及R分析实例 280
15.3 本章小结 285
* 16章 主成分分析 286
16.1 主成分分析简介 287
16.1.1 主成分分析的数学模型 287
16.1.2 主成分分析的方法步骤 288
16.1.3 主成分分析的应用 290
16.2 R中的主成分分析实例 291
16.3 本章小结 307
* 17章 因子分析 308
17.1 因子分析简介 308
17.2 主成分分析与因子分析比较 317
17.3 因子分析及R实例 318
17.4 本章小结 337
* 18章 聚类分析 338
18.1 聚类分析简介 338
18.2 聚类分析及R实例 344
18.2.1 varclus ()函数 344
18.2.2 kmean()函数 348
18.2.3 hclust()函数实例 352
18.3 本章小结 355
* 19章 判别分析 356
19.1 判别分析简介 357
19.2 判别分析及R实例 362
19.3 本章小结 386
* 20章 典型相关分析 388
20.1 典型相关简介 388
20.1.1 典型相关分析的理论架构及
基本假设 390
20.1.2 冗余分析 391
20.1.3 典型相关系数的假设检验 392
20.2 cancor()函数实例 392
20.3 本章小结 400
* 21章 诊断试验的ROC分析 401
21.1 诊断试验简介 401
21.1.1 诊断试验介绍 401
21.1.2 诊断试验评价指标 402
21.1.3 ROC分析资料收集与整理 404
21.1.4 ROC曲线构建 405
21.2 ROC分析及R分析实例 406
21.3 本章小结 423
* 22章 统计图 425
22.1 条形图 425
22.2 饼图 429
22.3 散点图 431
22.4 折线图 433
22.5 箱线图 434
22.6 直方图 437
22.7 核密度图 442
22.8 点图 442
22.9 本章小结 444
参考文献 445