R语言 实用数据分析和可视化技术 (原书第2版)
作者:(美)贾里德 P.兰德(Jared P.Lander) 著 曾益强 译
出版时间: 2019年版
内容简介
本书借鉴数据科学家Jared P Lander在R语言上丰富的教学经验,通过大量实例,详细讲解R语言的核心功能。对于刚接触统计程序和模型的人,本书的内容组织结构使得学习R语言相当简单和直观。本书主要介绍R语言中20%的核心功能,但是这20%的功能足以让你解决80%的现代数据分析。 \n \n书中每一章都是从基础知识开始,提供大量的实例和代码。你将学习下载和安装R语言;设置和使用R语言环境;掌握基本的程序编写,数据导入、操作和可视化;完成几个测验。然后在此基础上,你将构建几个完整的模型,包括线性和非线性模型,学习数据挖掘技术。接着你将在代码中学习使用LaTeX,RMarkdown和Shiny等R语言包。
目录
译者序
\n
\n
序
\n
\n
前言
\n
\n
致谢
\n
\n
第1章 获取R语言 1
\n
\n
11 下载R语言 1
\n
\n
12 R语言版本 2
\n
\n
13 32位与64位 2
\n
\n
14 安装R语言 2
\n
\n
141 在Windows系统上安装 2
\n
\n
142 在Mac OS X系统上安装 5
\n
\n
143 在Linux系统上安装 8
\n
\n
15 微软开源R语言 10
\n
\n
16 小结 10
\n
\n
第2章 R语言环境 11
\n
\n
21 命令行界面 12
\n
\n
22 RStudio 13
\n
\n
221 RStudio项目 14
\n
\n
222 RStudio工具 16
\n
\n
223 Git集成 20
\n
\n
23 微软Visual Studio 22
\n
\n
24 小结 22
\n
\n
第3章 R语言包 23
\n
\n
31 安装R语言包 23
\n
\n
32 加载R语言包 25
\n
\n
33 构建R语言包 26
\n
\n
34 小结 26
\n
\n
第4章 R语言基础 27
\n
\n
41 基本数学运算 27
\n
\n
42 变量 28
\n
\n
421 变量赋值 28
\n
\n
422 删除变量 29
\n
\n
43 数据类型 30
\n
\n
431 数值型 30
\n
\n
432 字符型 31
\n
\n
433 日期型 32
\n
\n
434 逻辑型 32
\n
\n
44 向量 34
\n
\n
441 向量操作 34
\n
\n
442 factor向量 37
\n
\n
45 函数调用 38
\n
\n
46 函数文档 38
\n
\n
47 缺失数据 39
\n
\n
471 NA 39
\n
\n
472 NULL 40
\n
\n
48 管道 40
\n
\n
49 小结 41
\n
\n
第5章 高级数据结构 42
\n
\n
51 数据框 42
\n
\n
52 列表 48
\n
\n
53 矩阵 53
\n
\n
54 数组 56
\n
\n
55 小结 56
\n
\n
第6章 R语言读取数据 57
\n
\n
61 读取CSV文件 57
\n
\n
611 read_delim函数 59
\n
\n
612 fread函数 60
\n
\n
62 读取Excel数据 60
\n
\n
63 读取数据库数据 62
\n
\n
64 读取其他统计工具的数据 64
\n
\n
65 读取R语言二进制文件 65
\n
\n
66 读取R语言数据 67
\n
\n
67 读取网页数据 68
\n
\n
671 读取HTML表格 68
\n
\n
672 抽取网页数据 69
\n
\n
68 读取JSON数据 70
\n
\n
69 小结 72
\n
\n
第7章 统计图 73
\n
\n
71 基础统计图 73
\n
\n
711 基础直方图 74
\n
\n
712 基础散点图 74
\n
\n
713 箱线图 75
\n
\n
72 ggplot2 75
\n
\n
721 ggplot2:直方图和核密度曲线 76
\n
\n
722 ggplot2:散点图 77
\n
\n
723 ggplot2:箱线图和小提琴图 79
\n
\n
724 ggplot2:曲线图 82
\n
\n
725 主题 83
\n
\n
73 小结 84
\n
\n
第8章 编写R语言函数 85
\n
\n
81 Hello,World! 85
\n
\n
82 函数参数 86
\n
\n
821 默认参数 87
\n
\n
822 额外参数 87
\n
\n
83 返回值 88
\n
\n
84 docall函数 89
\n
\n
85 小结 89
\n
\n
第9章 控制语句 90
\n
\n
91 if和else语句 90
\n
\n
92 switch语句 92
\n
\n
93 ifelse函数 94
\n
\n
94 复合检查 95
\n
\n
95 小结 95
\n
\n
第10章 R语言的循环迭代 96
\n
\n
101 for循环 96
\n
\n
102 while循环 97
\n
\n
103 控制循环 98
\n
\n
104 小结 99
\n
\n
第11章 分组操作 100
\n
\n
111 apply函数族 100
\n
\n
1111 apply函数 100
\n
\n
1112 lapply和sapply函数 101
\n
\n
1113 mapply函数 102
\n
\n
1114 其他的apply函数 102
\n
\n
112 aggregate函数 103
\n
\n
113 plyr包 105
\n
\n
1131 ddply函数 106
\n
\n
1132 llply函数 108
\n
\n
1133 plyr的辅助函数 109
\n
\n
1134 速度与便利性 109
\n
\n
114 datatable包 109
\n
\n
1141 键值 113
\n
\n
1142 datatable聚合 115
\n
\n
115 小结 117
\n
\n
第12章 高效的分组操作:dplyr 118
\n
\n
121 管道 118
\n
\n
122 tbl数据类型 119
\n
\n
123 select函数 120
\n
\n
124 f?ilter函数 127
\n
\n
125 slice函数 131
\n
\n
126 mutate函数 132
\n
\n
127 summarize函数 135
\n
\n
128 group_by函数 136
\n
\n
129 arrange函数 137
\n
\n
1210 do函数 137
\n
\n
1211 dplyr使用数据库 139
\n
\n
1212 小结 140
\n
\n
第13章 数据迭代 141
\n
\n
131 map函数 141
\n
\n
132 特定类型的map函数 143
\n
\n
1321 map_int函数 144
\n
\n
1322 map_dbl函数 144
\n
\n
1323 map_chr函数 144
\n
\n
1324 map_lgl函数 145
\n
\n
1325 map_df函数 145
\n
\n
1326 map_if函数 146
\n
\n
133 数据框的迭代 147
\n
\n
134 map函数的多输入 148
\n
\n
135 小结 149
\n
\n
第14章 数据整理 150
\n
\n
141 cbind和rbind 150
\n
\n
142 连接 151
\n
\n
1421 合并 152
\n
\n
1422 plyr中的join 152
\n
\n
1423 合并表 156
\n
\n
143 reshape2 157
\n
\n
1431 melt函数 157
\n
\n
1432 dcast函数 159
\n
\n
144 小结 160
\n
\n
第15章 数据重构:Tidyverse 161
\n
\n
151 合并行和列数据 161
\n
\n
152 用dplyr包连接 162
\n
\n
153 行列变换 166
\n
\n
154 小结 169
\n
\n
第16章 字符串操作 170
\n
\n
161 paste 170
\n
\n
162 把格式数据写成串(sprintf) 171
\n
\n
163 提取文本 172
\n
\n
164 正则表达式 175
\n
\n
165 小结 181
\n
\n
第17章 概率分布 182
\n
\n
171 正态分布 182
\n
\n
172 二项分布 186
\n
\n
173 泊松分布 190
\n
\n
174 其他分布 192
\n
\n
175 小结 194
\n
\n
第18章 基本统计 195
\n
\n
181 概括性统计量 195
\n
\n
182 相关系数和协方差 198
\n
\n
183 t-检验 205
\n
\n
1831 单样本t-检验 206
\n
\n
1832 两样本t-检验 208
\n
\n
1833 两配对样本t-检验 210
\n
\n
184 方差分析 211
\n
\n
185 小结 213
\n
\n
第19章 线性模型 214
\n
\n
191 简单线性回归 214
\n
\n
192 多元回归 219
\n
\n
193 小结 234
\n
\n
第20章 广义线性模型 235
\n
\n
201 逻辑斯蒂回归 235
\n
\n
202 泊松回归 238
\n
\n
203 其他的广义线性模型 241
\n
\n
204 生存分析 242
\n
\n
205 小结 246
\n
\n
第21章 模型诊断 247
\n
\n
211 残差 247
\n
\n
212 模型比较 252
\n
\n
213 交叉验证 255
\n
\n
214 Bootstrap 259
\n
\n
215 逐步变量选择 262
\n
\n
216 小结 264
\n
\n
第22章 正则化和压缩 265
\n
\n
221 弹性网络 265
\n
\n
222 贝叶斯压缩 279
\n
\n
223 小结 282
\n
\n
第23章 非线性模型 283
\n
\n
231 非线性最小二乘法 283
\n
\n
232 样条插值 285
\n
\n
233 广义相加模型 288
\n
\n
234 决策树 293
\n
\n
235 boost树 295
\n
\n
236 随机森林 298
\n
\n
237 小结 299
\n
\n
第24章 时间序列和自相关 301
\n
\n
241 自回归移动平均模型 301
\n
\n
242 向量自回归 306
\n
\n
243 广义自回归异方差模型 311
\n
\n
244 小结 317
\n
\n
第25章 聚类 318
\n
\n
251 k-均值 318
\n
\n
252 PAM 325
\n
\n
253 分层聚类 329
\n
\n
254 小结 332
\n
\n
第26章 模型拟合调优:caret 333
\n
\n
261 caret介绍 333
\n
\n
262 caret选项 333
\n
\n
2621 caret训练控制 334
\n
\n
2622 caret网格搜索 334
\n
\n
263 boost树调优 335
\n
\n
264 小结 338
\n
\n
第27章 可重复性报告:knitr 339
\n
\n
271 安装LaTeX 339
\n
\n
272 LaTeX基础 340
\n
\n
273 knitr中使用LaTeX 342
\n
\n
274 小结 346
\n
\n
第28章 R语言文档:RMarkdown 347
\n
\n
281 文档编译 347
\n
\n
282 文档头信息 347
\n
\n
283 Markdown入门 348
\n
\n
284 Markdown代码块 350
\n
\n
285 htmlwidgets 351
\n
\n
2851 表数据 352
\n
\n
2852 leaflet 354
\n
\n
2853 dygraphs 356
\n
\n
2854 threejs 358
\n
\n
2855 d3heatmap 360
\n
\n
286 RMarkdown幻灯片 361
\n
\n
287 小结 362
\n
\n
第29章 交互式dashboard:Shiny 363
\n
\n
291 在RMarkdown中使用Shiny 363
\n
\n
292 Shiny中的响应表达式 366
\n
\n
293 服务端和UI界面 368
\n
\n
294 小结 376
\n
\n
第30章 构建R包 377
\n
\n
301 目录结构 377
\n
\n
302 包文件 378
\n
\n
3021 DESCRIPTION文件 378
\n
\n
3022 NAMESPACE文件 380
\n
\n
3023 其他包文件 382
\n
\n
303 包文档 384
\n
\n
304 测试 386
\n
\n
305 包的检查、构建和安装 388
\n
\n
306 提交至CRAN 389
\n
\n
307 C++代码 390
\n
\n
3071 sourceCpp 390
\n
\n
3072 编译包 392
\n
\n
308 小结 394
\n
\n
附录A 相关资源 395
\n