O'Reilly精品图书系列 R语言经典实例(原书第2版)
作者: (美)J.D.隆(J.D. Long),(美)保罗 蒂特Paul Teetor) 著 李洪成.潘文捷 译
出版时间:2020年版
内容简介
本书通过275个应用实例,阐明了如何用R快速、有效地进行数据分析。主要内容包括软件安装和帮助、基础知识、软件导览、输入与输出、数据结构、数据转换、字符串和日期、统计概论、图形、线性回归和方差分析、实用技巧、高级数值分析和统计方法、时间序列分析等。R语言功能强大,可以帮你处理一切统计工作,但是其结构却不容易掌握,本书通过简洁的、面向任务的实例,可以帮助读者快速利用R解决实际问题。
目录
前言1
第1章 R入门和获得帮助9
1.1 下载和安装R软件10
1.2 安装RStudio12
1.3 开始运行RStudio13
1.4 输入R命令14
1.5 退出RStudio16
1.6 中断R正在运行的程序17
1.7 查看帮助文档18
1.8 获取函数的帮助文档20
1.9 搜索帮助文档22
1.10 查看R添加包帮助信息23
1.11 通过网络获取帮助24
1.12 寻找相关函数与添加包27
1.13 搜索邮件列表28
1.14 向Stack Overflow或社区的其他网站提交问题29
第2章 基础知识32
2.1 在屏幕上显示内容32
2.2 设定变量34
2.3 列出所有变量35
2.4 删除变量37
2.5 生成向量38
2.6 计算基本统计量40
2.7 生成数列42
2.8 向量比较44
2.9 选取向量中的元素45
2.10 向量的计算48
2.11 运算符优先级问题50
2.12 减少输入,得到更多命令52
2.13 创建函数调用的管道53
2.14 避免常见错误56
第3章 R软件导览61
3.1 获取和设定工作目录61
3.2 创建一个新的RStudio项目62
3.3 保存工作空间64
3.4 查看历史命令记录65
3.5 保存先前命令产生的结果66
3.6 通过搜索路径显示已加载的软件包67
3.7 查看已安装的R包列表68
3.8 使用R包中的函数69
3.9 使用R的内置数据集71
3.10 从CRAN网站安装R包72
3.11 从GitHub网站安装R包74
3.12 设定或改变默认CRAN网站镜像75
3.13 运行脚本76
3.14 批量运行R代码77
3.15 找到R的主目录80
3.16 R的自定义81
3.17 在云端使用R和RStudio84
第4章 输入与输出86
4.1 使用键盘输入数据86
4.2 显示更少的位数(或更多的位数)87
4.3 将输出结果重定向到文件89
4.4 显示文件列表90
4.5 解决无法在Windows中打开文件的问题92
4.6 读取固定宽度的数据记录93
4.7 读取表格数据文件96
4.8 读取CSV文件99
4.9 写入CSV文件101
4.10 从网络中读取表格或CSV格式数据103
4.11 从Excel文件读取数据104
4.12 将数据框写入Excel文件105
4.13 从SAS文件读取数据108
4.14 读取HTML表格数据109
4.15 读取复杂格式数据文件112
4.16 读取MySQL数据库中的数据116
4.17 通过dbplyr访问数据库118
4.18 保存和传送对象120
第5章 数据结构123
5.1 对向量添加数据131
5.2 在向量中插入数据132
5.3 理解循环规则133
5.4 构建因子134
5.5 将多个向量合并成单个向量以及一个平行因子136
5.6 创建列表137
5.7 根据位置选定列表元素139
5.8 根据名称选定列表元素141
5.9 构建一个名称/值关联表142
5.10 从列表中移除元素144
5.11 将列表转换为向量145
5.12 从列表中移除空值元素146
5.13 使用条件来移除列表元素147
5.14 矩阵初始化149
5.15 执行矩阵运算150
5.16 将描述性名称赋给矩阵的行和列151
5.17 从矩阵中选定一行或一列152
5.18 用列数据初始化数据框153
5.19 用行数据初始化数据框155
5.20 对数据框添加行157
5.21 根据位置选择数据框的列159
5.22 根据名称选择数据框的列163
5.23 修改数据框的列名165
5.24 从数据框中移除NA值166
5.25 根据名称排除列167
5.26 合并两个数据框168
5.27 根据共有列合并数据框169
5.28 基本数据类型之间的转换171
5.29 从一种结构化数据类型转换到另一种数据类型172
第6章 数据转换175
6.1 将函数应用于列表的每个元素175
6.2 将函数应用于数据框的每一行178
6.3 将函数应用于矩阵的每一行179
6.4 将函数应用于每一列180
6.5 将函数应用于平行向量或列表182
6.6 将函数应用于一组数据184
6.7 基于条件生成一个新列185
第7章 字符串和日期187
7.1 获取字符串长度189
7.2 连接字符串190
7.3 提取子串191
7.4 根据分隔符分割字符串192
7.5 替代子串193
7.6 生成字符串的所有成对组合194
7.7 得到当前日期196
7.8 转换字符串为日期196
7.9 转换日期为字符串197
7.10 转换年、月、日为日期198
7.11 得到儒略日期200
7.12 提取日期的一部分200
7.13 创建日期序列202
第8章 概率204
8.1 计算组合数206
8.2 生成组合206
8.3 生成随机数207
8.4 生成可再生的随机数209
8.5 生成随机样本210
8.6 生成随机序列212
8.7 随机排列向量213
8.8 计算离散分布的概率213
8.9 计算连续分布的概率215
8.10 转换概率为分位数216
8.11 绘制密度函数218
第9章 统计概论222
9.1 数据的汇总224
9.2 计算相对频数226
9.3 因子数据的表格和列联表创建227
9.4 检验分类变量独立性228
9.5 计算数据集的百分位数(和四分位数)229
9.6 求分位数的逆230
9.7 数据转换为z分数231
9.8 检验样本均值(t检验)232
9.9 均值的置信区间233
9.10 中位数的置信区间234
9.11 检验样本比例235
9.12 比例的置信区间236
9.13 检验正态性237
9.14 游程检验239
9.15 比较两个样本的均值240
9.16 比较两个非参数样本的位置242
9.17 检验相关系数的显著性243
9.18 检验组的等比例244
9.19 组均值间成对比较246
9.20 检验两样本的相同分布247
第10章 图形249
10.1 创建散点图252
10.2 添加标题和标签254
10.3 添加(或去除)网格255
10.4 给ggplot图形添加主题258
10.5 创建多组散点图262
10.6 添加(或去除)图例263
10.7 绘制散点图