大数据应用与技术丛书 R数据加工与分析呈现宝典
作者:王军责任编辑 蒲成译 (美国)乔纳森 卡罗尔
出版时间:2019年版
丛编项: 大数据应用与技术丛书
内容简介
电子表格是胜任许多任务的强大工具,不过在需要解释、审查和呈现数据的情况下,使用它们就会显得有些力不从心。这是R编程的优势所在。R编程语言为正确处理所有类型的数据提供了一种舒适的环境,并且在开源的RStudio开发套件中,只要用鼠标键盘就可以简化复杂的操作,还可以为分析和报告创建可重现的处理过程。《R数据加工与分析呈现宝典/大数据应用与技术丛书》将讲解如何使用R和RStudio从原始数据中提取有意义的信息。每一章精心编写的内容都涵盖了一种整理数据的独特方式,从理解个别值到与复杂数据集合进行交互,其中还包括如何从网络上抓取数据。《R数据加工与分析呈现宝典/大数据应用与技术丛书》还阐释了类似循环和条件的简单编程技术,以便让读者可以创建自定义函数。在阅读完《R数据加工与分析呈现宝典/大数据应用与技术丛书》之后,读者将掌握分析和可视化各类数据的多种策略。主要内容如何使用R和RStudio开始编程理解和实现重要的R结构与运算符安装和使用R包对数据进行整洁化、提炼和绘制处理读者对象:如果读者拥有在Excel中编写公式的经验,那么学习《R数据加工与分析呈现宝典/大数据应用与技术丛书》可谓驾轻就熟!
目录
第1章 数据与R语言介绍
1.1 什么是数据、数据在哪里以及如何处理数据
1.1.1 什么是数据
1.1.2 将周围的一切都视为数据源
1.1.3 数据再加工
1.1.4 使用处理得当的数据可以做些什么
1.1.5 数据就是资产
1.1.6 可重复的研究和版本控制
1.2 R语言介绍
1.2.1 R的起源
1.2.2 R能够以及不能完成哪些工作
1.3 R的运行机制
1.4 RStudio介绍
1.4.1 在RStudio中使用R
1.4.2 内置插件包(数据和函数)
1.4.3 内置文档
1.4.4 简介
1.5 亲自尝试
1.6 专业术语
1.7 本章小结
第2章 了解R数据类型
2.1 数据类型
2.1.1 数字
2.1.2 文本(字符串)
2.1.3 类别(因子)
2.1.4 日期和时间
2.1.5 逻辑值
2.1.6 缺失值
2.2 存储值(赋值)
2.2.1 命名数据(变量)
2.2.2 固定不变的数据
2.2.3 赋值运算符(<-与=的对比)
2.3 指定数据类型
2.4 告知R忽略某些内容
2.5 亲自尝试
2.6 专业术语
2.7 本章小结
第3章 生成新数据值
3.1 基础数学算法
3.2 运算符优先顺序
3.3 字符串串联(连接)
3.4 比较
3.5 自动转换(强制)
3.6 亲自尝试
3.7 专业术语
3.8 本章小结
第4章 理解将要使用的工具:函数
4.1 函数
4.1.1 表象之下
4.1.2 函数模板
4.1.3 参数
4.1.4 多个参数
4.1.5 默认参数
4.1.6 参数名称匹配
4.1.7 部分匹配
4.1.8 作用域
4.2 插件包
4.2.1 安装插件包
4.2.2 R如何获知这个函数
4.2.3 名称空间
4.3 消息、警告和错误
4.3.1 创建消息、警告和错误
4.3.2 诊断消息、警告和错误
4.4 测试
4.5 项目:泛化一个函数
4.6 亲自尝试
4.7 专业术语
4.8 本章小结
第5章 组合数据值
5.1 简单集合
5.1.1 强制转换
5.1.2 缺失值
5.1.3 属性
5.1.4 名称
5.2 序列
5.2.1 向量函数
5.2.2 向量数学运算
5.3 矩阵
5.4 列表
5.5 data.frame
5.6 class属性
5.6.1 tibble类
5.6.2 将结构用作函数参数
5.7 亲自尝试
5.8 专业术语
5.9 本章小结
第6章 选取数据值
6.1 文本处理
6.1.1 文本匹配
6.1.2 子字符串
6.1.3 文本替换
6.1.4 正则表达式
6.2 从结构中选取组成部分
6.2.1 向量
6.2.2 列表
6.2.3 矩阵
6.3 值的替换
6.4 data.frame和dplyr
6.4.1 dplyr动词
6.4.2 非标准计算
6.4.3 管道
6.4.4 以困难方式对data.frame取子集
6.5 替换NA
6.6 条件式选取
6.7 汇总值
6.8 一个行之有效的示例:Excel与R的对比
6.9 亲自尝试
6.10 专业术语
6.11 本章小结
第7章 对大量数据进行处理
7.1 整洁数据原则
7.1.1 工作目录
……
第8章 根据条件进行处理:控制结构
第9章 数据可视化:绘图
第10章 借助扩展插件包对数据进行更多的处理
附录A 安装R
附录B 安装RStudio
附录C baseR中的图形