欢迎访问学兔兔,学习、交流 分享 !

返回首页 |

数据科学与工程技术丛书 数据科学之编程技术 使用R进行数据清理、分析与可视化 [美] 迈克尔 弗里曼,乔尔 罗斯 著,张燕妮 译 2019年版

收藏
  • 大小:124.07 MB
  • 语言:中文版
  • 格式: PDF文档
  • 阅读软件: Adobe Reader
资源简介
数据科学与工程技术丛书 数据科学之编程技术 使用R进行数据清理、分析与可视化
作者:[美] 迈克尔 弗里曼,乔尔 罗斯 著,张燕妮 译
出版时间:2019年版
丛编项: 数据科学与工程技术丛书
内容简介
本书围绕使用R进行数据科学编程所需的实际步骤展开,介绍了有关该主题的工具和技术的整个系统。书中共分为六大部分。第壹部分介绍了如何下载和安装书中涉及的各种软件;第二部分介绍了项目管理的基础技术,包括跟踪代码的版本并生成文档;第三部分介绍了R编程语言,它是整本书使用的主要开发语言;第四部分介绍了如何在R中加载、格式化、遍历和重塑数据;第五部分介绍了数据科学中数据可视化的原则以及如何利用R构建数据可视化;第六部分介绍了如何用两种不同的方法创建交互平台来分享自己的观点,以及如何拓展自己的知识。
目录
译者序

前言
第一部分 开始

第1章 设置计算机
1.1 设置命令行工具
1.1.1 Mac上的命令行
1.1.2 Windows上的命令行
1.1.3 Linux上的命令行
1.2 安装git
1.3 创建GitHub账户
1.4 选择一个文本编辑器
1.4.1 Atom
1.4.2 Visual Studio Code
1.4.3 Sublime Text
1.5 下载R语言
1.6 下载RStudio

第2章 使用命令行
2.1 访问命令行
2.2 浏览文件系统
2.2.1 改变目录
2.2.2 列出文件
2.2.3 路径
2.3 管理文件
2.3.1 学习新命令
2.3.2 通配符
2.4 错误处理
2.5 重定向输出
2.6 网络命令
第二部分 项目管理

第3章 使用git和GitHub进行版本控制
3.1 什么是git
3.1.1 git的核心概念
3.1.2 什么是GitHub
3.2 配置和项目设置
3.2.1 生成一个仓库
3.2.2 检查状态
3.3 跟踪项目变更
3.3.1 添加文件
3.3.2 提交
3.3.3 审核本地git流程
3.4 在GitHub中存储项目
3.4.1 分支和克隆
3.4.2 推送和拉取
3.5 访问项目历史
3.5.1 提交历史
3.5.2 恢复早期版本
3.6 忽略项目中的文件

第4章 使用Markdown制作文档
4.1 编写Markdown
4.1.1 文本格式
4.1.2 文本块
4.1.3 超链接
4.1.4 图像
4.1.5 表格
4.2 渲染Markdown
第三部分 R的基本技能

第5章 R语言
5.1 用R编程
5.2 运行R代码
5.2.1 使用RStudio
5.2.2 从命令行运行R
5.3 注释
5.4 变量定义
5.4.1 基本数据类型
5.5 获取帮助
5.5.1 如何学习R

第6章 函数
6.1 什么是函数
6.1.1 R函数语法
6.2 内置R函数
6.2.1 命名参数
6.3 加载函数
6.4 编写函数
6.4.1 调试函数
6.5 使用条件语句

第7章 向量
7.1 什么是向量
7.1.1 创建向量
7.2 向量化操作
7.2.1 循环
7.2.2 多数为向量
7.2.3 向量化函数
7.3 向量索引
7.3.1 多索引
7.4 向量过滤
7.5 向量修改

第8章 列表
8.1 什么是列表
8.2 创建列表
8.3 访问列表元素
8.4 修改列表
8.4.1 单双括号
8.5 lapply()函数
第四部分 数据清理

第9章 理解数据
9.1 数据生成过程
9.2 查找数据
9.3 数据类型
9.3.1 测量尺度
9.3.2 数据结构
9.4 解释数据
9.4.1 获取领域知识
9.4.2 了解数据模式
9.5 用数据回答问题

第10章 数据框
10.1 什么是数据框
10.2 使用数据框
10.2.1 创建数据框
10.2.2 数据帧的结构
10.2.3 访问数据框
10.3 使用CSV数据
10.3.1 工作目录
10.3.2 因子变量

第11章 使用dplyr操作数据
11.1 操作数据语法
11.2 核心dplyr函数
11.2.1 选择
11.2.2 过滤
11.2.3 修改
11.2.4 排序
11.2.5 汇总
11.3 执行顺序操作
11.3.1 管道操作
11.4 按组分析数据框
11.5 连接数据框
11.6 dplyr实战:分析飞行数据

第12章 使用tidyr重塑数据
12.1 什么是“整洁”数据
12.2 从列到行:gather()
12.3 从行到列:spread()
12.4 tidyr实战:探索教育统计

第13章 访问数据库
13.1 关系数据库概述
13.1.1 什么是关系数据库
13.1.2 建立关系数据库
13.2 体验SQL
13.3 从R访问数据库

第14章 访问Web API
14.1 什么是Web API
14.2 RESTful请求
14.2.1 URI(统一资源标识符)
14.2.2 HTTP动词
14.3 从R访问Web API
14.4 处理JSON数据
14.4.1 解析JSON
14.4.2 展平数据
14.5 API实战:在西雅图寻找古巴食品
第五部分 数据可视化

第15章 设计数据可视化
15.1 可视化的目的
15.2 选择可视化布局
15.2.1 可视化单个变量
15.2.2 可视化多个变量
15.2.3 可视化分层数据
15.3 选择有效的图形编码
15.3.1 有效颜色
15.3.2 利用前注意属性
15.4 数据显示的表达力
15.5 强化美学

第16章 使用ggplot2创建可视化
16.1 图形语法
16.2 使用ggplot2进行基本绘图
16.2.1 指定几何图形
16.2.2 美学映射
16.3 复杂的布局及定制
16.3.1 位置调整
16.3.2 标度样式
16.3.3 坐标系
16.3.4 分面
16.3.5 标签和注释
16.4 构建地图
16.4.1 分级统计(Choropleth)地图
16.4.2 点分布地图
16.5 ggplot2实战:绘制旧金山驱逐地图

第17章 R中的交互式可视化
17.1 plotly包
17.2 rbokeh包
17.3 leaflet 包
17.4 交互式可视化实战:展示西雅图的变化
第六部分 构建和共享应用程序

第18章 使用R Markdown创建动态报告
18.1 设置报告
18.1.1 新建.Rmd文件
18.1.2 编织(Knit)文档
18.2 集成Markdown与R代码
18.2.1 R代码块
18.2.2 内联代码
18.3 在报告中渲染数据与可视化
18.3.1 渲染字符串
18.3.2 渲染Markdown列表
18.3.3 渲染表格
18.3.4 渲染绘图
18.4 以网站形式共享报告
18.5 R Markdown实战:寿命预测报告

第19章 使用Shiny构建交互式Web应用程序
19.1 Shiny框架
19.1.1 Shiny核心概念
19.1.2 程序结构
19.2 设计用户界面
19.2.1 静态内容
19.2.2 动态输入
19.2.3 动态输出
19.2.4 布局
19.3 开发应用程序服务器
19.4 发布Shiny应用程序
19.5 Shiny实战:可视化警察致命射击

第20章 协同工作
20.1 使用分支跟踪代码的不同版本
20.1.1 不同分支
20.1.2 合并分支
20.1.3 合并冲突
20.1.4 GitHub的合并
20.2 使用特性分支开发项目
20.3 使用集中工作流协作
20.3.1 新建一个集中仓库
20.3.2 在集中工作流中使用特性分支
20.4 使用分叉工作流协作

第21章 继续学习
21.1 统计学习
21.1.1 评估关系
21.1.2 预测
21.2 其他编程语言
21.3 道德准则
下载地址