大数据可视化技术
作者:吕云翔
出版时间:2021年版
内容简介
本书分为三部分:基础理论、大数据可视化、大数据可视化工具及应用。基础理论部分包括第1章、第2章。第1章回顾了可视化发展进程,介绍可视化领域的一些基础概念及应用;第2章介绍可视化的一般流程及设计组件。大数据可视化部分包括第3章~第7章,主要介绍了不同类型数据(比例数据、关系数据、文本数据、复杂数据)的可视化方法。大数据可视化工具及应用部分包括第8章~第14章,选取了市场上主流的一些可视化工具,围绕它们的使用方法和应用案例展开。这些工具包括商业软件(Tableau、DataV、FineBI、Excel)、开源包Echarts,以及编程语言R、Python。本书既可以作为高等院校计算机与软件相关专业的教材,也可以作为软件从业人员、计算机爱好者的学习指导用书。
目录
第1部分 基础理论
第1章 数据可视化概述 2
1.1 什么是数据可视化 2
1.2 数据可视化的发展历史 3
1.3 数据可视化的分类 6
1.3.1 科学可视化 6
1.3.2 信息可视化 7
1.3.3 可视化分析学 7
1.4 数据可视化的作用 8
1.4.1 记录信息 8
1.4.2 分析推理 9
1.4.3 信息传播与协同 9
1.5 数据可视化的发展方向 10
习题 11
第2章 数据可视化基础 12
2.1 数据可视化流程 12
2.2 可视化工具和设计原则 13
2.2.1 可视化数据组织与管理工具 13
2.2.2 可视化设计原则 15
习题 16
第2部分 大数据可视化方法
第3章 时间数据可视化 18
3.1 时间数据在大数据中的应用 18
3.2 连续型时间数据可视化 18
3.2.1 阶梯图 19
3.2.2 折线图 19
3.2.3 拟合曲线 20
3.3 离散型时间数据可视化 20
3.3.1 散点图 20
3.3.2 柱形图 21
3.3.3 堆叠柱形图 21
习题 22
第4章 比例数据可视化 23
4.1 比例数据在大数据中的应用 23
4.2 部分与整体 23
4.2.1 饼图 23
4.2.2 环形图 24
4.2.3 比例中的堆叠 24
4.2.4 矩形树图 25
4.3 时空比例数据 26
习题 26
第5章 关系数据可视化 27
5.1 关系数据在大数据中的应用 27
5.2 数据的关联性 27
5.2.1 散点图 27
5.2.2 散点图矩阵 28
5.2.3 气泡图 29
5.3 数据的分布性 29
5.3.1 茎叶图 29
5.3.2 直方图 30
5.3.3 密度图 30
习题 31
第6章 文本数据可视化 32
6.1 文本数据在大数据中的应用 32
6.1.1 文本数据在大数据中的应用及提取 32
6.1.2 使用网络爬虫提取文本数据 33
6.2 文本内容可视化 34
6.2.1 关键词可视化 34
6.2.2 时序文本可视化 36
6.2.3 文本分布可视化 37
6.3 文本关系可视化 37
习题 39
第7章 复杂数据可视化 40
7.1 高维多元数据在大数据中的应用与可视化方法 41
7.1.1 空间映射法 41
7.1.2 图标法 44
7.2 非结构化数据可视化 45
7.2.1 基于并行的复杂数据高分辨率可视化 45
7.2.2 分而治之的复杂数据分析与可视化 46
习题 47
第3部分 大数据可视化工具及应用
第8章 Tableau数据可视化方法 49
8.1 Tableau介绍 49
8.1.1 软件特点 49
8.1.2 软件下载与安装 52
8.2 Tableau Desktop的使用 52
8.2.1 软件特点简介 53
8.2.2 连接到数据 54
8.2.3 使用Tableau软件拖放字段可视化 54
8.2.4 使用筛选器和颜色添加细化视图 57
8.2.5 通过地理方式浏览数据 59
8.2.6 在Tableau Desktop实现下钻 60
8.2.7 创建仪表板 62
8.2.8 创建故事 65
8.3 Tableau Server的使用 67
8.3.1 软件简介 67
8.3.2 软件安装 67
8.3.3 软件特点与使用 68
8.4 Tableau Reader的使用 76
8.4.1 软件简介 76
8.4.2 在Tableau Desktop简单导出仪表板 76
8.4.3 打开仪表板文件 77
习题 80
第9章 DataV数据可视化方法 81
9.1 DataV简介 81
9.2 可视化应用管理 84
9.2.1 模板的使用 84
9.2.2 应用的创建与发布 85
9.3 数据源管理 89
9.3.1 添加IP地址白名单 89
9.3.2 添加数据源 90
9.4 组件管理 94
9.4.1 组件概览 94
9.4.2 配置组件数据 94
9.4.3 配置组件交互 97
9.4.4 组件包的使用与管理 102
9.5 案例演示 104
习题 108
第10章 ECharts数据可视化方法 109
10.1 ECharts 109
10.1.1 ECharts简介 109
10.1.2 ECharts特点 109
10.2 ECharts中的基本概念 111
10.2.1 ECharts 实例 111
10.2.2 系列 112
10.2.3 组件 113
10.2.4 用option描述图表 114
10.2.5 组件的定位 114
10.2.6 坐标系 115
10.3 可视化类型 116
10.3.1 可视化支持类型概览 116
10.3.2 可视化类型与series组件 117
10.3.3 可视化类型设置示例 117
10.4 ECharts数据交互与API使用 119
10.4.1 数据交互 119
10.4.2 使用API 122
10.5 主题与扩展管理 123
10.5.1 主题与编辑工具 123
10.5.2 扩展管理 125
10.6 实践与案例 129
10.6.1 配置ECharts的使用环境 129
10.6.2 案例 131
习题 133
第11章 FineBI数据可视化方法 134
11.1 FineBI介绍 134
11.1.1 产品定位 134
11.1.2 与传统BI软件相比存在的优势 135
11.1.3 软件安装与启动 135
11.2 数据准备与加工 139
11.2.1 数据源 139
11.2.2 数据准备 139
11.2.3 关联设置 146
11.3 可视化分析 149
11.3.1 表格组件 149
11.3.2 图表组件 152
11.3.3 过滤组件 152
11.4 设计仪表板 154
11.5 案例分析 158
习题 161
第12章 R数据可视化方法 162
12.1 R的特点 162
12.2 R的功能特征 163
12.3 R数据处理 163
12.3.1 R的安装 164
12.3.2 R数据处理流程 169
习题 180
第13章 Python数据可视化方法 181
13.1 从MATLAB到Python 181
13.2 NumPy 182
13.3 pandas 187
13.4 Matplotlib 192
13.5 案例:新生数据分析与可视化 195
13.5.1 使用pandas对数据进行预处理 195
13.5.2 使用Matplotlib绘图 198
13.5.3 使用pandas绘图 200
习题 201
第14章 Excel数据可视化方法 202
14.1 Excel介绍 203
14.1.1 散点图 205
14.1.2 柱形图 207
14.1.3 雷达图 208
14.1.4 堆叠柱形图 210
14.2 案例:数据面板制作 210
习题 213
参考文献 214