普通高等院校应用型人才培养“十三五”规划教材 Python数据分析
作者:周海燕责任编辑 (中国)吴道君,朱家荣
出版时间: 2019年版
丛编项: 普通高等院校应用型人才培养“十三五”规划教材
内容简介
本书全面讲解Python数据分析的相关知识和技术,内容包括Python数据分析概述、NumPy数值计算、Matplotlib数据可视化、Pandas数据分析、数据预处理、Sklearn机器学习。本书以培养学生编程能力和数据分析能力为目标,注重技术应用能力的培养。 本书内容充实、结构合理、实用性强,具有明确的应用能力培养目标,易于接受和理解,学完本书后,可以具备数据分析的基本能力。 本书适合作为普通高等院校人工智能、数据科学与大数据以及计算机相关专业课程的教材,也可以作为相关从业人员的技术参考用书。
目录
第1章 Python数据分析概述 1
1.1 数据分析的概念、流程和应用 1
1.1.1 数据分析的概念 1
1.1.2 数据分析的流程 2
1.1.3 数据分析的应用 2
1.2 数据分析工具 3
1.2.1 常用工具 4
1.2.2 Python数据分析 4
1.3 Python数据分析环境 5
小结 9
习题 9
实验 10
第2章 NumPy数值计算 15
2.1 NumPy多维数组 15
2.1.1 数组创建 15
2.1.2 数组对象属性 22
2.1.3 数组数据类型 23
2.2 数组操作 24
2.2.1 修改数组形状 24
2.2.2 翻转数组 26
2.2.3 连接数组 27
2.2.4 分割数组 28
2.2.5 数组元素添加与删除 30
2.3 数组索引与切片 32
2.3.1 数组索引 32
2.3.2 数组切片 33
2.3.3 布尔型索引 34
2.3.4 花式索引 35
2.4 数组的运算 35
2.4.1 数组和标量间的运算 35
2.4.2 广播 36
2.4.3 算术函数 37
2.4.4 集合运算 40
2.4.5 统计运算 41
2.4.6 排序 43
2.4.7 搜索 44
2.5 线性代数 45
2.5.1 数组相乘 46
2.5.2 矩阵行列式 46
2.5.3 逆矩阵 46
2.5.4 线性方程组 47
2.5.5 特征值和特征向量 47
2.6 数组的存取 48
小结 48
习题 48
实验 51
第3章 Matplotlib数据可视化 54
3.1 线形图 54
3.1.1 绘制线形图 54
3.1.2 颜色设置 55
3.1.3 线型设置 56
3.1.4 坐标点设置 57
3.1.5 线宽设置 59
3.2 其他图形 59
3.2.1 散点图 59
3.2.2 柱形图 61
3.2.3 条形图 63
3.2.4 饼图 64
3.2.5 直方图 65
3.2.6 箱线图 67
3.3 自定义设置 69
3.3.1 图例设置 69
3.3.2 坐标网格设置 70
3.3.3 坐标系设置 71
3.3.4 样式设置与注解 72
3.3.5 RC设置 73
3.4 子图 74
3.4.1 创建子图 74
3.4.2 子图坐标系设置 76
3.4.3 图形嵌套 77
3.5 绘制三维图形 78
小结 81
习题 82
实验 82
第4章 Pandas数据分析 89
4.1 Pandas数据结构 89
4.2 DataFrame基本功能 94
4.3 读取外部数据 95
4.3.1 CSV文件 96
4.3.2 Sqlite数据库 98
4.4 数据帧的列操作和行操作 99
4.4.1 列操作 99
4.4.2 行操作 101
4.5 高级索引 103
4.5.1 重建索引 103
4.5.2 更换索引 106
4.5.3 层次化索引 107
4.6 Pandas数据运算 108
4.6.1 算术运算 108
4.6.2 函数应用与映射运算 109
4.6.3 排序 111
4.6.4 迭代 113
4.6.5 唯一值与值计数 115
4.7 统计函数 116
4.7.1 描述性统计 116
4.7.2 变化率 119
4.7.3 协方差 120
4.7.4 相关性 120
4.7.5 数据排名 121
4.8 分组与聚合 122
4.8.1 分组 122
4.8.2 聚合 124
4.9 透视表与交叉表 127
4.9.1 透视表 127
4.9.2 交叉表 128
小结 129
习题 129
实验 129
第5章 数据预处理 134
5.1 数据清洗 134
5.1.1 重复值 134
5.1.2 缺失值 135
5.1.3 异常值 140
5.2 合并连接与重塑 142
5.2.1 merge合并 142
5.2.2 concat合并 144
5.2.3 combine_first合并 146
5.2.4 数据重塑 147
5.3 数据变换 149
5.3.1 虚拟变量 149
5.3.2 函数变换 150
5.3.3 连续属性离散化 151
5.3.4 规范化 152
5.3.5 随机采样 154
小结 156
习题 156
实验 156
第6章 Sklearn机器学习 162
6.1 术语 162
6.2 Sklearn 164
6.2.1 Sklearn数据集 165
6.2.2 Sklearn常用算法 171
6.2.3 数据预处理 175
6.2.4 数据集拆分 177
6.2.5 模型评估 177
6.2.6 Sklearn常用方法 178
6.2.7 模型的保存和载入 179
6.3 降维 179
6.3.1 PCA(主成分分析) 179
6.3.2 LDA(线性评价分析) 181
6.4 回归 182
6.4.1 线性回归 183
6.4.2 逻辑回归 184
6.4.3 回归决策树 185
6.5 分类 186
6.5.1 朴素贝叶斯 187
6.5.2 分类决策树 188
6.5.3 SVM(支持向量机) 189
6.5.4 神经网络 190
6.5.5 K?近邻算法 191
6.6 聚类 192
6.6.1 K?means算法 193
6.2.2 DBSCAN 194
小结 195
习题 195
实验 196
参考文献 200