数据科学与工程技术丛书 大数据管理系统原理与技术
作者: 王宏志
出版时间:2020年版
丛编项: 数据科学与工程技术丛书
内容简介
《大数据管理系统原理与技术》介绍了多种数据库管理系统的基本概念以及代表性数据库管理系统的使用和优化方法,覆盖了传统的关系数据库、数据仓库,以及列族、键值、文档、图等NoSQL数据库系统。通过阅读《大数据管理系统原理与技术》,读者可以较全面地了解支撑大数据应用所需的数据库管理系统的概念、特征和相关技术,并且可以学习代表性关系数据库系统的使用方法,将理论和实际相结合。《大数据管理系统原理与技术》可作为大数据相关专业本科生和研究生教材,也可供从事大数据相关工作的工程技术人员参考使用。要进行有效的大数据处理和计算,选择适当的数据库管理系统并对其进行配置、编程和调优是非常关键的环节。在大数据场景下,单一的数据库管理系统无法满足所有类型数据管理的需要,因此大数据相关专业的学生和从业者需要了解不同类型的数据库管理系统,以解决不同场景下的实际问题。《大数据管理系统原理与技术》基于作者多年的教学和工程经验编写而成,旨在帮助读者掌握面向大数据的数据库管理系统的原理和应用方法。
目录
本书编委会
前言
第1章 绪论
1.1 大数据的基本概念
1.2 数据库管理系统
1.2.1 数据库管理系统的基本概念
1.2.2 数据库管理系统的发展历史
1.2.3 数据库管理系统的要素
1.3 大数据对数据库管理系统的需求和挑战
1.4 本书结构
第2章 关系型数据库管理系统
2.1 关系数据库概述
2.1.1 关系模型
2.1.2 关系数据的存储
2.1.3 关系数据库的索引
2.1.4 关系数据库中的查询处理算法
2.1.5 并发控制
2.1.6 数据库恢复
2.2 关系数据库MySQL概述
2.3 MySQL应用
2.3.1 SQL概述
2.3.2 数据定义语句
2.3.3 数据处理语句
2.3.4 事务和锁定声明
2.3.5 其他
2.4 存储过程
2.4.1 概述
2.4.2 建立存储过程
2.4.3 调用存储过程
2.4.4 查询存储过程
2.4.5 删除存储过程
2.5 视图
2.6 分区
2.7 复制
2.8 MySQL的Java客户端JDBC
2.8.1 JDBC概述
2.8.2 JDBCAPI
2.8.3 Java通过JDBCAPI操作MySQL
第3章 数据仓库Hive
3.1 数据仓库概述
3.1.1 数据仓库的概念和特征
3.1.2 数据仓库的体系结构
3.1.3 数据仓库的模型
3.1.4 数据仓库关键技术
3.1.5 数据仓库与大数据
3.2 Hive概述
3.2.1 Hive存储结构
3.2.2 Hive体系结构
3.2.3 Hive的任务执行流程
3.3 Hive的特征
3.3.1 一致性
3.3.2 可扩展性
3.3.3 事务
3.4 Hive的基本概念
3.4.1 基本数据类型
3.4.2 数据类型转换
3.4.3 复杂数据类型
3.4.4 文本文件数据编码
3.4.5 数据读取模式
3.4.6 文件格式与压缩
3.4.7 Hive压缩
3.4.8 Hive关键字
3.5 Hive的使用
3.5.1 Hive命令
3.5.2 HiveDDL
3.5.3 HiveDML
3.5.4 HiveQL基本查询
3.5.5 Hive函数
3.5.6 HiveQL高级查询
3.6 面向大数据的优化策略
3.6.1 分桶
3.6.2 视图和索引
3.6.3 模式设计
3.7 Hive的调优
3.7.1 使用EXPLAIN查看执行计划
3.7.2 Hive配置管理
3.7.3 限制调整
3.7.4 JOIN优化
3.7.5 本地模式
3.7.6 并行执行
3.7.7 严格模式
3.7.8 调整Mapper和Reducer个数
3.7.9 JVM重用
3.7.10 动态分区调整
3.7.11 推测执行
3.7.12 单个MapReduce中的多个GROUPBY
3.7.13 虚拟列
3.8 Java通过JDBC操作Hive
……
第4章 NoSQL概述
第5章 键值数据库
第6章 列族数据库
第7章 非关系型文档数据库
第8章 非关系型图数据库