大数据应用基础
作者:娄岩 主编
出版时间: 2020年版
丛编项: 普通高等教育公共基础课系列教材·计算机类
内容简介
《大数据应用基础》是将大数据这一计算机前沿科学理论和基本应用有机结合的典型教材,全面介绍了大数据及其相关的基础知识,由浅入深地剖析了大数据的分析处理方法和技术手段,重点介绍了大数据新的发展趋势和技术成果。《大数据应用基础》包括大数据概论、大数据采集及预处理、大数据分析概论、大数据可视化、Hadoop概论、HDFS和Common概论、MapReduce概论、NoSQL技术、Spark概论、云计算与大数据、大数据解决方案及相关案例等内容。《大数据应用基础》体系完整、内容丰富、注重应用、前瞻性强、适用性好,并有开放式的课程教学网站提供技术支持。《大数据应用基础》既可以作为普通高校大数据技术的基础教材,也可以作为职业培训教育及相关技术人员的参考用书。
目录
第1章 大数据概论
1.1 大数据技术概述
1.1.1 大数据的基本概念
1.1.2 IT产业的发展简史
1.1.3 大数据的来源
1.1.4 大数据产生的三个发展阶段
1.1.5 大数据的特点
1.1.6 大数据处理流程
1.1.7 大数据的数据格式特性
1.1.8 大数据的特征
1.1.9 大数据的应用领域
1.2 大数据时代的新理念
1.3 大数据的整体技术和关键技术
1.4 大数据分析的五种典型工具简介
1.5 大数据未来发展趋势
1.5.1 数据资源化
1.5.2 数据科学和数据联盟的成立
1.5.3 大数据隐私和安全问题
1.5.4 开源软件成为推动大数据发展的动力
1.5.5 大数据在多方位改善我们的生活
本章小结
第2章 大数据采集及预处理
2.1 大数据采集
2.1.1 大数据采集概述
2.1.2 大数据采集的数据来源
2.1.3 大数据采集的技术方法
2.2 大数据的预处理
2.3 大数据采集及预处理的工具
本章小结
第3章 大数据分析概论
3.1 大数据分析简介
3.1.1 什么是大数据分析
3.1.2 大数据分析的基本方法
3.1.3 大数据分析处理流程
3.2 大数据分析的主要技术
3.2.1 深度学习
3.2.2 知识计算
3.3 大数据分析处理系统
3.3.1 批量数据及处理系统
3.3.2 流式数据及处理系统
3.3.3 交互式数据及处理系统
3.3.4 图数据及处理系统
3.4 医学大数据分析应用
本章小结
第4章 大数据可视化
4.1 大数据可视化简介
4.1.1 大数据可视化的概念
4.1.2 医学大数据可视化
4.2 大数据可视化工具
4.2.1 大数据可视化工具简介
4.2.2 大数据可视化工具实例
本章小结
第5章 Hadoop概论
5.1 Hadoop简介
5.1.1 Hadoop的起源
5.1.2 Hadoop的特点
5.1.3 Hadoop的发展
5.2 Hadoop架构与组成
5.2.1 Hadoop架构
5.2.2 Hadoop组成
5.3 Hadoop应用
5.3.1 Hadoop平台搭建
5.3.2 Hadoop的开发方式
S.3.3 Hadoop应用分析
本章小结
第6章 HDFS和common概论
6。1HDFS简介
6.1.1 HDFS的相关概念
6.1.2 HDFS的体系结构
6.1.3 HDFS的工作原理
6.2 HDFS在医学领域的应用
613Common简介
本章小结
第7章 MapReduce概论
7.1 MapRedlice简介
7.1.1 MapReduce的概念
7.1.2 MapReduce的内涵、特征和局限性
7.2 MapReduce的架构和工作流程
7.2.1 MapReduce的架构
7.2.2 MapReduce的工作流程
7.3 Map和Redlice工作原理
7.4 MapReduce在医学领域的应用
本章小结
第8章 NOSQL技术
8.1 NoSQL基础知识
8.1 NoSQL的产生
8.1.2 NoSQL的特点
8.1.3 NoSQL的技术基础
8.2 NoSQL的种类
8.2.1 键值存储
8.2.2 列存储
8.2.3 文档存储
8.2.4 图形存储
8.3 典型的NoSOL工具
8.3.1 Redis
8.3.2 Bigtable
8.3.3 CouchDB
8.3.4 Neo4j
本章小结
第9章 Spark概论
9.1 Spark概述
9.1.1 Spark简介
9.1.2 Spark发展
9.1.3 Scala语言
9.2 Spark与Hadoop
9.2.1 Hadoop的局限与不足
9.2.2 Spark的优点
9.2.3 Spark速度比Hadoop快的原因
9.3 Spark的生态系统
9.3.1 底层的ClusterManager和DataManager
9.3.2 中间层的SparkRuntime
9.3.3 高层的应用模块
9.4 Sparlk的应用
9.4.1 Spark的应用场景
9.4.2 应用Spark的成功案例
本章小结
第10章 云计算与大数据
10.1 云计算简介
10.1.1 云计算的定义
10.1.2 云计算与大数据的关系
10.1.3 云计算服务模式
10.2 云计算核心技术
10.2.1 虚拟化技术
10.2.2 资源池化技术
10.2.3 云计算部署模式
10.3 云计算在医学领域的应用
10.3.1 医疗云
10.3.2 移动医疗健康服务云
10.3.3 医学科研分析服务云
本章小结
第11章 大数据解决方案及相关案例
11.1 大数据解决方案基础
11.2 Intel大数据
11.2.1 Intel大数据解决方案
11.2.2 Intel大数据相关案例——中国移动广东分公司详单、账单查询系统
11.3 百度大数据
11.3.1 百度大数据引擎
11.3.2 百度数智平台
11.3.3 百度指数
11.4 腾讯大数据
11.4.1 腾讯大数据解决方案
11.4.2 相关实例——腾讯广告
本章小结
参考文献