欢迎访问学兔兔,学习、交流 分享 !

返回首页 |

深入理解大数据:大数据处理与编程实践

收藏
  • 大小:72.63 MB
  • 语言:中文版
  • 格式: PDF文档
  • 阅读软件: Adobe Reader
资源简介
深入理解大数据:大数据处理与编程实践
作者:黄宜华 主编
出版时间:2014年版
丛编项: 计算机类专业系统能力培养系列教材
内容简介
  《深入理解大数据:大数据处理与编程实践》从HadoopMapReduce并行计算技术与系统的基本原理剖析着手,在系统介绍基本工作原理、编程模型、编程框架和接口的基础上,着重系统化地介绍MapReduce并行算法设计与编程技术,较为全面地介绍了基本MapReduce算法设计、高级MapReduce编程技术、以及一系列较为复杂的机器学习和数据挖掘并行化算法,并引入来自IntelHadoop系统产品的一系列增强功能以及深度技术剖析;最后,为了提高读者的算法设计与编程实战能力,本书较为详细地介绍了一系列综合性和实战性大数据处理和算法设计问题,这些问题来自课程同学参加的全国性大数据大赛中的获奖算法、课程中的优秀课程设计、以及来自本团队的科研课题及业界实际的大数据应用实战案例。
目录
第一部分 Hadoop系统第1章 大数据处理技术简介1.1 并行计算技术简介1.1.1 并行计算的基本概念1.1.2 并行计算技术的分类1.1.3 并行计算的主要技术问题1.2 大数据处理技术简介1.2.1 大数据的发展背景和研究意义1.2.2 大数据的技术特点1.2.3 大数据研究的主要目标、基本原则和基本途径1.2.4 大数据计算模式和系统1.2.5 大数据计算模式的发展趋势1.2.6 大数据的主要技术层面和技术内容1.3 MapReduce并行计算技术简介1.3.1 MapReduce的基本概念和由来1.3.2 MapReduce的基本设计思想1.3.3 MapReduce的主要功能和技术特征1.4 Hadoop系统简介1.4.1 Hadoop的概述与发展历史1.4.2 Hadoop系统分布式存储与并行计算构架1.4.3 Hadoop平台的基本组成与生态系统1.4.4 Hadoop的应用现状和发展趋势第2章 Hadoop系统的安装与操作管理2.1 Hadoop系统安装方法简介2.2 单机和单机伪分布式Hadoop系统安装基本步骤2.2.1 安装和配置JDK2.2.2 创建Hadoop用户2.2.3 下载安装Hadoop2.2.4 配置SSH2.2.5 配置Hadoop环境2.2.6 Hadoop的运行2.2.7 运行测试程序2.2.8 查看集群状态2.3 集群分布式Hadoop系统安装基本步骤2.3.1 安装和配置JDK2.3.2 创建Hadoop用户2.3.3 下载安装Hadoop2.3.4 配置SSH2.3.5 配置Hadoop环境2.3.6 Hadoop的运行2.3.7 运行测试程序2.3.8 查看集群状态2.4 Hadoop& ;MapReduce程序开发过程2.5 集群远程作业提交与执行2.5.1 集群远程作业提交和执行过程2.5.2 查看作业执行结果和集群状态第3章 大数据存储--分布式文件系统HDFS3.1 HDFS的基本特征与构架3.1.1 HDFS的基本特征3.1.2 HDFS的基本框架与工作过程3.2 HDFS可靠性设计3.2.1 HDFS数据块多副本存储设计3.2.2 HDFS可靠性的设计实现3.3 HDFS文件存储组织与读写3.3.1 文件数据的存储组织3.3.2 数据的读写过程3.4 HDFS文件系统操作命令3.4.1 HDFS启动与关闭3.4.2 HDFS文件操作命令格式与注意事项3.4.3 HDFS文件操作命令3.4.4 高级操作命令和工具3.5 HDFS基本编程接口与示例3.5.1 HDFS编程基础知识3.5.2 HDFS基本文件操作API3.5.3 HDFS基本编程实例第4章 Hadoop& ;MapReduce并行编程框架4.1 MapReduce基本编程模型和框架4.1.1 MapReduce并行编程抽象模型4.1.2 MapReduce的完整编程模型和框架4.2 Hadoop& ;MapReduce基本构架与工作过程4.2.1 Hadoop系统构架和MapReduce程序执行过程4.2.2 Hadoop& ;MapReduce执行框架和作业执行流程4.2.3 Hadoop& ;MapReduce作业调度过程和调度方法4.2.4 MapReduce执行框架的组件和执行流程4.3 Hadoop& ;MapReduce主要组件与编程接口4.3.1 数据输入格式InputFormat4.3.2 输入数据分块InputSplit4.3.3 数据记录读入RecordReader
下载地址