大数据技术基础实验
作者:欧中洪,宋美娜,鄂海红 编
出版时间:2020年版
内容简介
《大数据技术基础实验》为“大数据技术基础”的实验教程,可以和《大数据技术基础》教材配套使用。该书主要分为五大部分:大数据存储技术实验教程(分布式文件系统和NoSQL数据库),大数据处理框架实验教程(MapReduce和Spark、实时处理框架Storm和Flink),大数据分析技术实验教程(Druid、Drill、Kylin),大数据可视化实验教程,大数据综合应用实验案例。该书围绕典型大数据应用系统所需的各个组成部分设计实验,指导读者开展大数据应用实践。《大数据技术基础实验》可作为计算机学科相关专业,尤其是数据科学与大数据技术专业的专业教材,也可作为大数据相关专业从业人员的参考用书。
目录
第1章大数据存储:分布式文件系统及NoSQL数据库实验教程1
1.1HDFS常用操作1
1.2HBase的安装6
1.3HBase的Shell连接与数据操作7
1.4Redis数据库的安装和使用11
1.5MongoDB数据库的安装和使用17
1.6Neo4j数据库的安装和使用22
第2章大数据处理:MapReduce处理框架实验教程27
2.1实验目的27
2.2实验要求27
2.3预备知识27
2.4实验内容(5个实验)28
2.5实验作业64
2.6扩展资料65
2.7参考答案78
第3章大数据处理:分布式处理框架Spark实验教程79
3.1Spark安装79
3.2Sparkshell83
3.3Spark Scala87
3.4Spark Python99
3.5Spark MLlib103
第4章大数据处理:实时处理框架实验教程110
4.1Storm伪分布式部署及其基本操作110
4.2Flume安装及其基本操作124
4.3Kafka安装及其基本操作131
4.4Spark Streaming安装及其基本操作135
4.5Flink安装及其基本操作150
第5章大数据分析:分布式数据查询实验教程164
5.1Hive的数据导入与数据查询164
5.2Druid的安装171
5.3Druid的数据摄入与数据查询175
5.4Drill的部署181
5.5Drill命令行与PyDrill的基础使用183
第6章大数据分析:Kylin多维分析实验教程186
6.1Kylin的安装186
6.2Demo案例实战189
6.3多维分析的Cube创建实战193
6.4通过RESTful访问Kylin208
第7章大数据可视化实验教程215
7.1ECharts数据可视化215
7.2Plotly数据可视化218
7.3D3.js绘制知识图谱222
第8章大数据综合实验案例231
8.1案例简介231
8.2实验步骤232
8.3数据集下载232
8.4数据集导入数据仓库Hive233
8.5Hive数据分析237
8.6数据挖掘240
参考文献247