Java大数据分析 影印版 英文版
作者:(美)拉贾特 梅塔(Rajat Mehta)著
出版时间:2019年版
内容简介
《Java大数据分析(影印版 英文版)》以使用Java对大数据进行基本的统计分析开篇,然后讨论如分类、回归、聚类、集成等其他数据分析主题。《Java大数据分析(影印版 英文版)》还涵盖了如推荐引擎、大规模图形分析、实时分析、深度学习等高级主题。书中涵盖了各种案例研究,例如tweet数据集的情绪分析、针对MovieLens数据集的推荐、电子商务数据集的客户细分、真实航班数据集的图表分析。这《Java大数据分析(影印版 英文版)》是使用Java实现大数据分析的端到端指南。Java如今已经是主流大数据环境(包括Hadoop)的事实语言。《Java大数据分析(影印版 英文版)》将教你如何使用产品友好的、Java对大数据进行分析。全书内容基本上分为两部分。一部分是入门知识,帮助读者熟悉大数据环境;第二部分包含对大数据分析中所有概念的核心讨论。它涵盖了数据分析和数据可视化、机器学习的核心概念和优势、通过朴素贝叶斯进行回归和分类的现实用法、对聚类概念的深入讨论并且回顾了使用deepLearning4j或普通的Java Spark代码基于大数据实现简单的神经网络。对于想要开始学习大数据分析并希望将其应用于现实世界的Java开发人员而言,这是一本必不可少的书籍。
目录
Preface
Chapter 1:Big Data Analytics with Java
Why data analytics on big data?
Big data for analytics
Big data - a bigger pay package for Java developers
Basics of Hadoop - a Java sub-project
Distributed computing on Hadoop
HDFS concepts
Design and architecture of HDFS
Main components of HDFS
HDFS simple commands
Apache Spark
Concepts
Transformations
Actions
Spark Java API
Spark samples using Java 8
Loading data
Data operations - cleansing and munging
Analyzing data - count, projection, grouping, aggregation, and max/min
Actions on RDDs
Paired RDDs
Saving data
Collecting and printing results
Executing Spark programs on Hadoop
Apache Spark sub-projects
Spark machine learning modules
Mahout - a popular Java ML library
Deeplearning4j - a deep learning library
Summary
Chapter 2: First Steps in Data Analysis
Datasets
Data cleaning and munging
Basic analysis of data with Spark SQL
Building SparkConf and context
Dataframe and datasets
Load and parse data
Analyzing data - the Spark-SQL way
Spark SQL for data exploration and analytics
Market basket analysis - Apriori algorithm
Implementation of the Apriori algorithm in Apache Spark
Efficient market basket analysis using FP-Growth algorithm
Running FP-Growth on Apache Spark
Summary
Chapter 3: Data Visualization
Data visualization with Java JFreeChart
Using charts in big data analytics
Time Series chart
All India seasonal and annual average temperature series dataset
Simple single Time Series chart