数据挖掘原理、算法与应用
作者:梁亚声 编著
出版时间:2015年版
内容简介
《数据挖掘原理算法与应用》系统介绍了数据挖掘原理、算法和应用的相关知识。主要内容包括数据挖掘的过程、数据存储技术、数据预处理技术和算法、异常数据检测技术和算法、数据分类算法和应用、数据聚类分析的算法及其应用、数据关联分析算法及其应用、模型的评估技术和算法、复杂数据类型的数据挖掘技术。本书涵盖了数据挖掘过程的各方面技术和算法,在内容安排上将理论知识和工程技术应用有机地结合起来,并介绍了许多数据挖掘的典型应用方法。本书可作为高等院校计算机科学与技术、信息管理、数据分析等专业的教科书,也可作为企业管理、信息分析人员的技术参考书。
目录
出版说明
前言
第1章 概述
1.1 从数据中获取知识
1.2 数据挖掘的基本概念
1.3 数据挖掘的发展历程
1.4 数据挖掘的功能和数据挖掘系统的分类
1.4.1 分类与回归
1.4.2 聚类分析
1.4.3 关联规则
1.4.4 时序模式
1.4.5 异常检测
1.4.6 数据挖掘系统的分类
1.5 数据挖掘的过程
1.5.1 数据挖掘的一般流程
1.5.2 跨行业数据挖掘标准过程
1.6 数据挖掘与其他学科的关系
1.6.1 数据挖掘与数据库知识发现
1.6.2 数据挖掘与数据库查询
1.6.3 数据挖掘与统计分析
1.6.4 数据挖掘与数据仓库
1.6.5 数据挖掘与联机分析处理
1.6.6 数据挖掘与人工智能、专家系统、机器学习
1.7 数据挖掘的应用和发展趋势
1.7.1 商业的数据挖掘
1.7.2 金融业的数据挖掘
1.7.3 欺诈侦测中的数据挖掘
1.7.4 DNA数据分析中的数据挖掘
1.7.5 电信业中的数据挖掘
1.7.6 科学和统计数据挖掘
1.7.7 数据挖掘系统和软件
1.7.8 数据挖掘的发展趋势
1.8 小结
1.9 习题
第2章 数据存储
2.1 关系数据集
2.2 数据仓库
2.2.1 数据仓库的概念和特点
2.2.2 数据仓库的数据组织
2.2.3 数据仓库的关键技术
2.2.4 数据仓库与数据挖掘的关系
2.3 NoSQL数据库
2.3.1 NoSQL概念与理论
2.3.2 NoSQL数据模型
2.3.3 NoSQL与关系数据库
2.4 分布式文件系统
2.4.1 分布式文件系统的历史
2.4.2 分布式文件系统的体系结构
2.4.3 谷歌文件系统(GoogleFS)
2.4.4 Hadoop分布式文件系统(HDFS)
2.5 小结
2.6 习题
第3章 数据预处理
3.1 数据预处理的必要性
3.2 数据清理
3.2.1 缺失数据处理方法
3.2.2 噪声数据平滑技术
3.2.3 时间相关数据的处理
3.3 数据集成
3.3.1 实体识别与匹配
3.3.2 冗余和相关分析
3.3.3 元组重复数据的检测
3.3.4 冲突数据的检测与处理
3.4 数据转换
3.4.1 数据标准化
……
第4章 数据相似度与异常检测
第5章 数据分类和预测
第6章 数据聚类分析
第7章 数据关联分析
第8章 性能评估和提升
第9章 复杂数据挖掘
参考文献