数据挖掘与机器学习:WEKA应用技术与实践
作者:袁梅宇 编著
出版时间:2014年版
内容简介
《数据挖掘与机器学习:WEKA应用技术与实践》借助代表当今数据挖掘和机器学习最高水平的著名开源软件Weka,通过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,拉近理论与实践的距离。全书共分8章,主要内容包括Weka介绍、Explorer界面、KnowledgeFlow界面、Experimenter界面、命令行界面、Weka高级应用、WekaAPI和学习方案源代码分析。作为国内第一本系统讲解Weka的书籍,《数据挖掘与机器学习:WEKA应用技术与实践》内容全面、实例丰富、可操作性强,做到理论与实践的统一。本书适合数据挖掘和机器学习相关人员作为技术参考书,也适合作为计算机专业高年级本科生和研究生教材或教学参考用书。
目录
第1章 Weka介绍
1.1 Weka简介
1.1.1 Weka历史
1.1.2 Weka功能简介
1.2 基本概念
1.2.1 数据挖掘和机器学习
1.2.2 数据和数据集
1.2.3 ARFF格式
1.2.4 预处理
1.2.5 分类与回归
1.2.6 聚类分析
1.2.7 关联分析
1.3 Weka系统安装
1.3.1 系统要求
1.3.2 安装过程
1.3.3 Weka使用初步
1.3.4 系统运行注意事项
1.4 访问数据库
1.4.1 配置文件
1.4.2 访问数据库
1.4.3 常见问题及解决办法
1.5 示例数据集
1.5.1 天气问题
1.5.2 鸢尾花
1.5.3 CPU
1.5.4 玻璃数据集
1.5.5 美国国会投票记录
1.5.6 乳腺癌数据集
课后强化训练
第2章 Explorer界面
2.1 图形用户界面
2.1.1 标签页简介
2.1.2 状态栏
2.1.3 图像输出
2.1.4 手把手教你用
2.2 预处理
2.2.1 加载数据
2.2.2 属性处理
2.2.3 过滤器
2.2.4 过滤器算法介绍
2.2.5 手把手教你用
2.3 分类
2.3.1 分类器选择
2.3.2 分类器训练
2.3.3 分类器输出
2.3.4 分类算法介绍
2.3.5 分类模型评估
2.3.6 手把手教你用
2.4 聚类
2.4.1 聚类面板操作
2.4.2 聚类算法介绍
2.4.3 手把手教你用
2.5 关联
2.5.1 关联面板操作
2.5.2 关联算法介绍
2.5.3 手把手教你用
2.6 选择属性
2.6.1 选择属性面板操作
2.6.2 选择属性算法介绍
2.6.3 手把手教你用
2.7 可视化
2.7.1 选择单独的2D散点图
2.7.2 选择实例
2.7.3 手把手教你用
课后强化训练
第3章 Knowledge Flow界面
3.1 知识流介绍
3.1.1 知识流特性
3.1.2 知识流界面布局
3.2 知识流组件
3.2.1 数据源
3.2.2 数据接收器
3.2.3 评估器
3.2.4 可视化器
3.2.5 其他工具
3.3 使用知识流组件
3.4 手把手教你用
课后强化训练
第4章 Experimenter界面
4.1 简介
4.2 标准实验
4.2.1 简单实验
4.2.2 高级实验
4.2.3 手把手教你用
4.3 远程实验
4.3.1 远程实验设置
4.3.2 手把手教你用
4.4 分析结果
4.4.1 获取实验结果
4.4.2 配置测试
4.4.3 保存结果
4.4.4 手把手教你用
课后强化训练
第5章 命令行界面
5.1 命令行界面介绍
5.1.1 命令调用
5.1.2 命令自动完成
5.2 Weka结构
5.2.1 类实例和包
5.2.2 weka.core包
5.2.3 weka.classifiers包
5.2.4 其他包
5.3 命令行选项
5.3.1 常规选项
5.3.2 特定选项
5.4 过滤器和分类器选项
5.4.1 过滤器选项
5.4.2 分类器选项
5.4.3 手把手教你用
5.5 包管理器
5.5.1 命令行包管理器
5.5.2 运行安装的算法
课后强化训练
第6章 Weka高级应用
6.1 贝叶斯网络
6.1.1 简介
6.1.2 贝叶斯网络编辑器
6.1.3 在探索者中使用贝叶斯网络
6.1.4 学习算法
6.1.5 查看贝叶斯网络
6.1.6 手把手教你用
6.2 神经网络
6.2.1 GUI使用
6.2.2 手把手教你用
6.3 文本分类
6.3.1文本分类示例
6.3.2 分类真实文本
6.3.3 手把手教你用
6.4 时间序列分析及预测
6.4.1 使用时间序列环境
6.4.2 手把手教你用
课后强化训练
第7章 Weka API
7.1 加载数据
7.1.1 从文件加载数据
7.1.2 从数据库加载数据
7.1.3 手把手教你用
7.2 保存数据
7.2.1 保存数据至文件
7.2.2 保存数据至数据库
7.2.3 手把手教你用
7.3 处理选项
7.3.1 处理选项方法
7.3.2 手把手教你用
7.4 内存数据集处理
7.4.1 在内存中创建数据集
7.4.2 打乱数据顺序
7.4.3 手把手教你用
7.5 过滤
7.5.1 批量过滤
7.5.2 即时过滤
7.5.3 手把手教你用
7.6 分类
7.6.1 分类器构建
7.6.2 分类器评估
7.6.3 实例分类
7.6.4 手把手教你用
7.7 聚类
7.7.1 聚类器构建
7.7.2 聚类器评估
7.7.3 实例聚类
7.7.4 手把手教你用
7.8 属性选择
7.8.1 使用元分类器
7.8.2 使用过滤器
7.8.3 使用底层API
7.8.4 手把手教你用
7.9 可视化
7.9.1 ROC曲线
7.9.2 图
7.9.3 手把手教你用
7.10 序列化
7.10.1 序列化基本方法
7.10.2 手把手教你用
7.11 文本分类综合示例
7.11.1 程序运行准备
7.11.2 源程序分析
7.11.3 运行说明
课后强化训练
第8章 学习方案源代码分析
8.1 NaiveBayes源代码分析
8.2 实现分类器的约定
课后强化训练
附录A 中英文术语对照
附录B Weka算法介绍
参考文献