基于数学规划的数据挖掘分类算法研究及应用
出版时间:2012年版
内容简介
数据挖掘是数据库和信息决策领域的一个理论前沿,是知识发现的核心部分。数据挖掘技术可以快速有效地分析和处理来自组织内外部的大量的数据和信息,从而为组织的预测和决策提供科学依据。《基于数学规划的数据挖掘分类算法研究及应用》旨在对数据挖掘算法中基于数学规划的分类模型所面临的一些问题进行研究。因此,重点分析基于数学规划的分类模型的研究现状,并按照分类模型的5个衡量标准,以多目标规划为主线来研究和改进一些基于多目标规划的分类模型,如最小二乘支持向量机和多目标规划分类方法。在实际应用中,把这些模型进行改进使其更加适应当今世界和数据库技术的发展,从大量的数据中发现更多的知识,不仅要提高分类精度,增强模型的鲁棒性,减少计算的复杂度,还要使模型本身更具有解释性。而且对于分类模型而言,要对大多数的数据库都能达到这些目标才能算是具有不错的性能。
目录
1 导论
1.1 本书的研究背景与意义
1.2 本书主要研究内容
1.3 研究方法和研究思路
1.4 本书的创新性
参考文献
2 基于数学规划的数据挖掘分类模型研究热点及应用概述
2.1 数据挖掘分类模型的重要性
2.2 数据挖掘分类模型的发展历史
2.3 基于数学规划的分类模型研究热点及进展
2.4 本书对基于数学规划分类模型的研究要点
参考文献
3 数据准备,结果评价及优化工具
3.1 问题的提出
3.2 分类模型的评价方法
3.3 模型参数的优化方法
3.4 数据挖掘常用工具
参考文献
4 机器学习分类模型改进研究
4.1 问题的提出
4.2 MK-LS-SVM模型介绍
4.3 L1-LS-SVM模型介绍
4.4 基于ES的自适应L1-LS-SVM模型介绍
参考文献
5 多目标规划数据挖掘分类模型改进研究
5.1 问题的提出
5.2 MK-MCP模型介绍
5.3 L1-MK-MCP模型介绍
参考文献
6 知识管理应用——信用风险评价
6.1 引言
6.2 MK-LS-SVM和MK-MCP模型信用风险分析应用
6.3 L1-LS-SVM和L1-MK-MCP模型信用风险分析应用
6.4 基于ES的LP-LS-SVM模型的信用风险分析应用
6.5 五个改进模型信用风险评价结果比较分析
参考文献
7 知识管理应用——文本分类
7.1 引言
7.2 文本挖掘概念
7.3 文本分类概念
7.4 文本分类器评价指标
7.5 L1-LS-SVM文本分类器性能验证
参考文献
8 总结与展望
8.1 总结
8.2 需进一步研究的问题
图1.1 分类模型过程示意图
图3.1 ES算法循环进化示意图
图3.2 开源数据挖掘R软件界面图示
图3.3 开源数据挖掘Weka软件界面图示Ⅰ
图3.4 开源数据挖掘Weka软件界面图示Ⅱ
图3.5 开源数据挖掘YALE软件界面图示
图3.6 开源数据挖掘KNIME软件界面图示Ⅰ
图3.7 开源数据挖掘KNIME软件界面图示Ⅱ
图3.8 开源数据挖掘Orange软件界面图示Ⅰ
图3.9 开源数据挖掘Orange软件界面图示Ⅱ
图4.1 线性可分类示意图
图7.1 各个类的分类结果比较
表4.1 三个UCI数据库基本信息
表4.2 多核最小二乘支持向量机在三个数据库上的平均测试结果
表4.3 三种方法在三个数据库上总分类精度试验结果比较
表4.4 模型在四个LICI数据库上的平均测试结果
表4.5 L1-LS-SVM模型应用不同的正则化参数y时的平均测试结果(□-5000)
表4.6 在不同的核参数下的L1-LS-SVM模型的平均测试结果(y-2□)
表4.7 四种模型对于四个医学数据库分类测试结果比较
表4.8 基于ES的自适应LP-LS-SVM模型在四个IJCI数据库上的平均测试结果
表4.9 基于ES的自适应LP-LS-SVM在数据库:PIMA上对应于不同范数值的分类精度(第三次第2阶试验)
表4.10 与其他流行机器学习方法比较结果
表5.1 多核多目标规划在三个数据库上的平均测试结果
表5.2 四个模型的试验结果比较分析
表5.3 L1-MK-MCP模型在四个UCI数据库上的平均测试结果
表5.4 多个流行模型对相同数据库的平均总分类精度比较
表6.1 三个信用卡数据库的详细信息
表6.2 MK-LS-SVM与其他三个相关模型的平均试验结果比较
表6.3 □值变化时所选出的具体特征
表6.4 参数□变化时MK-LS-SVM的测试结果
表6.5 不同模型在同一数据库上的平均测试结果比较
表6.6 六个模型在两个信用卡数据库上的平均试验结果比较
表6.7 MK-MCP模型每一阶的试验结果
表6.8 五个模型应用在实际信用库中的测试结果比较
表6.9 五个模型在两个ucI信用库上的测试结果比较
表6.10 正则化参数变化时L1-LS—SVM模型的测试结果(□=1 000)
表6.1l 六个信用分析模型的测试结果比较
表6.12 L1一MK—MCP模型与其他五个模型在两个UCI信用库上的平均测试结果比较
表6.13 六个相近模型在美国商业银行数据库上的平均测试结果比较
表6.14 基于ES的L1-LS-SVM模型在三个信用卡数据库上的平均测试结果
表6.15 六个相近模型在两个UCl信用库的平均测试结果比较
表6.16 七个信用分析模型在美国商业银行信用库上酌测试结果比较
表6.17 本文五个模型在三个信用卡数据库上的测试结果比较
表7.1 实验数据