金融商业数据分析与应用系列 金融商业算法建模:基于Python和SAS
作者:赵仁乾,田建中,叶本华,常国珍 著
出版时间: 2021年版
内容简介
这是一本贯穿金融业务经营全流程,以业务为驱动的金融数据挖掘与建模著作,涵盖分析框架、模型算法、模型评估、模型监控、算法工程化等整个数据建模的闭环。本书的4位作者都是在金融领域有有多年工作经验的大数据专家,不仅技术功底深厚、业务经验丰富,而且对金融行业从业者的需求痛点和图书市场的供给情况有深入了解,他们通过精心策划和写作,让本书内容独树一帜:涵盖金融业务经营全流程,全部以业务驱动,包含大量针对具体场景的实战案例。本书针对决策类、识别类、优化分析类3大主题,9大模板:客户价值预测、营销响应预测、细分画像、交叉销售、申请反欺诈、违规行为识别、预测、运筹优化、流程挖掘,详细讲解了每个模板算法原理、评估方法、优化方法和应用案例等,内容上极力做到准确、明晰、直观与实用。此外,本书还对数据科学项目中比较容易被忽视的内容做了补充,包括模型评估、模型监控、算法工程化,能指导读者构建易读、高效、健壮的数据科学工程。本书坚持理论与实践相结合,通过图形、示例、公式帮助读者快速掌握算法与优化理论的同时,还打造了一套可轻松适配各种分析场景与需求的工具模板,力图帮助读者从理论快速跨越到实践。
目录
前言
第1章 金融建模综述1
11 企业中数据分析的层级1
12 操作层面的数据分析对象与成果4
13 数据挖掘方法分类介绍4
131 预测性—有监督学习5
132 描述性—无监督学习10
14 数据挖掘方法论12
15 数据挖掘建模框架的3个原则14
16 利用SAS EM创建数据挖掘项目16
161 创建数据挖掘项目16
162 给项目添加逻辑库和数据集20
163 SAS EM项目的系统文档介绍26
第2章 决策类模型28
21 客户价值预测28
211 线性回归模型概述28
212 Python案例:线性回归建模33
213 多元线性回归的变量筛选40
214 Python案例:多元线性回归变量筛选43
215 模型假设检验44
216 残差分析48
217 强影响点分析49
218 Python案例:线性回归调优实战50
219 线性回归的完整流程小结59
2110 正则化61
2111 Python案例:岭回归与Lasso回归实战65
22 营销响应预测70
221 使用逻辑回归预测用户响应率70
222 比较逻辑回归与线性回归70
223 图解逻辑回归71
224 逻辑回归算法概述73
225 分类模型的评估75
226 分类变量的处理79
227 Python案例:逻辑回归建模实战80
228 SAS EM案例:贷款违约预测实战88
229 逻辑回归建模小结104
23 细分画像104
231 主成分分析105
232 因子分析116
233 变量聚类127
234 样本聚类1—层次聚类130
235 样本聚类2—K-Means聚类136
24 交叉销售165
241 关联规则165
242 序列模式185
第3章 识别类模型195
31 申请反欺诈195
311 决策树195
312 组合算法228
313 最近邻域法253
314 朴素贝叶斯257
315 支持向量机263
316 神经网络276
32 违规行为识别294
321 孤立森林296
322 局部异常因子304
第4章 优化分析类模型308
41 预测技术308
411 效应分解法309
412 基于动力模型的ARIMA317
413 基于深度学习的LSTM333
42 运筹优化341
421 线性规划342
422 整数规划344
423 非线性规划347
43 流程挖掘348
431 业务流程挖掘的总体理念348
432 流程发现352
433 流程监控353
434 流程遵循354
435 Python案例:利用pm4py实现流程挖掘355
第5章 模型评估与模型监控363
51 模型评估363
511 混淆矩阵363
512 ROC曲线363
513 KS统计量365
514 洛伦兹曲线与基尼系数366
52 模型监控368
521 前端监控—业务指标368
522 前端监控—评分分布稳定性368
523 前端监控—特征分布稳定性370
524 后端监控—评分正确性371
525 后端监控—变量有效性372
第6章 算法工程化374
61 构建合理的项目工程结构374
611 为什么要构建合理的项目工程结构374
612 什么是一个数据科学项目应有的结构375
62 如何编写规范的数据工程代码378
621 代码可读性379
622 数据处理性能381
附录 SAS EM节点说明386