(信贷风控十六)组合评分卡模型

匿名 (未验证) 提交于 2019-12-03 00:09:02

 

https://blog.csdn.net/LuYi_WeiLin/article/details/88624268转载

组合评分卡模型

本篇文章主要总结以下内容

  • 组合模型的概念
  • 常见结构的评分组合模型
  • 单一模型选择需要什么条件
  • 串行结构组合模型实例
  • 并行结构组合模型实例

 

组合模型的概念

 

 

 

 

 

 

 

 

 

 

常见结构的评分组合模型

  • 串行结构组合模型实例

需要注意的是,一般工作中会把GBDT、神经网络、深度学习排在前面(因为精度高),逻辑回归、决策树放在后面

 

 

 

 

 

 并行结构组合模型实

 

 

 

 

 

 

 混合结构组合模型实例(不易于解释,一般不在评分卡使用)

 

 

 

单一模型选择需要什么条件

 

 

 

 

 

 

 

为什么单一模型之间要保证错误率的相互独立?

因为组合模型基于原理就是错误率相对独立,多个单一模型组合会使得组合模型错误率趋于0,也就是如下图;假如单一模型之间都完全不独立的话,单一模型和组合模型预测一样

 

 

 

为什么单一模型的复杂度要适度?

因为我们知道组合模型的复杂度会大于单一模型的复杂度的,假如单一模型就很复杂了,组合模型的复杂度可想而知

其次,复杂度高一般就很难提高精度了,再想从组合模型提高精度,模型会越来越复杂

为什么单一模型不是越多越好?

因为在完全独立的情况下,随着单一模型数量的增多,组合模型的错误率降低的速率已经没有那么明显了,而且随着单一模型的增加,成本会增加。单一模型数量增加复杂度也会上升,响应时间会加长,在实际工作线上比如反欺诈模型要求时效性高要求毫秒级响应,所以数量并非越多越好。

 

根据模型的构成维度可以分为:并行组合、串行组合

根据单一分类器类型可以分为:同态组合、异态组合

所以就会有四种类型的组合模型模式

 

 

 

串行结构组合模型实例

  • 同态串行组合(一般不使用,同态串行组合错误率相互独立性弱,没有太大的提升效果)
  • 异态串行组合

精度高的模型排在前面

 

 

 

以多层神经网络和逻辑回归异态串行组合评分模型为例

 

 

 

 

 

 神经网络模型不一定需要WOE编码,但是神经网络模型要求是数值型输入,我们也可以采用其他编码

 

 

 

单一逻辑回归与多层神经网络加逻辑回归得出的KS与AUC对比

我这里异态串行组合提升不明显的原因是神经网络没有经过一个仔细的调参以及输入节点太少

 

 

 

 

 

 图中融合器针对分类问题,可以

 

 图中融合器针对回归问题,可以

 

 异态并行组合

 

 为什么转换为log odds?方便分数的直接运算,因为分数的表达式如下,分数和分数就可以直接加权平均了

 

 

 

 

 

同态并行组合

 

 

 

 

 

 

 

Boosting

 

 RSM

 

 

python风控建模实战lendingClub(博主录制,catboost,lightgbm建模,2K超清分辨率)

https://study.163.com/course/courseMain.htm?courseId=1005988013&share=2&shareId=400000000398149

 微信扫二维码,免费学习更多python资源

 

易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!