评分卡模型

信贷评分卡模型基础知识

丶灬走出姿态 提交于 2020-03-17 08:07:52
信贷评分卡模型基础知识 一、模型输出概率转化为分数 二、模型KS指标 一、模型输出概率转化为分数 风控模型(XGB模型、LGB模型或LR模型)直接输出的是客户逾期概率,在评分卡应用场景中,需要将此概率转化为对客户的评分,转化方式如下。设p表示客户逾期概率,将bad/good的比例记: o d d s = p 1 − p odds = \frac{p}{1-p} o d d s = 1 − p p ​ 评分卡分数可表示为下式: s c o r e = A − B ∗ l o g ( o d d s ) = A − B ∗ l o g ( p 1 − p ) \begin{aligned} score &=A-B*log(odds)\\ &=A-B*log(\frac{p}{1-p}) \end{aligned} s c o r e ​ = A − B ∗ l o g ( o d d s ) = A − B ∗ l o g ( 1 − p p ​ ) ​ 其中,A和B是常数。式中的负号使得违约概率越低,得分越高。通常情况下,这是分值的理想变动方向,即高分值代表低风险,低分值代表高风险。 常数A、B的值可以通过将两个已知或假设的分值带入计算得到。通常情况下,需要设定两个假设: (1)给定odds=Ratio时,预期分数为Base; (2)Ratio翻倍时,分数减少值为PDO(即Point

评分卡

亡梦爱人 提交于 2020-02-26 05:40:15
本文为根据风控课程总结 个人信贷产品的信用评分 商业银行三大风险流动性风险、市场风险(利率、信用)和操作风险,其他(欺诈风险) 信用风险:在合约到期日不完全履约 信用风险重要参数:PD(违约概率)、LGD(违约条件下的损失率)、EAD(违约风险下的敞口暴露)、RWA(风险权重资产)、EL(期望损失) 银行风控步骤 准入规则---》Pre A模型----》反欺诈----》新的规则----》A卡----》B卡 一般这里面不用选用相同的特征。这是因为客户由于一些特征上表现差才会被拒绝,而随着时间的偏移,这样会出现偏差,因为迭代到下一个模型的时候,用之前的特征规则虽然表现好,但筛选掉的用户将不在我们的建模样本里,特征的样本分布已经改变了。 什么是评分卡模型 以分数形式来衡量风险几率的一种手段。 是对未来一段时间内违约/逾期/失联概率的预测。(每个评分卡对应的都有对应的人群) 通常分数越高越安全。 申请评分卡(资信状况)、行为评分卡(消费账户历史上表现,通常进行行为评分卡的产品期限至少会是半年以上还款的才能看到历史表现,比如房贷、车贷、信用卡有循环贷款的模式比较适用)、催收评分卡(违约概率评分卡(轻度逾期到违约)、损失回收评分、催收响应类评分卡) 评分卡常用模型 逻辑回归:简单、稳定、可解释、易于监测和部署 缺点准确率不高 决策树:对数据质量要求低(数值型非数值、缺失容忍、共现容忍)、易解释

评分卡建模流程

匿名 (未验证) 提交于 2019-12-03 00:27:02
基于Logistic回归的申请评分卡模型开发 基本申请评分卡建模流程: 1.数据准备:收集并整合在库客户的数据,定义目标变量,排除特定样本。 2.探索性数据分析:评估每个变量的值分布情况,处理异常值和缺失值。 3.数据预处理:变量筛选,变量分箱,WOE转换、样本抽样。 4.模型开发:逻辑回归拟合模型。 5.模型评估:常见几种评估方法,ROC、KS等。 6.生成评分卡 1. 数据准备 因为不同评级模型所需要的数据也是不同的,所以在开发信用评级模型之前,要先明确我们需要解决的问题。 1.1 排除一些特定的建模客户 用于建模的客户或者申请者必须是日常审批过程中接触到的,需要排除异常情况。如 欺诈,特殊客户。 1.2 明确客户属性 根据不同的数据来源,可以分为以下几类: 1.人口统计特征:客户的基本特征,如性别,年龄、居住情况、年收入等 2.征信机构数据和外部评分:如人行征信报告、芝麻分等。 3.其他数据来源。 1.3 目标变量的确立 预测模型的一个基本原理是用历史数据来预测未来,申请者评分模型需要解决的问题是未来一段时间(如12个月)客户出现违约(如至少一次90天或90天以上逾期)的概率。先将客户标签定义为二分类,不良/逾期:观察窗口内,观察窗口内,60/90/120天算逾期日期;良好:从未或截止逾期;从未或在观察期内截止逾期 其中关于不良/逾期需要界定以下两项内容:确定违约日期时长

(信贷风控十六)组合评分卡模型

匿名 (未验证) 提交于 2019-12-03 00:09:02
https://study.163.com/course/introduction.htm?courseId=1005214003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share https://blog.csdn.net/LuYi_WeiLin/article/details/88624268 转载 组合评分卡模型 本篇文章主要总结以下内容 组合模型的概念 常见结构的评分组合模型 单一模型选择需要什么条件 串行结构组合模型实例 并行结构组合模型实例 组合模型的概念 常见结构的评分组合模型 串行结构组合模型实例 需要注意的是,一般工作中会把GBDT、神经网络、深度学习排在前面(因为精度高),逻辑回归、决策树放在后面 并行结构组合模型实 混合结构组合模型实例(不易于解释,一般不在评分卡使用) 单一模型选择需要什么条件 为什么单一模型之间要保证错误率的相互独立? 因为组合模型基于原理就是错误率相对独立,多个单一模型组合会使得组合模型错误率趋于0,也就是如下图;假如单一模型之间都完全不独立的话,单一模型和组合模型预测一样 为什么单一模型的复杂度要适度? 因为我们知道组合模型的复杂度会大于单一模型的复杂度的,假如单一模型就很复杂了,组合模型的复杂度可想而知 其次,复杂度高一般就很难提高精度了

ABC卡

我与影子孤独终老i 提交于 2019-11-27 09:24:23
如今在银行,P2P等各种贷款业务机构,普遍使用信用评分,对客户实行打分制,以期对客户有一个优质与否的评判。但是不是所有人都知道信用评分卡还分A,B,C卡三类!所以,如果你只知道ABC是Gary的ABC汤,那就赶紧来补习下这些知识吧~~ A卡(Application score card)申请评分卡 B卡(Behavior score card)行为评分卡 C卡(Collection score card)催收评分卡 三种卡的介绍,请直接看这篇文章:比较全面的说了三种打分机制。 梁世栋博士的《行为评分和贷后风险管理研究》http://www.docin.com/p-516772778.html 这三种打分机制的区别在于: 1.使用的时间不同。分别侧重 贷前、贷中、贷后 ; 2.数据要求不同。 A卡一般可做贷款0-1年的信用分析,B卡则是在申请人有了一定行为后,有了较大数据进行的分析,一般为3-5年,C卡则对数据要求更大,需加入催收后客户反应等属性数据。 3.每种评分卡的模型会不一样。在A卡中常用的有 逻辑回归 , AHP [层次分析法(Analytic Hierarchy Process,简称AHP)]等,而在后面两种卡中,常使用 多因素逻辑回归 ,精度等方面更好。 3.检测评分卡中客户群的 特征变化 ,已经这些变化对评分卡分值的冲击。 2.计算 某些特定参数 ,用以触发某些行动