网络欺诈

【转载】大数据风控---身份反欺诈信贷全流程常用指标及策略

走远了吗. 提交于 2019-12-23 13:22:04
前言 反欺诈的本质更多的是校验借款人的身份,也就是证明你就是你,我就是我。反欺诈也有很多金融术语(参见:https://zhuanlan.zhihu.com/p/26197949),也便于我们更清楚欺诈风险点。针对信贷业务,主要有两种风险,欺诈风险和信用风险,从造成的损失来看欺诈风险是公司损失的主要风险;当前网络的欺诈从业人数超过200万,网络诈骗的市场规模约1200亿,因为骗贷、套现等手段造成倒闭的机构超过2000家。 欺诈风险分类大致有两种: 第一方欺诈——相似地址伪装、本人手机号小号、高级欺诈..... 第三方欺诈——团伙欺诈、身份冒用、养资料(设备农场、猫池)... 我们常用的手段有:策略反欺诈,直接欺诈类用户通过策略拒绝掉;反欺诈评分,信用风险向欺诈风险转移的用户通过反欺诈评分卡模型来搞定,模型能解决策略的局限性。 反欺诈模型实施要点 1. 特征选择 个人欺诈特征:比如命中法院执行名单、三方黑名单、三方欺诈分;详单数据(通话次数、详单中授信人数占比,一度、二度联系人数占比) 团伙欺诈特征:比如设备关联了多少身份证;IP登录异常、通讯录数据(e.g:通讯录中名字涉及到“贷款”的个数、通讯录中命中黑名单的人数) 特征细分类 基础信息:如年龄、申请授信次数 设备信息:如借款人对应手机个数 时间相关:如授信申请时间在0-6点 运营商相关:近180天通话时长(通讯录

机器学习是什么?

此生再无相见时 提交于 2019-12-10 09:59:53
本文转载自: 机器学习是什么? 问题:机器学习是什么? 认知计算 该问题的第一类答案是 IBM 提出的认知计算。其目标是构建不需要显式编程的机器(计算机、软件、机器人、网站、移动应用、设备等)。 这种机器学习观点可追溯到 Arthur Samuel 在 1959 年的定义: 机器学习:让计算机无需显式编程也能学习的研究领域。 Samuel 的定义很好,但可能有点太模糊。 1998 年,另一位著名的机器学习研究者 Tom Mitchell 提出了一个更精确的定义: 如果计算机程序对于任务 T 的性能度量P通过经验E得到了提高,则认为此程序对经验E进行了学习 。 为了阐述清楚,我们举一个例子。假设我们正在开发一个信用卡欺诈检测系统。该系统的任务T是标记信用卡交易是否存在欺诈,性能度量指标P可以是已检测出的欺诈性交易的百分比,该系统会学习已检测出的欺诈性交易比例是否不断增长。经验E是已处理的交易记录集合。处理一个交易后,我们就会知道它是否存在欺诈,而且可以将该信息提供给该系统进行学习。 请注意,性能度量指标的选择至关重要。我们选的度量指标过于简单,实际上,如果系统将所有交易都标记为存在欺诈,那么它会实现 100% 的性能,但是这个系统将毫无用处!我们需要更合理的指标,比如检测出尽可能多的欺诈,同时尽可能少地将诚信交易标记为欺诈。幸运的是,可通过多种方法实现这个双重目标