金融风控理解(一)

  1. 风险在哪里(金融方向)
  • 信用风险
  • 负债分析
  • 收支评估
  • 还款能力
  • 还款意愿

根据银行业的风险理论,信用风险是指借款人因各种原因未能及时、足额偿还债权人或银行贷款而违约的可能性。

信用风险的风控重点在于,甄别客户违约的原因究竟是还款能力,还是还款意愿问题。如果客户真的由于各方面的原因,暂时不具备还款能力,这是概率问题。即使发生了,处置起来也不会有什么损失。而如果是还款意愿问题,存在较大的资金损失概率。

  • 欺诈风险
  • 身份冒用
  • 虚假材料
  • 内部欺诈
  • 黑中介

在风控中,欺诈风险比信用风险要大得多,所以反欺诈是重中之重。一般来说正常的客户,如果不是刻意骗贷的,只是因为家里出现突发事故、生意出现问题、暂时失业等等原因而导致资金周转不过来而逾期的,这毕竟是少数,而且借款只是逾期,能够还款的概率还是比较高。

消费金融行业绝大多数不良是因为欺诈引起的,如果反欺诈能够比较有效的情况下,信用风险控制在5%以内没有太大问题。


注意!!!风控不一定需要高逼格的算法和模型!!!!

风控领域绝大部分的异常都是被规则检测出来的!

业务架构:

图片文字说明

技术架构:

可以用大数据处理平台,如果业务没有实时,那么纯事后的用普通数仓也可以。


反欺诈平台:

为什么监督模型不一定有效?因为随着欺诈手段的升级,监督学习不一样能挖掘出异常。


目前的欺诈团伙已经形成完整的地下产业链,反欺诈平台需要根据平台沉淀的用户数据、环境数据、第三方数据结合生物探针技术采集的本次用户行为数据,建立用户、环境、行为画像以及基于用户、环境、行为的关系网络,通过对业务数据建立多重模型来甄别对异常用户的识别能力和反欺诈能力。

数据来源

数据源主要是三个方向:

  • 用户申请过程的填写的数据和埋点时采集的行为数据和日志数据。

  • 第三方合作数据,如人行征信数据、学历、多头借贷等数据。

  • 互联网上的数据,需要靠开发的爬虫平台去抓取。

数据分类主要以下几类:

  • 身份信息:姓名、身份证、手机号、卡号、居住地址、学历等。

  • 信用信息:收入信息、借款信息、帐户信息、还款和逾期信息。

  • 社交信息:通迅录信息、通话记录、QQ和其它平台交互信息。

  • 消费信息:银行卡详单、电商网站购买信息等其它信息。

  • 行为信息:申请和填写信息、GPS、时间点、地点等信息。

  • 第三方:多头信息、黑灰名单、授信信息。

反欺诈模型的集合就是,基于以上多维数据,对用户行为、语义、关联网络等组成一个巨大的数据关系图谱。利用这些数据简历风控模型体系,对用户的欺诈概率、还款风险进行强有力的预测和判断。


知识图谱的运用:滴滴、qq、微信、社交网络等


黑产攻击模型

通过分析收集的高风险人群及中介通话数据,挖掘出一张高风险人群联系密切的关系网,有效识别申请动机不良的客户,发现黑产攻击苗头。

多头授信模型

通过对客户与各类机构的通信关系,发现一些体现多头风险异常结构,如客户总被一些催收机构联系,同时又在主动拨打其他一些机构的营销电话。



欺诈团伙发现(医美、诈骗、传销等)

在互联网金融行业,欺诈团伙日益严重并且难以防范。从特点上来看,团伙欺诈有如下几个特点:

  • 专业性。欺诈团伙通常会根据各平台的风控规则,制定相应的欺诈手段;

  • 多变性。欺诈团伙的欺诈手法经常变化,让各平台防不胜防;

  • 爆发性。欺诈团伙一旦发现欺诈的可能性,会在短时间内,利用地下渠道获得的身份信息,大量反复地欺诈;

团伙欺诈的发现是业务反欺诈领域面临的一个重要挑战。目前反团伙欺诈技术思路如下:

  • 构成网络:将交易,交易信息项(地址,电话,设备id),用户等定义为节点;同属一个交易的节点间形成边;对边根据业务经验或其他规则赋予权重;

  • 特征提取和信息挖掘:提取网络饱和度,网络直径,关联度,中心度,群聚系数等特征;基于已有的黑名单,利用社区发现等算法得到节点的欺诈相关程度预测;

  • 加入模型:提取的特征可以作为模型或规则的输入;

  • 欺诈预警:在无标注数据的情况下,及时发现异常的网络拓扑结构,作为欺诈的早期预警;


评分模型!

评分卡、信用评分,而且评分模型未必是个模型。

在消费金融反欺诈领域,各种欺诈特征常以规则形式出现,通过一系列的规则的逻辑组合,排除有欺诈嫌疑的进件:

规则一定要用的就是强特征

  • 规则系统优点:可解释性强,可以迅速调整,应对欺诈手段变化;

  • 规则系统缺点:复杂的规则体系难于维护,难以利用弱特征,对强特征依赖,容易被攻破;

评分模型:评分模型在金融领域应用相当成熟,信用评分模型是最常见的应用。但公司将评分模型应用到反欺诈场景时常常与信用评分混淆,但本质上,二者的预测目标是不同的,反欺诈模型预测的是欺诈的可能性,信用模型预测的是还款的可能性。因此建立独立的反欺诈评分模型很有必要。

反欺诈评分模型有如下优点:

机器学习比较擅长拟合弱特征:决策树

  • 可以充分利用弱特征;

  • 对抗性好,模型结构由一系列弱特征决定,提高欺诈者伪装成本;


总结

消费金融行业这两年规模增长比较快,主要是基于在线的小额分散的借款。一定程度上无法有效和及时的识别真正的客户,某些消费场景内面对欺诈团伙和黑产需要建立有效和多种风控手段和模型。

基于大数据的风控和反欺诈模型起步也没有几年,大部分公司都在逐步完善和成熟的过程,基于机器学习的风险模型也都在大量的投入和尝试。需要从大数据上进行挖掘、分析和建模,利用用户身份数据、行为数据、外部数据和黑产数据建立反欺诈平台、规则和欺诈关联网络来提高反欺诈能力和风险识别能力。

欢迎技术探讨