互联网和金融科技加速商业银行等金融机构信贷产品创新能力,随之而来的各种风险成为亟待解决的首要问题,尤其是信用风险和欺诈风险。本文主要探讨信贷产品投产初期度量客户信用风险的定量分析方法,在产品不够成熟和数据缺乏情况下,提出信贷产品投产初期申请评分模型构建思路及其优缺点,最后从信贷产品生命周期的角度提出建模迭代优化方向。 Internet and financial technology accelerate the innovative ability of credit products in financial structure such as commercial banks. The various risks followed are urgent problems to be solved, especially credit risk and fraud risk. This paper mainly discusses the quantitative analysis method to evaluate customer credit risk in initial stage of credit products. In the case of product immaturity and lack of data, it discusses the idea of constructing application scoring models for credit products in the initial stage as well as its advantages and disadvantages. Finally, it puts forward the direction of modeling iteration optimization from the life cycle of credit products.
齐少春1,王方春2
1东华理工大学,江西 南昌
2徽商银行,安徽 合肥
收稿日期:2019年3月20日;录用日期:2019年4月3日;发布日期:2019年4月10日
互联网和金融科技加速商业银行等金融机构信贷产品创新能力,随之而来的各种风险成为亟待解决的首要问题,尤其是信用风险和欺诈风险。本文主要探讨信贷产品投产初期度量客户信用风险的定量分析方法,在产品不够成熟和数据缺乏情况下,提出信贷产品投产初期申请评分模型构建思路及其优缺点,最后从信贷产品生命周期的角度提出建模迭代优化方向。
关键词 :信贷产品,初创期,信用评分,通用化评分
Copyright © 2019 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY).
http://creativecommons.org/licenses/by/4.0/
当前经济高速稳步发展,应市场需要金融信贷产品不断创新,尤其是互联网带来的金融科技的变革,各种信贷新渠道新产品层出不穷。从生命周期角度来看,这种新产品和新渠道投产初期即为信贷产品的初创期,也有称为信贷产品冷启动阶段。根据巴塞尔协议三的相关标准,建立评分模型需要大量的历史数据。一般来说,样本容量越大,尤其是“坏客户”比重越大,所建立模型的精度或预测能力就越高,模型也越稳健。信贷产品初创期数据积累少,无法构建量化监督模型,这是信贷产品风险控制的一大难题。许多金融工作者认为信贷产品的经营是风险经营,在产品投产初期如何控制风险是亟待解决的首要问题。对于各大股份银行尤其是农商行、城商行等,以及互联网、消费金融、小贷等新兴助贷公司而言,大数据风控能力已经成为其开展信贷业务的核心竞争力。
不同金融机构都有各自的风险容忍度指标,并且由于地域、客户、政策、产品特性等差异影响,新产品不可能照搬套用其它机构或本机构其它产品的模型,因此难以建立统一标准的贷前申请评分模型。从宏观层面来看,随着金融体系不断完善,征信体系建设也越来越迫切,包括人行征信中心在内的各大征信机构都在积极探索社会征信体系建设,这对于金融机构控制风险是利好消息。这些信用评分目前已经在市场上受到金融机构的青睐,有些机构直接使用征信评分作为准入授信的依据。当然这些评分在数据、模型以及场景上都有其局限性,因此各机构仍然积极建设专属量化评分模型。
信用评分技术随着消费信贷产业的规模扩大在迅速发展,传统的信用评分主要依托专家法、描述统计、推断统计等技术,随着机器学习、AI、云计算等新科技的崛起,这些新技术在信用评分领域取得较好的应用效果。对于信贷产品信用风险建模的文献研究较多,本文依据信贷产品投产初期数据积累少的特点针对性进行文献梳理。
陈建 [
对于无历史数据积累,尤其是没有好坏客户样本时,学者们通过构建无监督模型量化客户的信用风险。丁明智 [
郭瑛琰 [
在市场实践中,国内外金融机构均在积极探索如何解决这一问题的新途径,很多金融机构已经运用统计方法或者其他策略来控制风险,但是并没有公布使用效果和具体操作流程。本文在文献综述基础上归纳出信贷产品初创期申请评分建模的几种方案,讨论其适用场景及优缺点,抛砖引玉,为信贷部门新产品投产初期信用风险度量提供解决思路。
来自多家银行的数据表明,信贷产品上线早期不采取量化模型,而仅仅依托经办人员和系统规则很难综合评估客户的信用风险,从而识别出高风险客户,因此随着时间窗口的扩大较早以前没有经过量化评分决策而准入的客群不良率普遍较高。针对产品初创期基本无数据积累的特点,可以考虑以下几种建模方案。
在一个新的信用产品推广的初期,可以找到与之相类似的产品,用类似产品的样本建模在初期也是一个不错的选择。当然这需要金融部门有类似的产品和相应数据积累,这种方法的优点是只需要按照原有思路调整建模,缺点是难以保证相同产品客户结构的一致性,毕竟相同产品相同渠道产品几率较低,企业不会开发重复同类产品,当客群结构不一致时,模型也会失真,因此这种方法需要慎用。少数银行使用这种方法作为参考,但是并不作为主模型决策使用。
开放准入条件,允许一部分客户进来,客户数量要达到建立分类模型需要的最低样本量,但是“坏客户”还没有那么多,这时候可以考虑人工标注好坏样本,选择一些有丰富经验的信审人员挑选出坏客户,利用标记样本建立临时的监督模型。这种方法建立的模型准确率会存在偏向性,只可以作为初期模型,后期需要继续完善。这种模型的缺点是代价较高,要求企业能承担一定的风险;此外需要人工标记样本,这种方法存在一定的操作风险,因此很少有金融机构采用此方法建模。
综合评价方法是将多个指标通过数学变换转化成一个综合指标,重点在于评估指标体系设计和权重的确定。金融机构可以组织专家,也可以借鉴成熟评分卡的相关变量确定信用风险综合评价指标体系,然后选择综合评价方法层次分析法、因子分析、灰色综合评价方法、TOPSIS评价法、DEA、模糊数学方法等确定各指标的权重,加权计算出每个申请人的风险评分。这种方法的优点是操作简单,权重确定主要是从数据角度出发,并非主观确定。缺点是指标体系建设需要专家级的信审人员,现实中专家级人员往往不够多。
相似度模型主要采用聚类算法,选择好特征,将好坏客户分成不同的群体,当然我们要基于一定假设,即我们选择的模型能区分好坏客户。这种方法比较粗糙,直接将坏客户作为异常样本识别出来。聚类分析按照业务规则进行判别,拟合正常行为的分布,寻找离正常数据分布较远的异常值数据。通过聚类分析可以助于我们分析用户的特点,查找各群体内的异常客户。
聚类分析的基本思想是根据样本的多个属性指标,寻找一个统计量度量样品之间的相似程度,以该统计量为分群的标准,将相似程度较大的样品聚为一类,把另一些相似程度较大的样品聚为另一类。关系密切的聚合到一个小的分类单位。关系疏远的聚合到一个大的分类单位,直到划分为合理的群体为止。
具体步骤是将样品分类,然后在每个聚类中寻找在某种意义上与该聚类中的大多数样品不同的样品。首先,通过快速聚类将样品进行初步归类,选择规模较大、群体相似度较高的群对应的种子(也就是选择聚类种子时剔出异常点);然后,以这些种子作为初始化的聚类种子对样品再次进行聚类,这样就将距离较远的群体或个体聚到每个大类下,再选出离质心距离较远的个体作为离群点。这一步往往只能依靠研究人员的经验和关键指标在不同类别上的显著性检验来确定。
当前中国信贷市场高速发展,信用服务面临利好,市场化信用服务机构正通过各种方式解决数据问题,在推动数据共享的进程中,政府及各行业领头企业发挥着不可或缺的作用。从数据来源和特点看,第三方评分主要有以下几种。一是政府权威机构的信用服务,许多文献中定义为信用局评分,在我国主要是中国人民银行征信中心提供的征信报告,基本融合国内所有银行的信贷数据及政府数据,包括信用卡贷记卡信用记录和综合征信1000分,包括公积金、水电煤燃等公共信息;二是政府授权的征信服务机构,如首批获得个人征信牌照的八家征信金融机构,芝麻信用,前海征信、鹏元征信等,基本融合客户基本属性、行业特征等数据,形成的信用评分服务。此外还有行业巨头的征信服务,如电信旗下甜橙征信开发的甜橙分,中国联通的沃信用分,京东信用分等;三是市场上数据服务公司的信用服务,此类公司融合多渠道数据源形成的信用评分,比较知名的有同盾科技、百融金服等。
从目前使用覆盖率上看,人行征信分和芝麻信用分覆盖人群多,覆盖面广,是最受金融机构欢迎的第三方信用产品。直接用“通用化评分”对客户进行信用评级操作简单,但是需要一定的成本,由于数据孤岛的存在,不同评分都依托特定场景,行业或场景针对强。
就我国目前的状况而言,存在征信体系不够发达、消费信贷产品单一、消费信用分析专家还不多等问题,这些问题都会影响以上方案的有效性。因此金融机构可以根据选择使用多种方法综合控制信用风险,例如可以运用第通用评分和专家评分等构建融合模型或矩阵模型共同决策,通过相似度模型作为辅助模型识别出异常客户。其次,要基于跨行业联防联控理念,以客户提供信息为基础,利用海量数据和智能模型的关联分析,对申请人的风险倾向做出更多的信息评估,运用于授信和客户定价,为银行提供更精准的信贷决策方案。
信用评分模型的迭代更新伴随着产品的生命周期进行,产品使用的模型随着各阶段数据情况不断迭代出新的模型。产品成长期,有少量的标签样本,可以利用判别模型和生成模型之间形成对抗学习,实现两个神经网络模型的交互信息均衡,来部分解决建模样本不完备和不均衡的问题,提高对申请模型的识别能力。产品成熟期,“好、坏客户”量级达到最基本的建模要求(坏客户的数据至少需要800个),可以建立监督模型。具体做法是通过分析内部信息并引入外部信息等,衍生大量反映客户行为特征和资信能力的变量,并运用先进的数理统计技术整合各种变量信息,建立机器学习分类模型对客户的信用表现做出预测,作为决策的依据。信用评分模型迭代情况取决于产品各阶段数据积累程度,从最初的专家模型和无监督模型,到自学习、自适应学习、半监督学习和对抗学习模型,再到分类监督模型。在产品不同时期依据其数据质量和数量,数据广度和深度选择合适的模型,才能科学的规避金融机构的模型风险,降低客户的信用风险。
齐少春,王方春. 信贷产品初创期申请评分建模方法综述Summary of Application Scoring for Credit Products in Start-Up Period[J]. 社会科学前沿, 2019, 08(04): 473-478. https://doi.org/10.12677/ASS.2019.84066