针对互联网金融行业信用风险评估这一问题,本文应用RBF神经网络,以互联网金融行业数据为算例,通过分析关于网贷平台的统计数据,对平台进行了信用风险评估,提出了RBF神经网络模型预警新方法,弥补了传统预警方法中所缺乏的客观性与全面性造成预测结果不准确的不足,同时与BP神经网络算法对比,优化信用风险模型,合理预测行业发展信用风险状况,为借贷人提供参考。通过构建RBF神经网络预警模型,从新的视角给出信用风险预测模型,最后通过实例对比分析说明了该方法的有效性。<br/>Aiming at the problem of credit risk assessment in Internet finance industry, this paper applies RBF neural network, takes the data of Internet finance industry as an example, analyzes the statis-tical data of online lending platform, evaluates the credit risk of the platform, and puts forward a new method of RBF neural network model early warning, which makes up for the lack of objectivity and comprehensiveness in traditional early warning methods. At the same time, compared with BP neural network algorithm, it optimizes the credit risk model, reasonably predicts the credit risk situation of the industry development, and provides reference for borrowers. Through the construction of RBF neural network early warning model, the credit risk prediction model is given from a new perspective. Finally, the effectiveness of the method is illustrated through the compar-ative analysis of an example.
针对互联网金融行业信用风险评估这一问题,本文应用RBF神经网络,以互联网金融行业数据为算例,通过分析关于网贷平台的统计数据,对平台进行了信用风险评估,提出了RBF神经网络模型预警新方法,弥补了传统预警方法中所缺乏的客观性与全面性造成预测结果不准确的不足,同时与BP神经网络算法对比,优化信用风险模型,合理预测行业发展信用风险状况,为借贷人提供参考。通过构建RBF神经网络预警模型,从新的视角给出信用风险预测模型,最后通过实例对比分析说明了该方法的有效性。
RBF神经网络,信用风险,互联网金融
—Taking Internet Financial Trading Platform as an Example
Yue Yang, Yu Yuan
School of Economics and Management, Harbin University of Science and Technology, Harbin Heilongjiang
Received: Mar. 4th, 2021; accepted: May 3rd, 2021; published: May 10th, 2021
Aiming at the problem of credit risk assessment in Internet finance industry, this paper applies RBF neural network, takes the data of Internet finance industry as an example, analyzes the statistical data of online lending platform, evaluates the credit risk of the platform, and puts forward a new method of RBF neural network model early warning, which makes up for the lack of objectivity and comprehensiveness in traditional early warning methods. At the same time, compared with BP neural network algorithm, it optimizes the credit risk model, reasonably predicts the credit risk situation of the industry development, and provides reference for borrowers. Through the construction of RBF neural network early warning model, the credit risk prediction model is given from a new perspective. Finally, the effectiveness of the method is illustrated through the comparative analysis of an example.
Keywords:RBF Neural Network, Credit Risk, Internet Finance
Copyright © 2021 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
回顾我国互联网金融行业的发展,以P2P网贷平台为代表,从萌芽到生长再到全面清退,历经13年。近期,由于互联网金融行业中网贷平台问题层出不穷,导致全部清零,重点在于风险防控缺少具体策略的实施。而互联网金融行业信用风险防控措施所需预案不足,风险预警方法准确率低一直是该行业的痛点。传统的预警方法仍未解决互联网金融风险防控所缺乏科学性、全面性以及创新性。对于互联网金融中任何一个平台来说,大力加强和改进互联网金融风险防控工作,既有利于进一步优化和完善互联网金融平台管理体系,同时也能够为防范和控制互联网金融风险创造更为有利的条件 [
现关于互联网金融行业的信用风险研究状况有如下几方面。其中关于借款人信用状况利用神经网络等方法的研究较多,例如肖会敏等人基于神经网络对借款人的信用进行了风险评估 [
关于互联网金融平台的信用风险基于不同方法的研究不断出现,例如,张丹丹采用因子分析法从监管力度不够和平台风险评价机制两个方面对平台进行了风险评估 [
关于互联网金融的信用风险的研究,不仅限于平台本身,更多的是注重方法创新研究,例如李占玉利用SMOTE算法与随机森林相结合,构建了互联网金融公司的财务风险预警模型 [
综上,互联网金融行业现行的相关研究主要在于信用风险方法方面的研究,本文以互联网金融中网贷平台的数据为例,针对信用风险评估这一问题将应用RBF神经网络,从以下视角进行研究。本文采用MATLAB软件构建RBF神经网络,将所得到的RBF神经网络与现有的BP神经网络算法进行对比,通过比较来优化传统的神经网络预测法,最后通过实例将RBF神经网络引入到互联网金融平台的信用风险预警之中。通过运用RBF神经网络对互联网金融行业信用风险进行预警研究,为其他行业信用风险评估提供新思路。
RBF神经网络,又称为径向基神经网络,是前馈型神经网络的一种。与BP神经网络相比,RBF神经网络将问题转换为线性可分之后便解决了BP神经网络中局部极小值问题。RBF神经网络也是由输入层、输出层和隐含层组成,与BP神经网络不同的是,RBF神经网络仅有一个隐含层而不是多层隐含层,所以为了实现相同的功能,RBF神经网络就需要更多的隐含层神经元。
RBF神经网络的优点是网络的训练时间更短,需要人工调整的训练参数更少,它对于预测结果可以精确到任意值,其中隐含层中的神经元越多,预测结果就可以越精确。
本研究应用RBF神经网络的自适应性构建了与BP神经网络不同的风险预警模型,避免了反复调试隐含层神经元的数目这一工序。从刚开始训练的时候只有0个隐含层神经元,通过误差检查对比自主的增加隐含层神经元的个数,经过多次反复检查,最后使神经元的个数达到预测需求值,这便是RBF神经网络的自适应性。
在MATLAB软件中本研究使用newrb函数构造一个径向基神经网络。在创建过程中,会不断调试隐含层神经元的个数,直到网络满足要求。隐藏层的作用是把向量从低维m映射到高维P,低维线性不可分的情况到高维就线性可分了,代码如下所示。
net = newrbe (P_train,T_train,30);
P_train和T_train同BP神经网络设置的一样,分别是训练集的输入域和输出域,30是RBF神经网络独有的参数spread,这个参数在MATLAB中创建RBF网络时是要事先设定好的,其默认值为1。spread越大,函数拟合越平滑,但是逼近误差会变大,需要的隐藏神经元也越多,计算也越大。spread越小,函数的逼近会越精确,但是逼近过程会不平滑,网络的性能差,会出现过适应现象。所以具体操作的时候要对不同的spread值进行尝试,spread即要大到使得神经元产生响应的输入范围能够覆盖足够大的区域,同时也不能太大,而使各个神经元都具有重叠的输入向量响应区域。本研究中RBF神经网络中健康平台输出值为0,代表风险较低。问题平台输出值为1,代表风险很高。
在本研究中,经过大量测试后,得到的RBF神经网络的网络结构图,如图1所示,它包括1个输入层,10个隐藏层神经元,1个输出层。
图1. RBF神经网络结构图
依据信用风险预警指标选取的原则,为保证所选取的指标具有适用性、全面性、可理解性、公平性、合法性等原则,结合RBF神经网络模型研究的需求,本文将选取以下几个因素作为研究指标,其中与平台相关的指标:(X1)运营时间、(X2)注册资本;与借贷人相关的指标:(X3)投资人数、(X4)借款人数;与资金相关的指标:(X5)人均借款金额、(X6)人均投资金额、(X7)资金净流入、(X8)平均借款周期、(X9)待还余额占比。具体情况如表1所示。
指标分类 | 指标名称 | 内容解释 |
---|---|---|
与平台相关的指标 | 运营时间(X1) | 平台从成立之日至今的运营总时间。 |
注册资本(X2) | 平台成立时的注册资金总数。 | |
与借贷人相关的指标 | 投资人数(X3) | 在该平台投资的总人数。 |
借款人数(X4) | 在该平台借款的人数。 | |
与资金有关的指标 | 人均借款金额(X5) | 平均每个借款人的借款金额。 |
人均投资金额(X6) | 平均每个投资人的投资金额。 | |
资金净流入(X7) | 资金净流入 = 月新增借款总金额 − 月还款总金额。 | |
平均借款周期(X8) | 借款人平均的借款周期。 | |
待还余额占比(X9) | 待还余额占借款总数的比例。 |
表1. 互联网金融平台信用风险评估指标体系表
为了结果的准确性,本文所选取的9个指标均为定量指标,其中待还余额占比这一指标是经过网贷之家所公布的待还余额这一指标通过对数据的预处理得到的,其余指标的数据均为网贷之家所公布的截止2019年10月底的真实数据。
由于P2P网贷平台已经全部清零,为了研究的有效性以及客观性,本文所选取的研究数据截止于2019年10月30日。本文通过爬虫软件客观地获取了“网贷之家”“网贷天眼”等第三方网站所公开发布的一手数据。获取过程主要分为以下几个步骤。
1) 分析所要解决的问题确定所要选择的指标,本文所选取的9个指标是通过对数据指标确立原则的研究所确立。其中,平台性质这一指标作为输出结果,预先对其就行编码,健康平台的输出值为0,问题平台的输出值为1,以便最终输出结果作比较。
2) 通过爬虫软件从第三方网站获取数据通过爬虫软件获取数据之后,整理为Excel表格。获取的数据均为第三方网站网贷之家及网贷天眼所公布的真实有效数据。
3) 数据的预处理检查数据完整性、一致性,筛选有效数据。为了保证数据的完整性,所选取的80家健康平台的数据是来自于第三方网站排名靠前的数据,50家问题平台的数据是出现问题前一个月的各项指标的数据。最终,将数据分为训练和测试两组数据,为了训练结果的准确性,选取60组健康平台、40组问题平台的数据对神经网络进行训练,其余20组健康平台、10组问题平台的数据用来做测试。如表2、表3所示。
序号 | 平台 | 运营时间(月) | 注册资本(万元) | 资金净流入(万元) | 人均投资金额 (万元) | 人均借款金额 (万元) | 平均借款期限(月) | 待还余额占比 | 借款人数 (人) | 投资人数 (人) | 平台性质 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 微贷网 | 101 | 12809 | −14973.46 | 3.9 | 4.17 | 5.13 | 0.36 | 113,617 | 121,413 | 0 |
2 | 爱钱进 | 66 | 50000 | −2842.42 | 0.89 | 0.32 | 13.47 | 0.15 | 1,324,806 | 474,981 | 0 |
3 | 麻袋财富 | 59 | 11000 | 219.27 | 5.56 | 0.65 | 13.83 | 0.30 | 531,811 | 62,568 | 0 |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
59 | 油界贷 | 42 | 1000 | 0 | 7.01 | 63.75 | 12 | 0.04 | 20 | 182 | 0 |
60 | 威阳普惠 | 39 | 6000 | −30.82 | 1.55 | 12.21 | 26.1 | 0.07 | 102 | 801 | 0 |
61 | 众金在线 | 35 | 1000 | −466 | 4.83 | 21.1 | 10.80 | 10.80 | 3367 | 2506 | 1 |
62 | 德州贷 | 22 | 400 | 159 | 59.61 | 4.29 | 2.88 | 2.88 | 8508 | 1851 | 1 |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
98 | 泓润恒业 | 21 | 1000 | −179 | 24.18 | 10.02 | 7.42 | 7.42 | 3 | 1 | 1 |
99 | 龙江易贷 | 11 | 500 | −48 | 1.61 | 1.82 | 1.38 | 1.38 | 6 | 1 | 1 |
100 | 利商贷 | 18 | 500 | −292 | 14.24 | 8.89 | 3.47 | 3.47 | 9 | 1 | 1 |
表2. 100家网贷平台训练数据统计
数据来源:网贷之家2019年10月30日的数据。
序号 | 平台 | 运营时间(月) | 注册资本(万元) | 资金净流入(万元) | 人均投资金额 (万元) | 人均借款金额 (万元) | 平均借款期限(月) | 待还余额占比 | 借款人数(人) | 投资人数(人) | 平台性质 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | 民贷天下 | 58 | 20000 | −318.7 | 1.09 | 16.38 | 0.10 | 1.12 | 8879 | 9163 | 0 |
2 | 友金服 | 61 | 5000 | −102.08 | 0.22 | 32.82 | 0.01 | 16.71 | 595 | 45184 | 0 |
3 | 地标金融 | 73 | 10000 | 0 | 6.93 | 2.92 | 0.31 | 3300 | 3 | 1428 | 0 |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
19 | 自由财富 | 64 | 2000 | −450 | 2.24 | 3.14 | 0.25 | 58.75 | 48 | 1258 | 0 |
20 | 融资易 | 62 | 10000 | −190 | 6.84 | 3.39 | 0.21 | 43.97 | 61 | 392 | 0 |
21 | 日融财富 | 17 | 10000 | 20 | 48.52 | 1.26 | 1.26 | 2.18 | 2958 | 1164 | 1 |
---|---|---|---|---|---|---|---|---|---|---|---|
22 | 兴飞财富 | 18 | 2000 | −129 | 12.56 | 4.28 | 4.28 | 6.23 | 69584 | 11468 | 1 |
…… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… | …… |
28 | 财神在线 | 24 | 1000 | −29 | 41.58 | 0.26 | 0.26 | 4.55 | 8396 | 161 | 1 |
29 | 鼎玉财富 | 20 | 1000 | 7 | 26.96 | 0.97 | 0.97 | 6.26 | 53905 | 1702 | 1 |
30 | 开开贷 | 65 | 1000 | −49 | 10.35 | 3.18 | 3.18 | 11.93 | 936 | 914 | 1 |
表3. 30家网贷平台测试数据统计
数据来源:网贷之家2019年10月30日的数据。
由于各种数据的单位不一致,而且不同数据网站的所采用的数据单位不相同,所以神经网络方法在录入数据和划分出训练集和测试集之后需要对数据进行归一化处理。
归一化代码如下:
[p_train, ps_input] = mapminmax(P_train,0,1);
[t_train, ps_output] = mapminmax(T_train,0,1);
换算成数学公式如下。
Y = ( X − M I N ) / ( M A X − M I N ) (1)
X是原始样本数据,Y是数据X的映射, M I N 代表此类数据的最小值, M A X 代表此类数据最大值,通过这种归一化将各种数据之间的差异最小化。通过0代表无关,1代表相关。从而各种数据都在[0,1]这个区间中,然后可以训练神经网络来实现对数据的预测。
采用RBF神经网络预测方法进行风险预警研究,将训练集的数据进行归一化后导入到RBF神经网络开始训练,进行算例验证,RBF神经网络的训练过程如图2所示。
图2. RBF神经网络训练过程图
RBF神经网络训练效果,如图3所示。
图3. RBF神经网络训练效果图
本模型中RBF神经网络共进行了26次迭代运算,精确度逐步提高,当迭代到第20次时达到最优值。其中与BP神经网络不同的一点是MATLAB软件中RBF神经网络有ROC曲线图,如图4所示。
图4. RBF神经网络的ROC曲线图
受试者工作特征曲线简称ROC曲线,ROC曲线越靠近左上角试验的准确性就越高。从图4中可以看出训练的ROC曲逐渐趋近于1,代表所设计的RBF神经网络准确度高。
绘制出RBF神经网络的训练结果图代码如下所示。
figure;
plot(1:N, dataY', 'or', 'MarkerSize', 12);
hold on;
plot(1:N, predY, 'sg', 'MarkerSize', 12, 'MarkerFaceColor', 'g');
legend({'真实值', '预测值'});
title('RBF神经网络预测对比图');
saveas(gcf, '预测对比图.png');
经过MATLAB软件绘制出结果后,RBF神经网络的结果成图如图5所示。
图5. 训练结果图
可以看出训练的效果很好前60个健康平台的数据只有2个高于0.5,后40个问题平台中也有2个低于0.5。故模型准确概率为96%,如图7所示,可以直接看出每次的训练的准确度。由于数据太多不容易直观看出训练的效果,采取一个近似化处理。将预测的似然值小于0.5的结果归为0类,将预测的似然值大于等于0.5的结果归为1类。如图6所示。
图6. 近似化后的训练效果图
这样可以直观的看出训练模型的准确概率达到了96%,更便于观察出预测的结果。本模型采取问题平台的信用风险输出是1,健康平台的信用风险输出是0。当输入一个未知的网贷平台数据时,如果输出的值为1,代表该平台的信用不好,投资者需要慎重选择,如果输出为0,代表该平台的信用风险较小,可以选择。为了进一步探究该模型的准确性,本文选取30组数据作为测试集,进行验证。
如图7所示,30组数据中选取的20家健康平台数据只有1组高于0.5,10家问题平台的数据只有1组低于0.5,故测试结果准确率达到93.33%。
图7. 测试结果图
本文中,RBF神经网络的训练数据包括100个平台数据(60个健康平台和40个问题平台),测试数据包括30个平台数据(20个健康平台和10个问题平台),其结果输出为0代表健康平台,输出为1代表问题平台。为了对平台有良好的风险预测功能,本文所选取的健康平台数据均来自网贷之家、网贷天眼等网站排名靠前的平台。当我们输入一个未知的互联网金融行业中网贷平台数据时,如果输出值为1,代表该平台的信用不好,投资者、贷款者需要慎重选择,如果输出为0,代表该平台的信用风险较小,可以选择。
利用本文中所使用的数据,进行BP神经网络进行验证时,训练结果迭代到第10次达到了最优值,误差较小。由于神经网络算法属于黑箱操作,我们不能用肉眼直接观察到计算过程,所以为了结果的准确性,通常要求当样本数量大于300,但是结合我们现有的BP神经网络算法研究,本文优化后的RBF神经网络算法利用130个样本数据达到了一个理想的结果,其中RBF 神经网络基于BP神经网络的模型的优点是结构更简单,可调参数比较多,可调性范围比较大。RBF神经网络模型可以自主增加隐含层神经元的个数,自主性更高,比较适合于高精度的预测。
针对众多互联网金融信用风险问题,本文利用MATLAB软件工具基于RBF神经网络算法建立信用风险预警模型,通过分析平台的发展数据,结合构建指标体系原则,构建信用风险评估指标体系,以截止2019年10月30日的P2P网贷平台数据为算例,通过100个平台数据的训练模型得到30个平台测试数据的准确率达到93.33%的预测模型,以此得到了准确率较高的RBF神经网络互联网金融信用风险预测模型。
相较于现有的BP神经网络,本研究所应用的RBF神经网络模型更加具有机器学习的特性。由于RBF神经网络可以自主增加隐含层的数目,节约了调试隐含层数目的时间,并且RBF神经网络也不用设置学习效率、迭代次数等参数,属于自主的调节模型,其ROC曲线相较于回归曲线更能反映学习的效率,错误直方图更能直观的反映模型的效率。总结来说RBF神经网络比现有的BP神经网络更加的高效,准确率更高。在风险预测中,为了投资者、借贷者能够很好地规避风险,结合BP神经网络的RBF神经网络更加具有现实意义。同时,应用RBF神经网络在互联网金融行业的信用风险预警中,能够更好的避免传统评估方法中的数据处理不规范,准确率低等问题。
感谢国家自然科学基金资助项目和教育部人文社会科学研究项目的资助。
国家自然科学基金资助项目(71601059,71673069),教育部人文社会科学研究项目(19YJA790087)。
杨 月,袁 宇. 基于RBF神经网络的信用风险预警研究——以互联网金融交易平台为例Research on Credit Risk Early Warning Based on RBF Neural Network—Taking Internet Financial Trading Platform as an Example[J]. 建模与仿真, 2021, 10(02): 257-267. https://doi.org/10.12677/MOS.2021.102027