Credit 信用, 2012, 1, 1-8 Published Online May 2012 (http://www.hanspub.org/journal/credit) Dynamic Credit Scoring Model and Method: A Review* Weimin Chen1, Yo ujin Liu1, Guocheng Xiang1, Kexi Wang2, F e nghua Wen3 1School of Business, Hunan University of Science and Technology, Xiangtan 2School of Management, Hunan University of Science and Technology, Xiangtan 3School of Economy and Management, Changsha University of Scien ce and Technology, Chan gsha Email: wminc@ 126.com, liuyoujin@hnust.edu .cn, xian gguoch@soh u.com, wangkx8882@163.com Received: Apr. 3rd, 2012; revised: Apr. 10th, 2012; accepted: Apr. 20th, 2012 Abstract: With the rapid development of China’s economy and the advance of the Basel 2 accord all around the world, personal credit scoring is more and more important. It is imperative under the situation to adopt the dynamic credit scoring methods for personal credit score is dynamic changing and the purpose of credit scoring is changed. There is little research on dynamic credit scoring and no research based on the Chinese credit data. For the sake of the development of dynamic credit sco ring, we reviewed the develop ment of dy- namic credit scoring, introduced Markov chain, survival analysis, and dynamic credit scoring based on data mining proposed recently, analyzed their advantage and weakness. Finally, the existing problems and the fu- ture direction in this field are discussed. Keywords: Credit Scoring; Dynamic Model; Personal Credit; Risk Analysis 动态信用评分的模型与方法综述* 陈为民 1,刘友金 1,向国成 1,王克喜 2,文凤华 3 1湖南科技大学商学院,湘潭 2湖南科技大学管理学院,湘潭 3长沙理工大学经济与管理学院,长沙 Email: wminc@ 126.com, liuyoujin@hnust.edu .cn, xian gguoch@soh u.com, wangkx8882@163.com 收稿日期:2012 年4月3日;修回日期:2012 年4月10 日;录用日期:2012 年4月20 日 摘 要:随着我国经济的飞速发展和新巴塞尔资本协议在全球迅速推进,个人信用评分的重要性日益 加强。由于个人信用的动态变化、信用评分目的转变、经济形势对信用评分的影响,采用动态信用评 分方法势在必行。国内对动态信用评分模型的研究非常少,为推动动态信用评分的发展,本文回顾了 动态信用评分的发展历程,介绍了 Markov 链、生存分析以及最新的基于数据挖掘的动态信用评分方 法,介绍了它们的最新运用,同时分析了它们的特点。分析了国内实行动态信用评分的困难和挑战, 展 望了国内实施动态信用评分的前景。 关键词:信用评分;动态模型;个人信用;风险分析 1. 引言 信用评估是政府、金融机构、企业界以及学术界 都高度关注的问题。信用评分模型作为信用风险管理 的基础和核心,无论是对于建立社会征信体系还是对 于金融机构的信贷资产管理,都有着不可替代的作 用。在英美,信用机构认为成人平均至少每周接受一 次信用评分,个人信用被称为个人的“第二身份证”。 *基金项目:国家社科基金重大招标项目(09&ZD041),国家社科基 金(07BYJ110),湖南省社科基金项目(2010YBB127),教育部人文 社科基金(1 1YJA630124) ,湖南省金融工程与金融管理研究中心 2010 年度开放基金课题(10FEFM0 2) 。 Copyright © 2012 Hanspub 1 动态信用评分的模型与方法综述 信用评分是运用数学优化理论(包括统计方法、运筹方 法等),依照既定原则或策 略(损失最小原 则或风险 溢 价原则),利用客户的申请资料区分不同违约率水平客 户的方法。根据客户的信用分数,授信者可以分析客 户按时还款的可能性。事实上,可以用于信用评分的 信息有两部分,一是申请客户的个人社会信息,二是 客户的还款和交易信息。目前绝大多数的信用评分是 根据申请客户的个人社会信息进行,也就是所谓的静 态评分,由于没有充分利用已有信息,必然导致评分 不准确。由于评分依据客户的动态信息,相对于根据 客户申请资料的动态评分,我们称之为动态信用评分 (Dynamic Credit Scoring),它包含了行为评分(Behavior Scori ng)、赢利评分(Profit Scoring)盈利和其它反映客 户动态信息的评分方法。描述行为的信息一般是客户 一段时间内(一般是 6~12 个月)的交易记录,常用的变 量包括账户余额(levels of balance)的均值 、最 小 值 、最 大值、中值,还款次数(credit turnover)、逾期次数(debit turnover)等。有些模型也包 含了客户的个 人特征。 动 态信用评分根据客户的申请资料和交易记录(repayment and ordering history)预测客户的未来表现。贷方可以 依据动态信用评分结果决定客户的信用额、是否派送 新产品以及客户账户情况欠佳时如何挽回损失。 尽管发达国家建立了较为完备信用评价体系,但 是因信用而产生的经济损失问题却时有发生,例如, 2004年,美国信用卡因欺诈造成的损失约 7亿美元, 2009年美国信用卡危机导致信贷损失超过 700 亿。近 年来,随着我国经济的飞速发展,住房按揭、汽车贷 款、信用卡等信用消费日益增加,个人信用评分的重 要性日益加强。消费信贷是银行业的重要收入来源, 1997 年我国的消费信贷总额仅 172 亿元,到 2005 年 达到 2.2 万亿元,扩大了 128倍。我国消费信贷业务 发展迅速,并呈加速度增长态势,特别是 2007 年, 我国商业银行个人消费信贷较 2006 年增长近 4倍。 到2010年11 月我国消费信贷余额为 73,774 亿元,是 1997年的 400 多倍。银行必须准确评价顾客的偿还能 力,否则会给银行业带来很大的风险。 目前,我国正在积极推进巴塞尔新资本协议(the Basel 2 accord)的实施,并颁布了《新资本协议实施指 导意见》,要求大型商业银行(开行、工中建交、招行 和浦发行),从 2010 年底起开始实施新协议,其他自 愿实施新资本协议的商业银行可以从 2011 年后提出 申请。我国银行尤其缺乏对信用风险进行量化的分析 能力,缺乏适合中国国情的信用风险量化分析模型, 这对于我国商业银行在国际上的竞争地位是不利的。 因此,建立新型的风险管理和评定体系、尽快着手采 集数据和建立模型工作已迫在眉睫。信用评分是建立 新型风险管理体系,保障银行业务运作健康流畅的基 础性工作之一。我国在信用评价方面远远滞后于发达 国家,在银行新型商业模式、新型风险维度下,银行 业机遇与风险同在,那么,如何抓住机遇,规避风险 呢? 为了更准确地评估消费者的信用风险,提高银行 的信用风险管理水平,开展动态信用评分势在必行。 事实上,信贷机构正是根据客户的行为来制定信用合 约的[1,2]。目前国内仅是尚立红、黄立平简单评述了行 为评分[3],周宗放等从数学角度构建了多维动态信用 评估的信用状态空间结构[4]。本文回顾了动态信用评 分的发展,介绍了 Markov 链、生存分析以及最新的 基于数据挖掘的动态信用评分方法,同时分析了它们 的特点。分析了国内实行动态信用评分的困难和挑 战,展望了国内实施动态信用评分的前景。 2. 动态信用评分是信用评分发展的 必然趋势 二十世纪四十年代末,美国一些银行开始信用评 分的试验,六十年代末信用卡的出现使银行和信用卡 发行机构意识到信用评分的重要作用,七十年代《平 等信用机会法》(the Equal Credit Opportunity Acts, ECOA, 1975, 1976)的实施使信用评分在美国被完全接 受。信用评分也从最早单凭经验的方法(Rule of thumb) 如“3C”、“5C”、“5P”、“LAPP”等,发展到基于统 计学和运筹学的贝叶斯判别、线性判别分析(LDA)、 Logistic 回归、递归判别、分类回归树(CART)、多元 自适应样条回归、非参数方法、数学规划方法等,近 年来随着计算机和人工智能的发展,涌现出了很多基 于数据挖掘和人工智能的信用评分方法如聚类分析、 粗糙集、近邻方法、神经网络、支持向量机、专家系 统等[5-8]。各种方法各有利弊,就相对精度来说,支持 大样本的神经网络方法和支持小样本的支持向量机 方法效果较好,并且不需要统计假设。为了提高评分 准确率,学者们还提出来大量的混合方法,在这里不 一一列举。金融机构和企业在信用风险评估方面投入 Copyright © 2012 Hanspub 2 动态信用评分的模型与方法综述 了大量的人力和财力,开发出了一些较为成功的信用 评分系统如 KMV 模型、CreditMetricsTM、CreditRisk+ 等[9-11]。发达国家还有专门从事信用评分的中介机构 (如Experian、Equifax、Transunion)和信用评分公司(如 FairIsaac)。这些国际权威的评分机构采用了定性分析 和定量分析的方法,但是以定性分析为主,定量分析 为定性分析服务,不可避免带有一定的主观性。 由于个人信用的动态变化、银行评分目的的转 变,静态评分模型已经不能满足要求,有必要研究和 实施动态信用评分方法。 2.1. 个人信用动态变化 个人信用评分本质上是在表述一个人的违约概 率,但利用个人的申请资料得到的评分是一个静态 的、对个人信用情况的一个基本判断,只适用于对其 第一次进行信用消费的申请进行判断。但得到信用消 费许可后,个人的信用情况会不断变化,这时就要求 对其信用消费行为进行跟踪,不断追加新信息,并据 此得到动态的信用评分。动态信用评分对人信用度的 评估要比仅依靠申请资料得出的评估结果准确得多, 并且可以预防信用欺诈行为。 我国正处在经济高速发展的阶段,人群特征变化 很快。经济环境、人口结构和生活方式的变化会导致 潜在信用消费人群和信用观念的改变,使得样本人群 的范围和特质发生变化,使原有评价结果与现实情况 不符,因此需要及时调整。如美国花旗银行注重申请 人的住所信息,中国一些银行注重申请人的婚姻状 况、健康状况、文化程度等,这些因素会发生变化, 尤其是住所、婚姻状况、健康状况。基于模型的实证 研究也表明这些因素确实在个人信用评分中起重要 作用[5]。收入对个人的信用也有影响,对于自由职业 者,收入可能会突然变动。动态信用评分还可以通过 一定时期的数据,对捏造申请资料的客户进行识别。 宏观经济运行的周期性影响消费者的收入水平, 从而影响消费者的信用。经济衰退时,部分消费者可 能失业靠信用卡贷款维持生计,更多的可能由于工资 水平下降无力偿还欠款。经济衰退产生的风险无法通 过大数法则化解和分摊,造成银行坏帐损失普遍上 升。受经济衰退的影响,2000、2001 年美国信用卡业 平均坏帐率上升 0.72%和0.64%。 使用历史记录的动态信用评分模型有滞后性,如 用经济衰退时的交易数据建立的模型,在第二年经济 上升时对客户评分就会有偏差,反之亦然。Crook 等 分别用经济形势较好时(1989 年)和经济形势恶化时 (1989)的数据建立模型,对同一组 客户 的评分 结果 差 别显著[12]。经济形势不是影响风险行为的唯一因素, 1995~1997 年美国经济持续上升,但是客户违约也大 规模提高,Zandi 认为是银行降低了临界水平所致。 同时,Zandi 用包含领取失业救济在内的经济形势变 量进行回归分析,结果表明经济形势确实对客户违约 有显著影响[13]。最近,Sung, Sung & Ramayya也提出 经济形势衰退使信用卡客户延迟还款,Sung 对客户何 时从违规状态恢复进行了预测[14],Sung & Ramayya 预测了客户的还款模式[15]。 2.2. 银行获利的需要 九十年代以来,金融机构的经营观念已从风险最 小化转为利润最大化[5]。违约率和利润的影响因素不 同,实现利润最大化并不是重新定义客户的信用好坏 就可以实现的。影响违约率的因素有是否接受客户、 信用额、违约恢复(default recovery decision)等,而影 响利润的有市场营销、服务水平、定价等。盈利评分 意味着几乎所有的银行决策都要考虑[5]。 考虑某个客户是否能给贷方带来利润时,要用客 户的近期行为估计将来一段时期的信用水平,而不是 某个时刻。盈利评分模型要能够预测客户的动态分值 或拖欠状态,也要对客户贷款资产组合有多大程度会 违约进行估计,以便进行信贷损失准备(debt-pro- visioning),即准备多少资金来弥补预期损失。 动态信用评分的产品违约评分,即利用客户对某 个贷款产品的反映对信贷产品(loan product)评分。客 户对某个信贷产品的履行情况是他对另一种产品违 约的指示器,这一点最近已经被广泛接受。这是因为 客户的收支往来账户或支票账户情况是其经济状态 的反映,账户的情况可以较好的预测其贷款是否能及 时归还。 在积极推行《巴塞尔新资本协议》的背景下,银 行业务流程运作,要求银行采用自己的模型计量交易 对手信用风险敞口,对流动性较差的产品和交易账的 信用风险进行评估,以确保银行获利。那么,运用动 态的信用评分方法是新型风险维度下银行业务运作 响应市场需求的必要举措。通过对比和实证研究, Copyright © 2012 Hanspub 3 动态信用评分的模型与方法综述 Finlay 认为客户的连续金融行为模型优于和客户是否 违约的二元模型,并把信用评分函数判断最优盈利分 布[16]。 3. 态信用评分模型的应用领域 动态信用评分针对现有客户,利用其动态信息评 估违约风险,为银行决策提供参考,是一个后端决策 过程。动态信用评分的主要应用是: 确定信用额:根据客户信息的动态变化,确定给 予客户多大的信用额度银行能够获得最大利润。对信 用良好的客户,提高信用额度,鼓励他们使用;如果 客户信用下降,银行就降低客户的信用额度,避免造 成拖欠还款或违约给银行带来损失。 欠款催收:动态评分模型能够预测客户的违约时 间,如生存分析,当某客户有较高的风险或将要违约 时,采取强化催收措施。经验表明早期的干预能够有 效地使拖欠最小化,同时也能减少真正变成坏账的账 户及其带来的损失。 欺诈识别:欺诈行为是给银行带来损失最大的。 通过与以往欺诈经验中类同模式的比较来辨别欺骗 性的账户,并在出现与正常模式发生偏离的行为时发 出警告。消费者的欺骗行为也可能是宣布破产的前 兆,在客户宣布破产之前采取取消或转移资产等方法 是银行应对欺骗性破产的常用措施。客户的申请资料 和信用历史记录可以用于预测和分析欺诈行为。 促销:通过动态评分,发现对本银行高度偏好的 客户、高贡献客户群、对本银行其它金融商品感兴趣 的客户,对某特定商品具有高消费可能性的客户,根 据他们的特点决定是否推荐其它信贷产品。 4. 早期的动态信用评分模型 动态信用评分事实上从 1956年FairIsaac 公司成 立时就已经产生,FairIsaac 公司的FICO 评分法就是 动态信用评分法,主要对个人的支付记录、信贷欠款 额、立信时间、新开信用账户情况、信用组合类型等 五个因素进行评分。美国三大信用评估机构都使用 FICO 评分法,该方法先确定刻画客户的信用、品德 以及支付能力的指标,再把各个指标分成若干个档 次,给出各个档次的得分,然后计算每个指标的加权, 最后得出客户的总得分。但是 FICO 评分法对主要影 响因素分配权重,其适用性和适用范围有待商榷,另 外,评分因素的选取不一定适合中国国情。 尽管动态信用评分已有几十年的历史,但是相应 的模型和文献都很少,其原因可能是:1) 一开始金融 机构只考虑是否批准申请要求,没有考虑应该给予申 请者多大的信用额和他是否能带来利润;2) 需要一段 时间的历史数据建立动态信用评分模型,应用模型时 的样本和建立时可能已经有很大差别了;3) 客户的消 费记录的保密性使得科研人员无法进行实证研究。 早期的动态信用评分模型除 FICO 评分法以外, 其它的模型基本上是在静态模型中加入描述行为的 变量,在此我们不作详细说明,感兴趣的可以参考静 态评分模型的方法[3,4,7]。另外,尽管 1962 年Cyert 等 就提出了 Markov 链模型[17],随后又有学者进行了补 充和完善,但是直到 1994 年Thomas 推广为 Markov 决策过程[18],才用于确定客户信用额,因此我们在下 一节进行讨论。 5. 九十年代动态信用评分模型的发展 20 世纪九十年代动态信用评分应该说取得了很大 进展,Thomas 提出了 Markov 决策过程方法[18],Narain 提出生存分析模型[19]。Thomas等详细讨论了这两个模 型的应用,并比较了消费者和公司的信用风险评估[20], Hopper和Lewis 详细论述了行为评分系统的实际应用 和如何引入新的系统[21]。直到现在,这些方法仍被用 于解决行为评分的新问题。 5.1. Markov链模型 动态信用评分的 Markov链模型最早由 Cyert等提 出[17],Thomas 等(1994)把它推广为确定透支额的 Markov决策过程[18]。 假定客户的账户状态由变量 描述 ,这 里b是账户未清款项(balance outstanding on the ac- count ) ,n上次还款后的期数,i表示其它相关信息。 Markov 决策过程是通过确定恰当的信用额 L,使贷方 在n期内获得最大利润。如果客户的信用额为 L, ,,ubni , L p uu 表示账户状态从 u转到 u的概率,其值通过 估算得出。客户在信用额为 L,账户的状态为 u时, 贷方获得利润 L ru。若客户下期还款 a的概率为 , L tua,下期透支 o的概率为 ,客户信息变 为i , L quo 的概率为 , L wui 。转换概率定义如下: 若boa L , , 0a Copyright © 2012 Hanspub 4 动态信用评分的模型与方法综述 ,,; ,0, L p bniboa i ,,, LL L tuaquowui 若 , 0a ,,; ,0, , ,,0,0 L LL LL oLba pbnibai tuawuiququ 若 , boL ,,;, 1,,0,, LLLL p bnibonituquowui 否则 ,,;, 1, ,0 ,,0,0 L LL LL oLba pbnibon i tuwuiququ 如果某交易中贷方可以获利的比例为 f,超过N期不 归还就注销该笔坏帐,盈利函数为: ,,, ,01 LLL rbnifoquo btunN 这里 10 0 x x 若 否则 这样,在给定客户的账户状态为 u的情况下,n期内 贷方为获取最大利润应给与借方的信用额 L可以通过 求解如下标准动态规划得到: 1 max , LL nL n u Vur up uuVu (1) Markov 链模型的两个关键假设是 1) 状态空间描 述了客户的不同状态,2) 客户的行为服从Markov 过 程。第二个 假设使 得我们 可 以用一个简单的随机模型 计算从每个客户获得的期望收益。 Markov 链较多用于 描述客户的贷款拖欠状态。对所有的客户假定服从同 一个 Markov 过程太严格,因此产生了对客户细分和 详细定义客户状态的策略,以提高 Markov 性。但是 由于转移概率受账户的立信时间、时间段(the time period)以及外部经济条件的影响, 转移 概率是不稳定 的。 近几年 Markov 链已被信贷机构用于开发巴塞尔 协议下的信用风险评估,Malik 和Thomas 用累积 Logistic 回归估计 Markov 链的转移概率,基于 Markov 链模型的行为评分来评价客户贷款组合的信 用风险。 对于 Markov 链的状态转移,Malik 和Thomas 讨论了 上一状态和当前状态对后续状态的影响,建议使用二 阶Markov 链[22]。 5.2. 生存分析 Markov链描述了客户的一系列动态违约状 态,而 生存分析是估计客户违约的时间。Narain 是最早提出 生存分析的学者之一, Stepanova 和Thomas[23,24]、Hand 和Kelley[25]发展了这些思想,提出了建立生存分析记 分卡,并用于动态评分。 令T某项贷款从现在到违约 时刻的时间,生存分 析一般用如下三种标准形式描述 T的随机性:生存函 数(Survival Function): StPT t ,这里 F t 1St是分布函数密度函数 f t: P tTt tftt 风险函数(Hazard Function): htf tSt ht t PtT ttTt 生存分析的目的是找到申请人特征和申请人行 为特征和违约时间概率之间的联系,模型有比例风险 模型(Proportional hazard models)和加速寿命模型 (accelerated life models)。若解释变量 , 12 ,, , p xxx x 是参数,加速寿命模型为: 0exp T St Sx (2) 或者 0 exp exp T htxh x T (3) 这里 和是相应的基准函数(baseline function),这 样x可以加速或减缓账户的 老化程度 。比例风险模型 为: 0 S0 h 0 exp T htxht (4) 两种模型中最常用的分布是指数分布和 Weibull 分布, 相应的分布函数、密度函数、机会函数分别为 1exp F tt 、 exp f tt 、 ht 和 1exp F tt 、 1exp kk f tkt t 、 1kk htk t 。两个模型的差别在于,在比例风险模 型中某时刻有违约风险的客户,在加速寿命模型中在 其它时刻有违约风险。 对比例风险模型,Cox 给出了不需要预先知道 0 ht的形式估计参数 的方法[26]。若客户 i在时刻 违约, i t R i表示在 有违约风险但仍在交易的客户 i t Copyright © 2012 Hanspub 5 动态信用评分的模型与方法综述 数,则客户在时刻 违约的条件概率为: xi i t 0 0 () () exp exp exp xi exp T i TT kRikRi h txi xk hxk T i t ,, (5) 生存分析的优点在于:1) 易于处理经过检查 的数 据,即客户在违约前由于各种原因不再借款(如 还款、 死亡、从别处贷款等);2) 动态信用评分要选择一个 固定时期来度量模型的满意度,具有不稳定 性,生存 分析避免了这一点; 3) 估计违约时间是计算 一个申请 者能带来多少利润的关键步骤; 4) 易于把经济形势变 量结合到评分系统。 生存分析方法在对交通工具、设备和人类的生命 估计中有成功的应用。在信用评分中,比例风险模型 假定客户是违约还是提前还款的相对等级是 固定的, 通过引入依赖于时间的特征可以克服这一缺 点。加速 寿命模型必须事先假定基准函数的分布。近年来生存 分析模型又引起学者的兴趣, Sung & Ramayya、Sung 把生存分析和其它方法结合起来预测信用卡违约客 户的还款方式[14,15]。Gandy 通过基于违约率的滑动窗 口和累积和图,建立了生存分析累积和图监 测信用 组 合的绩效[27]。 6. 新世纪动态信用评分模型的发展 随着计算机和人工智能的发展,数据挖掘技术也 被应用于动态信用评分。Shi 等基于数据挖掘技术扩 展了线性规划模型,提出了对现实信用数据 分类的 多 准则线性规划(multiple criteria linear programming, MCLP)[28]。Hsieh、Lin 和Sohn 分别提出了基于数据 挖掘的动态信用评分模型[29,30],两者都是先进 行聚类, 然后分别对各类建立分类器。 Lin 把logistic 回归和神 经网络结合,提出了双重模型评 分系 统(dual-model scoring system),该方法类似于静态评分的混合方法[31], Nie 等用logistic回归和决策树对信用卡休眠(credit card churn)进行预测[32],在这里不在详细介绍。这也 是目前笔者看到的仅有的基于数据挖掘的建立动态 信用评分模型的文献。 6.1. 多准则线性规划 对给定的 n个样本的数据,每个客户的特征由 r 个变 量描述,,关于 这些变量的一个记录, 。为把客户分成 “好”、“坏”两类(分别用 G、B表示),要确定系数 向量 1r aa a 1, 2i 1,, ii ir AA A ,n, 1,,r XXX i ,分类规则是: A Xb i A B 和i A Xb i A D (6) 线性系统通常通过使观测点到临界值的最小距离最 大化(maximize the minimum distances, MMD)和观测 点离临界值的偏离距离之和最大化(minimize the sum of the deviations, MSD)两个直观目标达到最优分类。 目前还没有用线性规划方法对现实数据的研究的文 献。在线性判别的基础上,Shiyong等提出了对现实 信用数据分类的多准则线性规划(multiple criteria lin- ear programming)。一般情况下,线性方 法把两 类数据 完全分开是不可能的。如果 i A 被误分为另一类,令 i A 到i A Xb 的距离为 i ,对所有 i A , 是重叠边界到 i A Xb 的距离最大值; , i 是到调整的分类线 i AX b 的距离。假定 i i 、i * 的理想值分 别为 、,若 *0 *0 i i ,定义后悔值 * i i d ,否则 0d ;若 * i i ,定 义后悔值 * i i d ,否则。同样定义0d d 和d ,得到 MCLP 模型: ** ** , , i i iiii iiii dddd dd dd min .. st A Xb AG A Xb AB (7) 这里 i A ,* ,* 是给定的, 。 ,,,,,0 ii dddd 在对美国银行的信用数据的数值实验表明, MCLP 评分得到了满意的效果,并且可以进行三类 划 分。 6.2. 综合数据挖掘信用评分模型 Hsieh 的模型包括两个阶段,第一阶段采用了无 监督的神经网络学习算法–自组织图(self-organizing map),利用客户以前的偿还记录和RMF( Recency、 Frequency、Monetary)预估 器(predicator)作为输入变 量,把客户分成带来利润的主要三类:循环用户 (revolver user)、交易用户(transactor user)和便利用户 (convenience user)。客户评分的表达式为: 1234 ,, SOM ppp pbsf (8) 这里 bs 是客户的信用分值, 是相应的四, 1,2,3,4 i pi Copyright © 2012 Hanspub 6 动态信用评分的模型与方法综述 个评估器。第二阶段用关联规则挖掘数据库 的隐含 模 式,从而获知不同客户 的不 同特征之 间联系,为银行 提供策略。在第一阶段聚类的基础上,得到各类客户 的初始特征,用神经网络的敏感性分析确定 变量的 相 对重要性,选出的重要变量用于关联分析。关联分析 用于在交易数据库中经常发生的项目或特征之间的 显著关系[29]。 6.3. 基于聚类的动态信用评分 为使贷方及早预知借方的信用,Lim 和Sohn 建 立了适应贷款发生后贷方特征动态变化的评分模型 [30]。Lim 和Sohn 的模型包 括定义变 量、数据聚类、 观测区间细分、变量选择、分类模型建立五 个阶段。 模型使用的变量包括申请资料和行为变量;聚类阶段 根据申请人的基本特征利用 均值聚类方法把客户 聚为 k类;观测区间 T被细分为 n个区间,申请者可 使用的观测时长为 t时,选择第j个子区间: k 0 2 1 1 T tn TT t jn TT nntn nn 若 若 若 n (9) 变量选择阶段用后向 logistic 回归删除多余变量;最 后,利用选出的变量,分别用神经网络训练得到 kj 个分类器。对某个客户,如果属于第 i类,观测区间 为第 j个子区间,采用相应的分类器 进行评分。 ij C 基于数据挖掘的方法的优势是以数据驱动 (data-driven)的,不需要统计 假设,但是要有大量数据 支撑。 6.4. 基于混合数据挖掘方法的动态信用评分 违约发生后,客户是否还能还款是银行最关 心的 问题。 Sung 用混合数据挖掘 方法构建 了违约客户的信 用预测模型,预测这些客户的还款模式。首先应用自 组织神经网络(SOM)把违约客户的资料聚成同质 的 类,然后采用基于 Cox 比例风险函数 的生存分析模型 违约客户的信用恢复的时间。 Sung & Ra ma y ya对信用 卡债务的还款方式进行了研究[15],Sung 的方法类似, 预测了各类违约客户的还款模式,并给出了相应的风 险管理措施[14]。 7. 动态信用评分展望 个人消费信贷业务往往每笔金额不大而笔数繁 多,商业银行审查时费时费力,同时,各家银行对消 费者的审查标准把握不一,也不利于控制风 险。面对 日益复杂多变的经济、金融和市场环境以及 国际化 进 程的推进,信用评分必将越来越受重视。目前国内四 大国有商业银行上市、人民银行的个人信用 数据库 的 联网,将对我国的信用评分发展起到积极的 推动。 有效的信用评估必然具有多维度和动态的特 征, 具有较明显的时效性[2]。因此当前对信用主体进行多 维度、动态 的信用 状态评 估 研究具有十分重要的理论 和实践意义,也必将是信用风险管理研究和 关注的 热 点问题之一。 建立消费者个人信用评级制度在我国的部分地 区已有一些实质进展,像上海、深圳等地的消费者个 人信用档案建设已初具雏形。2002 年12 月2日,上 海资信有些公司推出了全国首个个人信用评 分体系, 2006 年1月,个人信用信息 基础数据 库已在 全国正 式 运行,这对个人信用评分提供了有利条件。 为了加强我国信用风险管理,尽快与国际接 轨, 积极推进巴塞尔新资本协议的实施,当前最紧迫的任 务是积极研究探索,借鉴国际上比较成熟的模式,建 立起符合我国实际情况的内部评级体系和基于内部 评级的信用风险管理系统。对动态信用评分的研究要 尽快展开,笔者认为当前要从以下几个方面 入手: 1) 目前我国商业银行主要是参考国外的信用评 分方法,各自建立评分体系过于注重职业、收入、抵 押和担保,没有关注账户动态信息。由于我国的动态 信用评分方法研究还没有展开,暂时应基于 FICO 评 分体系,综合使用个人储蓄账户、信用卡账户和个人 贷款业务信息,制定统一的评分体系。 2) 开展动态信用评分模型研究,本文介绍的 Markov 链和生存分析方法可以为目前金融机构银行 等金融机构建立内部风险评价体系的理论模 型,进一 步探索适合我国具体情况的模型。 3) 由于信用数据的飞速增长,基于数据挖掘的动 态信用评分方法是必然发展趋势。而且先进的风险评 估体系都需要坚实的数据支撑。因此我国应全方位采 集信息,建立独立的信息采集机构。 Copyright © 2012 Hanspub 7 动态信用评分的模型与方法综述 Copyright © 2012 Hanspub 8 4) 最后是完善个人信用法律。我国现行法律体系 涉及个人信用方面的规定较少,少数相关的法律与个 人信用衔接不够,针对性不强。 2001 年深圳市以政府 规章的形式出台了中国第一个个人信用立法《深圳市 个人信用征信及信用评级管理办法》;2003 年后上海 市出台了《上海市个人信用征信管理试行办法》; 2005 年8月人民银行发布了《 中 国人民银行个人信用信息 基础数据库管理暂行办法》,这些法律和规定对防范 和降低商业银行的信用风险、促进个人信贷业务的发 展、保障个 人信用 信息的 安 全和合法使用起到了积极 作用,但还 缺乏信 用行业 服 务规范以及对失信惩戒等 方面的法律规定。 参考文献 (References) [1] P. Hei dh u es, B. Koszegi . Exp loit in g naï vete a b out self-con t rol i n th e credit market. America n Econ omic Revi ew, 201 0, 12 : 2279 - 2303. [2] D. V. Stefan o, M. Ulrik e. Contra ct design and self-cont rol: The- ory and evidence. Quarterly Journal of Economics, 119(2): 353- 403. [3] 尚立红, 黄立平. 消费信贷中的行为评分研究[J]. 山东理工 大学学报(社会科学版), 2004, 20(4): 15-17. [4] 周宗放, 陈林, 唐小我. 多维动态信用评估的信用状态空间 结构研究[J]. 系统工程理论与实践, 20 07, 4: 1- 8. [5] L. C. Thoma s. A survey of credi t and b ehaviou ral scorin g: Fore- casting financial risk of lending to consumers. International Journal of Forecasting, 2000, 16(2): 149-172. [6] J. N. Crook, D. B. Edelman and L. C. Thomas. Recent develop- ment in consumer credit risk assessment. European Journal of Operational Research, 2007, 183(3): 1447-1465. [7] 郭仌, 梁世栋, 方兆本. 消费者信用评估分析综述[J]. 系统 工程, 2001, 19(6): 9-15. [8] C. L. Hu ang, M. C. Chen an d C. J. Wa ng. Cred it scorin g with a data mining approach based on support vector machines. Expert Systems with Applications, 2007, 33(4): 847-856. [9] B. Hammond. Repair your own credit. Pompton Plains: Career Press, 2000. [10] A. Graham. Corporate credit analysis. Chicago: Glenlake Pub- lishing Company Limite, 2000. [11] J. B. Caouette, E. I. Altman and P. Narayanan. Managing credit risk: The next great financial challenge. New York: John Wiley & Sons, 1998. [12] J. N. Crook, R. Hami lton and L. C. Thoma s. The degradat ion of the scorecard over the business cycle. IMA Journal of Mathe- matics Applied in Business and Industry, 1992, 4(4): 111-123. [13] M. Zandi. Incorporating economic information into credit risk underwriting. In: E. Mays, Ed., Credit Risk Modeling, Chicago: Glenlake Publishing, 1998: 155-168. [14] S. H. Ha. Behavioral assessment of recoverable credit of re- tailer’s customers. Information Sciences, 2010, 180(19): 3703- 3717. [15] S. H. Ha, R. Krishnan. Predicting repayment of the credit card debt. Computers & Operations Research, 2012, 39(4): 765-773. [16] S. Finlay. Credit scoring for profitability objectives. European Journal of Operational Resear ch, 2010, 202(2): 528 -53 7. [17] R. M. Cyert, H. J. Davidson and G. L. Th ompson. E stimati on of allowance for doubtful accounts by Markov chains. Manage- ment Science, 1962, 8(3): 287-303. [18] L. C. Thomas. Applications and solution algorithms for dynamic progra mming. Bulletin of the IMA, 1994 , 30(2): 116-122. [19] B. Nar ain. S urvi val an alysi s and the cred it gran tin g deci sion. In: L. C. Thomas, J. N. Crook and D. B. Edelman, Eds., Credit Scoring and Credit Control, Oxford: Oxford University Press, 1992: 109-122. [20] L. C. Thomas, J. Ho and W. T. Scherer. Time will tell: Behav- ioural scoring and the dynamics of consumer credit assessment. IMA Journal of Management Mathematics, 2001, 12(1): 89-103. [21] M. A. Hopper, E. M. Lewis. Behaviour scoring and adaptive control systems. In: L. C. Thomas, J. N. Crook and D. B. Edel- man, Eds., Credit Scoring and Credit Control, Oxford: Oxford University Press, 1992: 257-276. [22] M . Malik, L. C. Th omas. Transi tion mat rix mod els of con sumer credit ratings. International Journal of Forecasting, 2012, 28(1): 261-272. [23] M. Stepanova, L. C. Thomas. PHAB scores: Proportional haz- ards analysis behavioural scores. Journal of Operational Re- search Society, 2001, 52(9): 1007 -10 16. [24] M. Stepanova, L. C. Thomas. Survival analysis methods for person al loan data. Operati on research, 2002, 50(2): 277-289. [25] D. J. Hand, M. G. Kelley. Lookahead scorecards for new fixed term credit products. Journal of Operational Research Society, 2001, 52(9): 989-996. [26] D. R. Cox. Regression models and life-tables (with discussion). Journal of Royal Statistical Society, Series B, 1972, 74: 187-220. [27] A. Gandy. Performance monitoring of credit portfolios using survival analysis. International Journal of Forecasting, 2012, 28 (1): 139-144. [28] Y. Shi, Y. Peng, W. X. Xu and X. W. Tang. Data mining via mult iple c riteri a lin ear pr ogrammin g: Appli ca tions in cred it card portfolio management. International Journal of Information Tech- nology & decision making, 2002, 1(1): 131-151. [29] N. C. Hsieh. An integrated data mining and behavioral scoring model for analyzing bank customers. Expert Systems with Ap- plications, 2004, 27(4): 623-633. [30] M. K. Lim, S. Y. Sohn. Cluster-based dynamic scoring model. Expert Systems with Applications, 2007, 32(2): 427-431. [31] Y. C. Lin. Improvement on behavior scores by dual-model scor- ing system. International Journal of Information Technology & Decision Making, 2002, 1(1): 153-164. [32] G. Nie, W. Rowe, L. Zhang. et al. Credit card churn forecasting by logistic regression and decision tree. Expert Systems with Appli cation s, 20 11, 38(12): 15273-15285. |