个人信用评分研究及其发展.docx
个人信用评分研究及其发展摘要: 个人信用评分从类型上看主要分为申请评分、行为评分、利润评分以及考虑经济环境因素的信用评分。如何能在获取更大利润的同时将消费者信用风险控制在最小程度成为各授信机构和学术界当前研究的重点。关键词:信用评分;申请评分;行为评分;利润评分;经济环境中图分类号:文献标识码:文章编号:1003-949X-06-01-03个人信用评分研究从技术层次上来讲,主要经历了三个阶段,从简单的分类模型到预测评分模型,再到决策评分模型。而从评分的类型上看,主要分为四个类型,即申请评分、行为评分、利润评分以及考虑经济环境因素的信用评分。一、申请评分(Application Scoring)授信机构接受客户信用申请时,利用客户提交的申请表中的特征变量建立评分模型得到申请者的一个信用值,将该值与事先设定的标准值相比,判断该申请人逾期的可能性,从而决定是否授出信用及授信额度。这样的信用评分,称为申请评分。建立评分模型可以运用的方法非常多,传统统计学方法有判别分析、线性回归、Logistic回归等;非参数方法有最近邻方法等;运筹学方面则主要采用线性规划方法。随着信息技术的发展,近年来许多数据挖掘的新方法如神经网络、决策树、遗传算法、专家系统等陆续被引入信用评分领域中。Durand(1941)首先将判别分析方法用于信用评分,正式系统的提出使用数理统计模型辅助消费者授信决策的观念,并将Fisher提出的判别分析法用来区分“好”的贷款和“坏”的贷款,从而对贷款的信用风险进行评价,这是个人信用评估从定性分析逐步过渡到定量分析的开端。1958年William Fair & Earl Isaacs利用判别分析法建立了着名的FICO信用评分系统。Myers & Forgy(1963)采用判别分析和回归分析方法,利用零售信贷领域消费者信用申请表中的数据对财务公司的信用风险进行了预测。 Orgler(1970)首次将线性回归分析引入消费者贷款的信用风险评估,利用线性回归分析设计了一个评价未偿还贷款的评分卡。Fitzpatrick(1976) 、Lucas(1992)、Henley(1995)等也先后将这种方法用于构建个人信用评分模型。Myers & Forgy(1963)认为这两种方法对于降低商业银行等机构的坏账损失有很大的帮助。Reichert (1983)也发现运用这两种方法构建的个人信用评分模型在预测消费信贷风险时都表现出了很强的稳健性。Rosenberg & Gleit(1994)在他们的研究中也表示了与Reichert相似的赞同观点。但Eisenbeis (1977)认为只有在客户分类较少的时候,基于判别分析和多元线性回归方法建立的个人信用评分模型才会有好的效果。Wiginton(1980)首次尝试了在信用评分模型中使用Logistic回归方法,并与判别分析法进行了比较。但由于Logistic回归法没有变量正态性假设的要求,因此被学者认为是最适合发展信用评分模型的理论。并且由于该法使用的前提假设少,建立的个人信用评分模型具有相当的准确性和稳定性,因此成为了设计个人信用评分模型的主要方法,并且延续至今。最近邻分析方法最先是由Fix & Hodges(1952)提出的,它是一种标准的非参数分类技术,通常被用来解决概率密度函数的估计和分类问题。它的思想很简单,就是把预测目标分为两类,当一个新的预测目标加入时,就将其并入最邻近一类中。Chatterjee & Barcun(1970)首次将最近邻法用于个人信用评分模型。Hand(1981)利用家庭贷款的数据对最近邻法与决策树进行了比较,结果最近邻法得到了相当高的预测精度。Mangasarian(1965)第一个意识到可以将线性规划方法应用于分类问题。但是直到Freed & Glover( 1981a ,b)的文章发表以后,才引起了更多人的兴趣。此后,有关的研究文献大量涌现。Joachimsthaler & Stam(1990)就这一领域的70多篇文献进行了综述。有些学者则对统计学方法与线性规划方法的效果进行了比较,尽管在Nath ,Jackson & Jones(1992)的研究中认为统计学方法要比线性规划方法好。1990年Odom(1990) 首次将神经网络方法引入信用风险评估中。Desai等(1996,1997)、West(2000) 等人使用神经网络方法构造了个人信用评分模型,并通过实证分析验证了在各种特征变量呈复杂的非线性关系的情况下,神经网络方法具有明显的优势。决策树方法,也叫分类树或递归分割法,通过使用一种分割方法,将原始样本集递归分割成不相交的子集,目的是使期望损失达到最小。最早将决策树方法用于信用评分的研究是Makowski(1985)。 Coffman(1986)将决策树方法与判别分析方法进行了比较,发现当变量存在相关性时,决策树方法的表现较好。Carter & Catlett(1987) , Mehta(1988)等把这一方法应用到信用评分领域。遗传算法是对一个问题的潜在解的种群进行系统的搜索,使得与解决问题相近的解保留在候选解中的可能性比其他解要大。遗传算法最早是由Holland(1975) 提出的。Albright(1994)首次将遗传算法应用于信用联盟评分卡的开发。Michalewicz(1996)提出了一些启发性的规则, Yobas, Crook, & Ross (1997)运用遗传算法并使用一个不同的函数对建立信用评分模型作了探讨。专家系统是仿效专家的决策行为的过程的集合,它由自然语言组成,将专家的意见汇入计算机中,专家系统能够提高预测“坏”客户的准确性。主要的研究有Zocco(1985) , Davis(1987) , Leonard(l993a,b)、 Tessmer & Richey(1997) 等。Davis, Edelman & Gammerman (1992) 将Bayesian专家系统用于信用卡申请者的分类问题,并将结果与神经网络方法的结果进行了比较。Talebzadeh, Mandutianu & Winner (1994)依据专家系统设计出了抵押贷款的个人信用评分模型。Leonard (1993)则利用专家系统成功预测了信用卡用户的违约率。Hand, Mcconway, & Stanghellini(1997), Sewart & Whittaker(1998)等则论述了运用绘图的方法可以更容易确定个人信用风险的全部因素。二、行为评分(behavioral scoring)一般信用评分模式只考虑申请者本身的条件是否良好,未考虑外在环境变化。行为评分是一种统计专门技术,它是在一般信用评分的基础上考虑到时间因素发展而来的。研究的主要目标是通过预测现有授信客户的未来行为帮助借贷机构在管理客户时作出更好的决策。行为评分模型主要分为两种方法,一种是申请评分模型和额外信息变量的组合,另一种是建立客户行为的概率模型。根据估计参数信息的获取方式不同,后一种方法又分为两类,一是从以前的客户中抽样,二是使用贝叶斯方法,即根据顾客自己的行为更新公司对客户的信任度。概率模型本质上是马尔可夫链,顾客可以从一个状态跳到另一个状态。有关第一类行为评分的研究有:Cyert, Davidson & Thompson(1962) 用马尔柯夫链方法研究在贷款到期以后的不同时期,预计不可回收的贷款数目(C-D-T模型)。后来不少学者对C-D-T模型进行了修正。Van Kuelen et al. (1981)的主要修正在于考虑了过期账户的部分还款事实。Corcoran (1978)指出如果对于不同特征的账户给出不同的转移矩阵,系统将会更加稳定。Fryman et al. (1985)区分了移动者(movers)和停留者(stayers)这两种客户类型,发现后者更倾向于维持现有状态。Banasik et al. (1996)的研究指出如果对客户群体的分类不是足够清晰,在实际应用中得到的信用评分并不十分有效。关于第二类行为评分的研究,最早基于Bayesian定理的概率模型是Bierman & Hausman( 1970)提出的。这一模型中,还款概率不是根据以前客户的样本得出的,而是被看作一个参数满足Beta分布的Bernoulli随机变量。Dirickx & Wakeman(1976)以及Srinivasan & Kim (1987)分别对该模型做了扩展。Thomas (1994)将这一模型进行了修正,他不仅把还款概率作为随机变量,还把最大可能的还款金额也作为随机变量,根据已经还款的情况,这些随机变量不断被按Bayesian方法修正。三、利润评分(profit scoring)个人信用评分模型的研究目标由客户违约率最小化向公司从该客户赚取利润最大化转变, 是国外个人信用评分模型研究的前沿之一,也是信用评分领域近几年来的研究热点。这方面正在尝试的方法大体上可以分成以下四种。第一种是在现有的评分模型上建立的,估计违约率、交易量、接受和损失的比例,并根据不同测度下的得分对总体进行细分,对不同的群体定义利润。Oliver(1993)首先使用该方法,并考察如果顾客有了“交易利润得分”和“违约得分”,那么决策规则是什么的问题。 Fishelson-Holstine(1998)讨论了运用利润的两种类型来细分顾客的问题。Li & Hand (1997)则建议不估计最终的利润,也不直接估计违约标准,而是估计中间变量,如节余、购买额等,然后使用这些因素估计最终的收入。Hand, McConway & Stanghellini(1997), Sewart & Whittaker(1998)认为应该根据违约率、交易量、接受和损失率来综合考虑利润。第二种类似于信用评分中的回归方法,把利润表达成申请表格中定性变量的线性函数。Lai & Ying(1994)进行了这方面的研究。第三种是使用马尔可夫链方法来进行行为评分,以开发出更精确的消费者行为随机模型。Cyert et al (1962)对一个产品案例的利润进行了建模分析,当这些方法用于估计相同产品的顾客群体的坏账准备金时,结果表明应用非常成功。第四种是成功地处理遗失数据的一种统计建模技术。人们试图根据有限的数据来估计消费者的长期利润。Narain (1992)是第一个建议人们在信用评分上使用该方法的学者,而Banasik et al (1999)的论文显示人们也可以使用竞争风险的思想来对消费者什么时候会违约和什么时候会预先付款进行估计,这样在一个分析中可以同时考虑违约率和流失率。Stepanova和Thomas(2001)利用PHAB模型进行行为评分研究,结果显示该模型在预测风险和预测利润两个方面都有很好的表现。Stepanova和Thomas(2002)研究了比例风险模型(即Cox模型)的三种扩展形式,研究表明该模型不论在预测风险还是在预测利润方面都非常有效。他们还提出了三个改进:在变量属性分类方面提出了coarse-classifying的分类方法;在模型拟合度的检验上提出了多个诊断方法;在数据处理上应反应其变化。Baesens, Stepanova和Vanthienen(2003)提出了几种神经网络生存模型,认为神经网络生存模型克服了比例风险模型要求输入函数形式是线性的缺点,并分别用神经网络生存模型与传统的比例风险模型的性能进行了比较。四、考虑经济环境因素的信用评分一般的信用评分模型中,都没有考虑经济环境等外在因素的影响,但经济周期等宏观经济变量无疑与客户违约率存在着密不可分的关系。随着信用评分技术方法的日益丰富以及计算机通信技术的迅猛发展,使得把经济环境因素整合到信用评分模型中成为必要和可能。其研究的主要目标是通过将经济环境变量、申请表特征变量和现有客户行为变量三者共同引入评分模型,以使得考虑的因素更充分,模型更加稳定,生命周期更长。Crook, Hamilton & Thomas( 1992)证实了当经济处于衰退期时,即使信用历史良好的顾客也会出现违约的情况。Zandi(1998)调查了美国90年代的情况,认为违约率上升的主要原因在于信用标准的降低,因为金融机构为了争取信用卡客户和国内的贷款人,调低了他们的授信界限。关于个人破产对经济变量的回归分析表明,经济状况的确对违约有显着的影响。构造同经济环境、申请表变量和消费者行为相联系的更严格的模型的一种方法是使用图形方法和贝叶斯学习网络。Sewart & Whittaker (1998)以及Hand et al (1997)指出这些技术对于检验自变量和因变量间的关系非常有用。Fung指出,使用模拟和马尔可夫的思想对信用评分的内容可以拟合得很好,由此分析可得到一个评分模型。五、结论个人信用评分的研究目标和方向一直在不断发生着变化,当前研究的重点是将风险管理目标从客户违约可能性最小化调整到如何使公司从该客户赚取的利润最大化。另外,信用评分的目的也从最初的评估违约风险,逐步扩大到评估响应、使用、保持、流失、负债管理、以及欺诈评分。这也为今后这一领域的研究指明了新的方向和道路。参考文献:1Capon, N, Credit Scoring Systems: A Critical Analysis, Journal of Marketing,1982,46:82-91SrinivasanKim, Y .H. Credit Granting: A Comparative Analysis of Classification Procedures. Journal of Finance,1987,42:665-683Hand, D. J. Discrimination and Classification. John Wiley, Chichester,1981Henley, W .E and Hand, D.k-nearest Neighbor Classifier for Assessing Consumer Credit Risk,Tire Statistician, 1996,45:77-95Desai, V. S.,Crook, J. N. and Overstreet, G. A. A Comparison of Neural Networks and Linear Scoring Models in the Credit Environment. European Journal of Operational Research,1996,95:24-37Carter, C and Catlett, J. Assessing Credit Card Applications Using Machine Learning, IEEE Expert Vol. Fall,1987:71-79Sewart, P and Whittaker, J. Graphical Models in Credit Scoring, Journal of Mathematics Applied in Business and ,9:241-266Li, .H. G,and Hand D .J. Direct Versus Indirect Credit Scoring Classifications. Proceedings of Credit Scoring and Credit Control V, Credit Research Centre, University of Edinburgh, 1997