核Fisher判别分析方法评估消费者信用风险.pdf
《核Fisher判别分析方法评估消费者信用风险.pdf》由会员分享,可在线阅读,更多相关《核Fisher判别分析方法评估消费者信用风险.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第13卷 第6期2004年12月系 统 工 程 理 论 方 法 应 用SYSTEM S EN GI N EER I N G-THEORYM ETHODOLOGY A PPL ICA T I ON SVol.13 No.6Dec.2004文章编号:100522542(2004)0620548205核Fisher判别分析方法评估消费者信用风险李建云,邱菀华(北京航空航天大学 经济管理学院,北京100083)【摘要】利用基于核函数和线性Fisher判别构建的核Fisher方法评估消费者信用风险。该方法首先通过核函数建立一个非线性映射,把原空间中的样本点投影到一个高维特征空间,然后在高维特征空间中应用
2、线性Fisher函数,把具有不同属性值的样本点判别到相应的类别。通过对个人信贷数据的研究表明,核Fisher方法可以有效地评估消费者信用风险。关键词:Fisher判别方法;核映射;信用风险;消费者信用评估中图分类号:F 830.5文献标识码:AEvaluation Consumer Credit withKernel Fisher D iscri m inant AnalysisL I J ian2yun,Q IU W an2hua(School of Econom ics andM anagement,Beijing U niv.of A eronauticsand A stronautic
3、s,Beijing 100083,China)【Abstract】In this paper kernel Fishermethod is applied to evaluate credit risk of consumer.Themethod isbased on a non2linear mapping from input space to feature space using kernel function.L inear Fisher dis2cri m inant is established in feature space,w hich corresponds to a n
4、on2linear discri m inant in input space.A ccording to the results using personal car loan data,thismethod has the value of application for forecast2ing the default and managing the credit risk.Key w ords:Fisher discri m inant;kernelmapping;credit risk;consumer credit evaluation收稿日期:2004204205修订日期:20
5、0022基金项目:国家自然科学基金项目(70372011)作者简介:李建云(19722),男,博士生。主要从事信用风险评估及应用研究。消费者信用是指一种建立在对消费者在特定的期限内付款或还款承诺信任的基础上,无须付款就可以获取商品、服务或资金的能力。根据美联储理事会的定义,消费者信用包括通过正常的商业途径发放给消费者的用于购买商品及服务等个人消费的短期及中期信贷,有时也可是为由于同样目标而出现的债务再融资而发放的信贷。近年我国在个人消费信用方面发展非常迅速,汽贷、房贷、助学贷款、大额耐用消费品等分期付款形式的贷款规模越来越大,截止2003年底,我国信用卡发放规模达3 000多万左右,信用消费方
6、式已经进入人们日常生活当中,并开始快速发展。在消费信用迅速发展的同时,呆、坏账等违约现象也浮现出来,违约风险呈逐步上升趋势。巴塞尔委员会发布的最新 信用风险管理原则要求金融机构基于风险原则管理资金。在这种情况下发展信用风险管理技术,加强信用风险分析显得尤为重要。针对消费者个人的信用风险评估目的,在于对反映消费者信用的相关信息进行分析,判断消费者的信用风险状况,为贷款、信用申请、呆账催收等提供决策依据。信用风险分析的研究对商业银行的稳健经营,保持一定的利润水平至关重要。在西方征信技术发达国家,该领域受到金融机构、信用中介机构、学者越来越多的重视。消费者信用评估是一种信用风险分析方法,是对消费者信
7、用的量化,该方法是将数学模型用于确 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.定消费者信用等级。它起源于20世纪30年代,在60年代成为热点,继传统的比例分析法后,1968年,A ltman用Fisher判别分析方法研究了企业破产问题。1974年,Ohoson把Logistic回归引入该领域。接着线性规划、非线性规划、贝叶斯决策模型、存活分析等方法先后用来评估个人信用。到了20世纪80年代,随着人工智能的发展,专家系统、神经网络、遗传算法等新技术也被应用于银行系统的贷款决策、信用评估等方面1。随着我
8、国加入W TO,经济开放程度越来越大,中小规模信贷活动在信贷总规模中所占比重将越来越大,消费者参预的信用消费活动将进一步扩大,消费者信用问题也将更加突出。为保证我国金融秩序的稳定,促进国民经济健康成长,实行消费者信用评估,为信用提供科学的决策依据,及时识别消费者信用风险,具有十分重要的意义。本文把基于传统Fisher判别分析和核函数的核Fisher方法应用到信用风险评估中,并探讨其现实可行性。1判别分析方法1.1Fisher判别分析设X=(X1,X2,Xp)是P随机变量集,描述与消费者信用相关的信息,比如性别、年龄、收入、职业等。对一个消费者个体,变量的实际值表示x=(x1,x2,xp)。给定
9、一个样本数据集,该数据集由具有相同属性的个体组成,根据个体的特征样本可分为多个类别,当一个新的样本点出现时,如何判断该新样本点归属于样本中的哪一类,这就是判别分析要解决的问题。Fisher判别的基本思想是投影2,3,即将K类p维数据投影到某方向,使得组与组间的距离最大,也即采用方差分析的思想。在两类的情形下,设 1=x11,x12,x1l1和 2=x21,x22,x2l2来自2个不同类别的样本(其中xji是一个p维矢量),样本总数为=12=x1,x2,xl,各自的组内均值mi=li6lij=1xij。Fisher线性判别通过最大化下式,得到使组间距离最大的w:maxJ(w)=wTSBwwTSw
10、w(1)式中,SB=(m1-m2)(m1-m2)T,为组间离差阵,反映组间的差异;Sw=6i=1,26xi(x-mi)(x-mi)T,反映组内的差异。最大化J(w)的直观意义是搜索一个方向,投影在该方向上的类间均值距离最大,两个类各自的方差最小。对任一样本X,判别该样本的归属类别,可以计算判别函数y=wTX,求它与各总体(Gi)的马氏距离:di=d2i(X,Gi)(2)最小化该距离,d2i=m in1mjd2m,则判断XGi。1.2核Fisher判别分析对样本线性可分问题,传统Fisher判别方法的判别能力得到了普遍认可,然而消费者信用评估属于非线性问题,简单的线性判别函数无法有效地区分不同特
11、征的样本。该情况下,在构造判别函数时可以采用复杂的非线性分布函数,但这在具体实现时有很多困难4,因此,可以考虑间接地采用非线性投影方法,即通过非线性映射把原始数据投影到特征空间#中,然后在特征空间中用线性Fisher判别达到分类目的。该方法基本原理如图1所示。图1核Fisher判别原理示意图设 是一个到特征空间#的非线性映射,它把原空间中的样本点非线性地映射到特征空间中。在#中找一个线性判别函数,使下式达到最大:maxJ(w)=wTSBwwTSWw(3)式中,w#,SB、SW是#中相应的矩阵,分别为SB=(m1-m2)(m1-m2)TSW=6i=1,26xi(x)-mi)(x)-mi)Tmi=
12、1li6lij=1(xij)这样,在特征空间中构建了一个线性判别函数。但是,若#的维数非常高,甚至是无限维的空间时,式(3)就无法直接求解。针对该问题,可以采用类似于核主成分分析中引进核函数的方法。传统的核函数方法是用于非参数估计问题。对于一已知的x值,要估计在x点的值f(x)。那么在估计x点的函数值时,靠近x的样本应比远离x的样本起的作用更大些,因此有必要对不同的样本进945第6期李建云,等:核Fisher判别分析方法评估消费者信用风险 1995-2006 Tsinghua Tongfang Optical Disc Co.,Ltd.All rights reserved.行一定的加权,这可
13、以采用核函数得以较好地实现。设K()为核函数,对样本的概率密度估计为fn(x)=1nhn6ni=1Kx-Xihn(4)式中,hn为窗宽。由此得到的fn(x)即为总体未知密度f的一个估计,称为核估计。在本文则把核函数方法用于高维空间的非线性投影。经研究表明,在核主成分分析和支持向量机方法中较为有效的核为RBF核5,因此,本文也尝试采用RBF核进行核Fisher判别分析,此时的影射即RBF核函数6,k(x,y)=exp-x-y222(5)式中:x和y均为样本值;为控制非线性化程度的常数。根据再生核理论,在特征空间中的任意一个解向量w#是特征空间#中训练样本的组合,因而可以找到w的扩展形式:w=6l
14、i=1i(xi)(6)由式(6)和mi的定义,可得wTmi=1li6lj=16lik=1jk(xj,xik)=TMi(7)式中,(Mi)j=1li6lik=1k(xj,xik),这里用核函数替换了点积。利用SB的定义和式(6),式(3)中的分子可写成wTSBw=TM(8)式中,M=(M1-M2)(M1-M2)T。应用SW的定义和类似于式(7)的变换,式(3)中的分母可写成wTSWw=TN(9)式中:N=6j=1,2Kj(I-1lj)KTj,Kj是llj矩阵,其中,元素(Kj)nm=k(xn,xjm)(这是类j的核矩阵),I是单位矩阵,1lj是所有元素均为lj的矩阵。联合式(8)和(9),则可在
15、特征空间中得到Fish2er线性判别函数maxJ()=TMTN(10)该判别函数隐式地对应着原空间中的一个非线性判别函数,因此,它是一种非线性方法。求解矩阵N-1M的最大特征值对应的特征向量就可以求得上式的最优解。这样可以得到一个新样本点在特征空间的投影(w(x)=6liik(xi,x)(11)上述方法通过l个样本估计l维协方差矩阵,显然是不可行的。除了数值问题会导致矩阵N非正定外,还需要在特征空间#中采取某种方法控制N。这里,对N做如下正则化处理N=N+I(12)本文取=0.001。对矩阵N做这种变换有如下优点:它会使数值求解问题更加稳定,足够大时,矩阵N会变成正定矩阵;与式(3)相比,该方
16、法降低了样本特征值估计的偏差;方法对 2进行了正则化,最佳结果具有最小的扩展系数。2实证分析2.1案例背景本文以消费者分期付款购买汽车为研究案例。消费者在购买汽车时,承诺在获得该消费品后每月按一定额度归还银行贷款。但在实际中,部分消费者因为偿债能力降低而违约,或因为该消费品大幅度降价以及其他一些原因而理性违约,导致银行不能收回贷款。本文依据与消费者信用相关的信息,建立判别模型,尝试在最大程度上把正常还款客户和违约客户分离开来。2.2变量分析及数据预处理对消费者信用状况产生影响的因素较多,有居住、年龄、性别、婚姻、职业等。比如,目前居住状况在一定程度上代表了借款人的经济实力,如果借款人经常性的搬
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Fisher 判别分析 方法 评估 消费者 信用风险
限制150内