多元线性回归与因子分析研究各因素对银行不良贷款的影响(15页).doc
《多元线性回归与因子分析研究各因素对银行不良贷款的影响(15页).doc》由会员分享,可在线阅读,更多相关《多元线性回归与因子分析研究各因素对银行不良贷款的影响(15页).doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-多元线性回归与因子分析研究各因素对银行不良贷款的影响-第 14 页多元线性回归与因子分析研究各因素对银行不良贷款的影响姓名宋婧怡赵志强张俊杰学号910104006901101055专业信息与计算科学农学电话152386305101523715221013513890569邮箱sjy61643089612175937651124636826多元线性回归与因子分析研究各因素对银行不良贷款的影响摘要银行不良贷款,是指银行贷款给个人或者企业,企业逾期很长还款或者甚至无偿还能力,导致银行长期回收不了资金的贷款。不良贷款可以说是银行体内的“毒瘤”,侵蚀银行的利润或资本金,严重的还会引发银行破产。本文利用
2、商业银行基本数据对不良贷款各影响因素进行分析,建立数学模型提出有效控制银行不良贷款发生金额方法。先对有关数据进行相关性分析,建立线性回归模型,并进行显著性检验。常量的标准误差较小,除X1外各变量标准误差相比因子分析法得出的相对较大再由各因素之间存在显著相关性,进行因子分析,得到公因子G,对公因子与不良贷款线性回归,显著性分析。常量的标准误差相对多元线性回归得出的较大,公因子标准误差较小。关键字 银行不良贷款 线性回归 因子分析 控制 因素引言不良贷款是一直以来困扰我国商业银行发展的重大问题。近几年,政府加大了对商业银行不良贷款的处理力度,使银行的不良贷款率有所下降。但是不良贷款并不是一个单纯的
3、历史问题,不良贷款的产生也从未间断。在当前经济走势依然不明朗的情况下,防范控制风险显得尤为重要我国的贷款风险分类方法也经历了一些发展变化。财政部在1988年金融保险企业财务制度中,按照是否超过贷款期限,把贷款划分为四类:正常、逾期、呆滞、呆账,后三类合称不良贷款,即“一逾两呆”;1998年,中国人民银行制定贷款风险分类指导原则(试初),开始试点采用国际通行标准下的五级分类制度;2O01年12月,中国人民银行发出关于全面推行贷款质量五级分类管理的通知,决定从2002年1月1日起,我国各类银行全面施行贷款质量五级分类管理。五级分类标准的划分核心是贷款归还的可能性。国有商业银行控制不良贷款的改进措施
4、:第一,在银行内部建立科学、有效的审批流程策略。风险识别的关键主要受制于审查部门对每个风险资产潜在风险的预测、监视、识别的能力。因此现代商业银行必须对信贷风险防范进行研究,建立一套合理、科学的标准的审批流程和防范措施,以提高对信贷风险的识别。第二,在贷款管理模式上,我国国有银行可以借鉴银行家埃德加M摩尔斯曼提出的有效贷款管理方法。将不良贷款的发展变化概括为5个阶段,即安全阶段、借新还旧阶段、过渡阶段、清偿阶段及覆没阶段,并介绍每一阶段截然不同的借款人资产状况、心理行为、银企关系特征,认为只要银行对这些信息和表现进行适当分析和总结。银行可以正确预测不良贷款的下一步发展从而有利于银行赢得时间、制定
5、适当的不良贷款管理方法。正文基本假设与符号说明某银行一年贷款主要业务数据 分行编号不良贷款(亿元)Y各项贷款余额(亿元)X1本年累计应收贷款(亿元)X2贷款项目个数X3本年固定资产投资额(亿元)X410.967.36.8551.921.1111.319.816903934.81737.71773.743.280.87.21014.557.8199.716.51963.262.716.22.212.271.6107.410.71720.2812.5185.427.11843.89196.11.71055.9102.672.89.11464.3110.364.22.11142.7124132.21
6、1.22376.7130.858.661422.8143.5174.612.726117.11510.2263.515.634146.716379.38.91529.9170.214.80.6242.1180.473.55.91125.319124.75413.4206.8139.47.22864.32111.6368.216.832163.9221.695.73.81044.5231.2109.610.31467.9247.2196.215.81639.7253.2102.2121097.1假设因变量Y与自变量X1,X2,X3,X4之间存在线性关系异常数据检验得9039(第2个X4)为异常值
7、,变为90.39进行计算模型分析与建立一.Pearson模型进行非参数相关分析Pearson相关系数用来衡量两个数据集合是否在一条直线上面,其计算公式为: 二线性回归1线性回归分析简介若自变量xi和因变量yi之间存在如下关系:yi=b0+bixi+ei, i=1,2,3,N, (22.1)其中e1,e2,en分别表示其它随机因素对yi的影响的总和,一般假设它们是一组相互独立并服从同一正态分布N (0,s2)的随机变量;变量x可以是一般变量,也可以是随机变量;变量y是服从正态分布N (b0+bixi,s2)的随机变量。式(22.1)就是一元线性回归模型,但在许多实际问题中,与某一变量y有关的自变
8、量不止一个,而是多个。因此,在此主要讨论多元线性回归分析的数学模型。设变量y与变量x1,x2,xp之间存在线性回归关系,它的第i次试验数据是yi,xi1,xi2,xip (i=1,2,N),于是有多元线性回归的数学模型:y1=b0+b1x11+b2x12+bpx1p+e1,y2=b0+b1x21+b2x22+bpx2p+e2, (22.2)yN=b0+b1xN1 +b2xN2 +bpxNp +eN,其中b0,b1,b2,bp是p+1个待估参数,x1,x2,xp是p个可以精确测量的或可以控制的变量,e1,e2,eN是N个相互独立且服从同一正态分布N (0,s2)的随机变量。为简明起见,可用矩阵形
9、式来描述回归分析问题。设:Y=(y1,y2,.,yN),b=b0,b1,b2,.,bp,e=e1,e2,.,eN。则多元线性回归的数学模型可以写成矩阵形式,即:Y=X b + e。 (22.3)2多元回归统计检验(1) 回归方程显著性检验回归方程显著性检验实际是检验所有的自变量xj,j=1,2,p作为一个整体与因变量Y的线性关系是否显著。其假设为:H0:b1 =b2 =bp = 0;HA:至少一个bj0, 1jp检验方法仍为方差分析。可以证明,在多元回归的情况下y的校正平方和可分解为回归平方和与残差平方和两部分:它们的自由度分别为n-1,n-p-1,和p;其中。因此,我们可用统计量:作显著性检
10、验。当显著水平p0.05时,H0成立;若p0.05,H0不成立。若上述检验拒绝H0:1 =2 = =p = 0,则应进一步对各自变量的回归系数j,j=1,2,p作t检验,以剔除不重要的因素。在H0:j = 0下,统计量,若对某一bj的检验不显著,则接受H0:bj = 0,即说明相应的自变量xj对因变量Y没有明显影响,可将它从变量组中剔除。但剔除一个自变量后,都应对方程重新进行回归分析。(2) 方差膨胀系数VIF方差膨胀系数VIF是诊断每个自变量所受到多重共线性影响大小的重要指标,其计算公式是:式中Rj2是把第j个自变量看作因变量,用其余m-1个自变量作线性回归分析所得到的决定系数。当一个变量的
11、VIF值很大时,表明自变量间存在有多重共线性效应。(3) 残差分析拟合残差诊断目的主要是:残差是否呈随机分布;残差是否是正态分布;残差中方差的改变异方差性检验;异常值的存在;高度相关的自变量引起的共线性。残差诊断所用的指标,较重要的是标准化残差r和Cook距离D。标准化残差计算公式为:式中H=(hij )=X(XTX)-1.XT。cook距离计算公式定义为:。三因子分析因子分析方法用于研究相关矩阵的内部依赖关系,它将多个变量综合为少数几个“因子”,但仍可再现原始变量与“因子”之间的相关关系。在统计学中,因子分析属于多元分析的范畴。因子分析主要是由心理学家发展起来的,1904年Chales Sp
12、eraman 用这种方法对智力测验得分进行统计分析。目前,因子分析在心理学、社会学、经济学、人口学、地质学、生物学,生态学、医学,甚至在化学和物理学领域都有成功的应用。它主要应用于两个方面:一是将为数众多的变量减少为几个新因子,再现系统内变量之间的内在联系;二是用于分类,根据变量或者样本的因子得分值在因子轴所构成的空间中进行分类处理。因子分析(factor analysis)是寻找对观察结果起支配作用的潜在因子(潜变量,latent variable)的探索性统计分析方法。利用主要因子描述数据集内部结构,实际上起着数据降维的作用。因子分析是主成分分析的发展和延伸。1方法原理因子分析的结果不仅要
13、给出因子模型,而且要得出变量和因子间的相关系数,并由这些相关系数构成“因子结构”。一个完全的因子解包括因子模型和因子结构两个方面,因子结构反映变量与因子间的相关关系,而因子模型则是以回归方程的形式将变量表示为因子的线性组合。因子分析的基本问题是用变量之间的相关系数来决定因子载荷。因子模型的求解过程简述如下:设原始数据矩阵为:,n为样本数,p为变量数。(1) 将原始数据进行标准化处理。用公式:, i=1,2,n;k=1,2,p,其中,。经标准化处理之后,xij的均值为零,方差为1,这样的相关矩阵R和协方差矩阵S完全一样。这时相关矩阵R=XX,为方便起见,将标准化处理后的矩阵仍记为X。求解R矩阵的
14、特征方程RlI=0,记特征值为l1l2lp0,由特征向量矩阵:而得:其中 U为正交矩阵,并且满足UU=UU=,即有:将上式两边左乘以U,右乘以U得:令F=UX,于是上式变为:F称为主因子阵,并且Fa=UXa (a=1,2,n),即每个Fa为第a 个样品主因子观测值。在因子分析中,通常只选其中m个(mp)主因子。根据变量的相关选出第一主因子F1,使其在各变量公共方差中的贡献为最大,然后消去这个因子的影响,再从剩余的相关中选出与F1不相关的因子F2,也使其在各个变量剩余因子方差中贡献最大。余此类推,直到各个变量公共因子方差被分解完毕为止。例如,按所选主因子的信息量之和占总体信息量的85%,即有这样
15、的m,使得:成立。这m个主因子将U矩阵剖分为:U =U1 U2 Um Um+1 Up=U(1) U(2) ,pm p(pm)由 F = UX 将此式两端左乘U得:X = U F =U(1) U(2) = U(1) F(1) + U(2) F(2) ,(pm) (mn) (p(pm) (pm) n)其中 U(1)F(1)为m个主因子所能解释的部分,而U(2)F(2)为其残余部分。记残余部分:则有:X=U(1)F(1)+,该式称为因子模型,U(1)称为因子载荷矩阵,F(1) 称为主要因子,称为特殊因子。由此可得因子模型的表达式(略去特殊因子):x1=u11F1+u12F2+u1mFm,x2=u21
16、F1+u22F2+u2mFm,xp=up1F1+up2F2+upmFm。特征向量Ui通常用单位向量表示,需进行规格处理,即aij=uij。因子载荷矩阵为:因此有R型的因子模型:x1= a11F1+a12F2+a1mFm+a1e1,x2= a21F1+a22F2+a2mFm+a2e2,xp= ap1F1+ap2F2+apmFm+apep, 在该因子模型中,F1,F2,Fm称为公共因子,即在各个变量中共同出现的因子,是在高维空间中所张起的互相垂直的m个坐标轴。aij叫做因子载荷,意即第i个变量在第j个主因子上的负荷,或者称为第i个变量在第j个主因子上的权,它反映出第i个变量在第j 个主因子上的相对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 线性 回归 因子分析 研究 因素 银行 不良贷款 影响 15
限制150内