基于数据挖掘的商业银行个人信用风险评估平台设计与实现大学论文.doc





《基于数据挖掘的商业银行个人信用风险评估平台设计与实现大学论文.doc》由会员分享,可在线阅读,更多相关《基于数据挖掘的商业银行个人信用风险评估平台设计与实现大学论文.doc(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、毕业设计(论文)论 文 题 目:基于数据挖掘的商业银行个人信用风险评估平台设计与实现 学 生 姓 名:学 生 学 号:专 业 班 级:学 院 名 称:指 导 老 师:学 院 院 长: 2016年05月27日基于数据挖掘的商业银行个人信用风险评估平台设计与实现摘 要计算机技术和信息技术的不断发展,带给我们便利的同时也带来一系列问题,其中一个问题是数据量的爆炸式增长以及数据之间的关系愈发复杂,如何对这些海量的数据进行处理,发掘隐藏在数据中潜在的理论价值和实际价值也成为生活中各个领域关注的焦点。随着我国经济的不断发展,城市和农村居民的收入和消费水平有着显著提升,个人信贷业务已经成为商业银行主营业务之
2、一,但目前我国商业银行在个人信用风险评估方面存在着不足。因此,研究如何利用数据挖掘技术从银行现有的客户数据中分析客户的信用风险,具有重要的理论价值和实际意义。本文首先对数据挖掘的概念、发展现状进行了介绍。其次对数据挖掘的算法进行了介绍,分析了本系统会用到的数据挖掘的算法。然后,结合商业银行在客户信用风险评估方面遇到的问题进行了需求分析。在此基础上,提出了基于BP神经网络以及决策树算法的商业银行个人信用风险评估模型,为商业银行个人信用风险评估提供了可行的解决方案。关键词:数据挖掘;BP神经网络;决策树;信用风险Design and Implementation of Commercial Ban
3、ks Credit Risk Assessment Based on Data MiningAbstractThe development of computer technology and information technology bring us convenience, but also brought a series of problems, one of the problems is the relationship between the amount of data as well as the explosive growth of data between the
4、more and more complex, and how these massive data processing discover hidden potential data theoretic value and practical value has become the focus of attention in all areas of life.As Chinas economy continues to develop, income and consumption level of urban and rural residents has significantly i
5、mproved, consumer credit business has become one of the main business of commercial banks, commercial banks in China but there is a lack of personal credit risk assessment. Therefore, studying how to use data mining techniques to analyze customer credit risk from the banks existing customer data, ha
6、s important theoretical and practical significance.Firstly, the concept, development status data mining are introduced. Secondly, the data mining algorithms are introduced, we analyzed the system will use data mining algorithms. Then, combined with problems encountered by commercial banks in custome
7、r credit risk assessment needs analysis. On this basis, the proposed individual credit risk assessment model based on BP neural network and decision tree algorithm based commercial bank, and the proposed model has been improved and validated commercial bank personal credit risk provides a feasible s
8、olution program evaluation.Key Words: Data mining; BP neural network; decision tree; Credit Risk目录第1章 绪论11.1研究背景和研究意义11.1.1研究背景11.1.2研究意义31.2国内外研究综述41.2.1数据挖掘研究现状41.2.2商业银行信用风险研究现状61.3论文的主要工作和内容结构7第2章 数据挖掘算法及相关技术92.1数据挖掘的概念9 2.2数据挖掘的过程92.3数据挖掘的常用算法102.3.1人工神经网络112.3.2决策树112.3.3遗传算法122.3.4近邻算法132.3.5
9、 k-means算法132.4小结14第3章 基于BP神经网络算法的个人信用风险评估153.1神经网络的学习机理和机构153.1.1感知器的学习结构153.1.2梯度下降法算法173.1.3反向传播(BP)算法193.2实验数据的结构及预处理223.2.1数据预处理253.2.2数据指标选取263.3基于BP神经网络的信用风险评估方法模型293.3.1网络的构建及训练293.3.2模型测试结果303.4小结33第4章 基于决策树算法的个人信用风险评估344.1 决策树算法概述344.1.1 ID3算法344.1.2 C4.5算法与C5.0算法374.2 基于C5.0算法的决策树方法个人信用风险
10、评估模型394.2.1 数据采集394.2.2 数据变换404.2.3 决策树的构建434.2.4 评估模型及模型优化484.3小结50第5章 基于数据挖掘的个人信用风险评估系统的实现51 5.1 开发环境的搭建515.1.1 R语言开发环境搭建515.1.2 Shiny Server安装与配置525.2 模块关键功能实现535.2.1 基于BP神经网络算法评估客户信用风险的实现545.2.2 基于决策树络算法评估客户信用风险的实现565.3小结58总结与展望59致谢60参考文献61第1章 绪论本章首先介绍了以数据挖掘算法和技术为基础的商业银行个人信用风险分析的研究背景和研究意义。随着社会经济
11、的发展和国民消费水平及观念的提升,个人信贷市场已经成为银行业的主营业务之一,银行的客户数据量规模十分庞大,用数据挖掘技术从这些海量数据中发现科学有效的个人信用风险评估和预测模型具有重要的理论意义和实际价值。1.1研究背景和研究意义2010年9月12日,国际清算银行(BIS)的巴塞尔银行业条例和监督委员会的常设委员会“巴塞尔委员会”宣布,各方代表就巴塞尔协议III的内容达成一致。巴塞尔协议III将商业银行的风险分为信用风险、市场风险和操作风险,其中信用风险是银行面临的主要风险1。而个人信贷风险又是银行信用风险中的主要组成部分,银行具有高水平的信用风险管理制度决定了其稳定的运行,因此,为满足银行自
12、身运营要求和提高自身风险管理水平,商业银行加快建设个人信贷风险评估系统具有重要的现实意义。1.1.1研究背景从风险管理控制来说,金融体系的风险管理有着十分悠久的历史,随着社会经济以及全球经济一体化的发展,在风险管理方面,其理论和实践都取得了很大进展。国外对金融风险管理比较深入,近几年发现了层出不穷的各种理论和模型,例如:资本资产定价理论、套利定价理论、Credit Metrics模型、KVM 模型等2。在实践中这些理论和模型取得了巨大成功,因而刺激了西方金融市场的发展,反过来,西方金融市场的发展又对金融风险理论研究提出了新的要求。纵观世界银行业的发展,20世纪70年代,银行的经营环境相对比较稳
13、定,其稳定的原因是多方面的。其中,法律监管制度对银行业的稳定发展起到了决定性的作用,那时,银行业的主要经营业务比较单一,仅限于存款贷款业务,外部竞争有限,银行具有稳定的高额的利润。法律监管关注的重点是银行业的安全发展和对货币创造能力的控制,并且法律在监管银行业经营范围的同时,也从各个反面大大降低了银行业所承担的风险。从20世纪70年代至今,银行业掀起了深刻的变革浪潮,在推动银行业变革的因素中,有三个因素显得尤为重要:第一,金融市场职能的日益膨胀,由于国际资本市场在深度和广度上的快速发展,一大部分企业选择发行股票和债券在市场上筹措企业的发展资金,这导致了金融非中介化的快速发展,这些变化给金融市场
14、的参与者,尤其是银行业,带来了新的机遇,机遇与挑战并存,因此也带来了新的挑战。第二,金融管制的放松,随着金融市场的不断发展与金融制度的自我完善,一些旧的金融管制制度开始改变甚至消失。原有监管制度的改编和消失,使得政府或者金融监管部门不能像过去那样利用分业管理制度来控制风险行为3。因此,这些监管部门开始重新制定能够保障金融业安全的监管规则。新的规则主要是由国际清算银行负责制定,然后各国的政府将其应用到国内金融业中去。第三,金融行业竞争日益加剧。金融管制的放松大大拓宽了银行所能提供的产品和服务的范围。各种新产品,比如金融衍生工具和期权、期货等的产生,传统的商业银行开始积极探索新的市场机会,研究开发
15、新的产品的服务,非传统业务的比重迅速增加。增值性服务,比如交易咨询、资产并购、项目融资、信用卡、衍生工具等获得飞速的发展。通过涉足新的领域和开发新的金融产品,银行业需要承担新类型的风险。银行业的变革使得银行业飞速的发展,但同时也带来了新的风险。风险的增加是由新竞争出现、产品的创新、银行主营业务的转型和创新、市场波动的加剧以及金融机构业务范围限制的解除带来的。所以随着银行业的发展,银行业需要承担更多的风险,风险管理显得尤为重要。从数据挖掘技术来说,数据挖掘起始于20世纪下半叶,是在当时多个学科发展的基础上发展起来的。数据库技术日益发展,大大提高了数据的存储与处理能力。但是与之而来的是数据的不断积
16、累,庞大的数据使得传统的增删改查功能无法满足人们对数据的需求,急因需要发展更好的数据处理技术去挖掘庞大数据背后隐藏的信息。与此同时,与此同时,进入21世纪以来,人工智能技术进入飞速发展阶段,Google公司的AlphaGo产品等标志着人工智能革命的兴起,从此机器学习将应用到现实领域。因此,人们将两者结合起来,存储数据使用数据库管理系统,使用数据挖掘技术进行数据分析,并且尝试挖掘隐藏在数据背后的知识4。这两者的结合促生了一门新的学科,即数据库中的知识发现(Knowledge Discovery in Databases,KDD)。而数据挖掘(Data Mining)则是知识发现(KDD)的核心部
17、分,它指的是从数据集合中自动抽取隐藏在数据中的那些有用信息的非平凡过程,进入21世纪,数据挖掘已经成为一门比较成熟的交叉学科,并且数据挖掘技术也伴随着信息技术的发展日益成熟起来。将数据挖掘技术应用到银行信用风险分析成为了可能。1.1.2研究意义信用风险是最古老的风险,而且在潜在损失的规模方面也许是最重要的风险。目前,信用风险的评价正沿着几个方向发展:第一,对贷款组合信用风险的评价;第二,对市场工具信用风险的评价;第三,对信用风险的VAR值的计算;第四,贷款组合管理。信用风险,是指因借款人发生违约或借款人信用等级下降产生损失的风险5。风险的“量”是贷款的余额,风险的“质”是指发生违约的可能性和在
18、违约发生时减少损失的担保措施。本篇研究的商业银行个人信用风险主要指的是客户的违约风险。一般使用商业银行一定时期内客户违约发生的概率来进行衡量违约风险的。借款人的信用等级决定商业银行客户的违约风险取,而商业银行客户的信用等级受多个因素的影响,如客户的工作情况、居住环境、收入水平等。不能直接对违约概率进行测量,但可以用客户以往的信用历史数据多客户的违约概率进行评估。数据挖掘是指从大量的资料中自动搜索隐藏于其中的有着特殊关联性的信息的过程。在商业银行的计算机存储中,存在未使用的海量数据并且它们还在快速增长,这些数据就像待挖掘的金矿。数据挖掘技术可以使我们很容易的从海量数据中提取出可以表示成规则逻辑或
19、者可视化的数据模型,比传统意义上的统计学更加以人为本6。对商业银行而言,数据挖掘的目标,是使商业银行更了解客户,以增进它在信贷、销售、顾客服务营运上的表现,查觉无法直接从数据上看得出来的潜在规则或行为模式。1.2国内外研究综述自从提出数据挖掘的概念以来,国内外的许多厂商相继推出了自己的数据挖掘相关产品,例如IBM Intelligent Miner、SPSS Clementine、MSMiner等。随着厂商不断推出自己的产品,数据挖掘的服务质量和可靠性越来越受到重视。目前,国内外的厂商和学者都已经对此展开了研究,下面对它们的国内外现状分别进行研究。1.2.1数据挖掘研究现状近年来,数据库技术领
20、域中的重要研究领域为知识发现(KDD)与DM。第十一届国际人工智能会议于1989年8月在国底特律市召开,在这次大会上参会者正式提出了知识发现(KDD)一词7。随着计算机技术的日益发展,数据挖掘技术的研究也不断突破,目前已经取得了丰硕的成果。现在主要是从三个方面:理论和技术以及应用对知识发现(KDD)进行研究。国内外大部分学者目前的研究方法是采用多种方法与理论并行。众多计算机行业的公司以及高校研究所等研究机构十分重视数据挖掘技术的研究,Google和微软等已经在全球范围内开设了研究中心。无可否认的是美国是全世界数据挖掘技术发展最繁荣的国家,并占据着数据挖掘技术研究的核心位置8。随着数据量的指数级
21、增加,各个行业的商业公司以及政府机构等对数据挖掘软件的市场需求量也飞速增加,因此众多计算机行业的国际知名公司都纷纷加入到了数据挖掘软件开发研究的行列中来,目前数据挖掘软件市场上已经存在一大批比较成熟、先是实用价值比较高的优秀产品。下面列举的是目前为止比较主流的数据挖掘系统:(1) IBM Intelligent Miner:IBM Intelligent Miner的主要功能包含展现数据库的挖掘过程,能够统计函数和查看函数并解释挖掘结果,挖掘结果可视化展示等。IBM Intelligent Miner能够从企业的海量数据集中检验并提取高价值的知识,包括企业的交易数据,信用卡,ATM(Autom
22、atic Teller Machine),电子商务应用, 或呼叫中心等。数据分析专家和商业领域专家能够发现隐藏在海量数据背后的其他传统分析工具不能发现的知识。IBM Intelligent Miner不但提供了实用的数据挖掘技术和工具来支持知识发现过程,而且还提供了数据挖掘应用服务支持与数据挖掘急速定制应用的发展。(2) Knowledge Studio: Knowledge Studio提供了先进的预测建模功能,包括先进的记分卡的发展,线性和Logistic回归,决策树,神经网络和无监督学习技术,如聚类分析和多因子分析。(3) Cognos Scenario:Cognos Scenario是
23、一种数据挖掘结果高度可视化的一种工具,该软件能够在很短的响应时间内对数据进行高效的挖掘与分析。(4) IBM SPSS Modeler:IBM SPSS Modeler是一个广泛的预测性分析平台,旨在智能预测由个人、组、系统和企业作出的决定。通过提供一系列先进的算法以及包括文本分析,实体分析,决策管理和优化技术,SPSS Modeler可帮助企业与个人始终如一地做出正确的决定。除这些工具之外,Unica公司开发的Affinium Model,美国Insightful公司研究开发的I-Miner,加拿大Simon Fraser大学研究开发的DBMiner等也是常用的市场占有率比较高的数据挖掘软件
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 商业银行 个人信用 风险 评估 平台 设计 实现 大学 论文

限制150内