基于粗糙集和遗传神经网络集成的个人信用评价模型.ppt
《基于粗糙集和遗传神经网络集成的个人信用评价模型.ppt》由会员分享,可在线阅读,更多相关《基于粗糙集和遗传神经网络集成的个人信用评价模型.ppt(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1东南大学系南大学系统工程研究所工程研究所报告人:告人:卢红科科基于粗糙集和遗传神经网络集成的基于粗糙集和遗传神经网络集成的个人信用评价模型个人信用评价模型2目录目录1 13 3引言引言引言引言RSRS和和和和GA-NNGA-NN集成模型集成模型集成模型集成模型2 2实证实证分析分析分析分析31.引言引言n个人信用个人信用评价价问题 商商业业银银行行零零售售信信贷贷业业务务的的不不断断发发展展,使使得得个个人人信信用用评评价价的的重重要要性性日日益益加加强强。个个人人信信用用评评价价是是指指商商业业银银行行根根据据个个人人的的信信用用信信息息给给出出每每个个贷贷款款申申请请者者能能够够偿偿还还
2、贷贷款款的的可可能能性性(Chen,Huang,2003)1。面面对对客客户户提提出出的的贷贷款款申申请请,银银行行需需要要根根据据客客户户提提出出的的基基本本信信息息和和以以往往的的资资信信记记录录,包包括括姓姓名名、年年龄龄、家家庭庭住住址址、职职业业、每每月月收收入入、信信用用卡卡消消费费纪纪录录、以以往往贷贷款款还还贷贷纪纪录录等等,采采用用科科学学的的方方法法对对客客户户的的信信用用进进行行评评估估,以以决决定定是是否否向向该该客客人人户户发发放放贷贷款款(Lee等人,等人,2003)2。41.引言引言n文献文献综述述 随随着着人人工工智智能能技技术术的的发发展展,包包括括人人工工神
3、神经经网网络络(Artificial Neural Networks,ANN)、支支持持向向量量机机(Support Vector Machine,SVM)、遗遗传传算算法法(Genetic Algorithm,GA)、粗粗糙糙集集(Rough Set,RS)以以及及各各种种方方法法相相互互结结合合的的组组合合模模型型逐逐步步应应用用到到个个人人信信用用评评价价中中来来。Huang等等人人(2006)3将将这这些些模模型型分分为为以以功功能能为为基基础础的的方方法法(如如GA、ANN等等)和和以以归归纳纳为为基基础础的的方方法法(如如Apriori 算算法法、决决策策树树、RS等等)。同同时时
4、,各各种种各各样样的的研研究究着着重重于于集集成成一一些些以以功功能能为为基基础础的的模模型型,来来提提高高分类精度。分类精度。51.引言引言n文献文献综述述 朱朱兴兴德德等等人人(2003)4提提出出了了一一种种基基于于GA的的神神经经网网络络个个人人信信用用评评估估模模型型,利利用用标标准准GA和和Solis&Wets算算法法的的混混合合算算法法同同时时优优化化神神经经网网络的结构和权重阈值系数。络的结构和权重阈值系数。姜姜明明辉辉等等人人(2008)5将将GA与与SVM进进行行结结合合,构构建建了了个个人人信信用用评评估估GA-SVM模模型型,用用GA来来选选择择SVM参参数数,并并通通
5、过过GA适适应应度度函函数数的的设置,来控制给商业银行造成较大损失的设置,来控制给商业银行造成较大损失的“取伪取伪”误判的发生。误判的发生。61.引言引言n文献文献综述述 对对以以归归纳纳为为主主的的算算法法,其其主主要要的的优优点点在在于于这这些些算算法法可可以以向向决决策策者者提提供供可理解的可理解的IF-THEN规则,帮助他们理解数据真实的内容。规则,帮助他们理解数据真实的内容。Huang等等人人(2006)3提提出出了了一一种种两两阶阶段段遗遗传传模模型型来来研研究究信信用用评评价价模模型型,该该模模型型通通过过遗遗传传规规划划来来提提取取IF-THEN规规则则,取取得得了了很很好好的
6、的分分类类效效果果。然然而而,以以归归纳纳为为主主的的模模型型存存在在的的主主要要问问题题是是预预测测能能力力不不强强,如如果一个样本新个体不符合任何规则,就无法确定它的信用类别果一个样本新个体不符合任何规则,就无法确定它的信用类别6。71.引言引言 为为了了结结合合两两种种模模型型的的优优点点,柯柯孔孔林林等等人人(2008)7将将RS和和BP神神经经网网络络进进行行组组合合,针针对对商商业业银银行行企企业业贷贷款款业业务务,构构造造了了五五级级分分类类评评价价模模型型。然然而而,BP神神经经网网络络存存在在一一些些问问题题,如如稳稳定定性性差差,容容易易陷陷入入局局部部极极值值。此此外外,
7、目目前前国国内内很很少少有有学学者者将将以以归归纳纳为为基基础础的的方方法法和和以以功功能能为为基基础础的的方方法法集集成成来来研研究究商商业业银银行行个个人人信信用用评评价价问问题题,因因此此,本本文文提提出出了了以以RS和和遗遗传传神神经经网网络络(GA-Neural Network,GA-NN)集集成成的的混混合合信信用用评评价价模模型型,通通过过基基于于GA的的RS来来约约简简信信用用评评价价指指标标,降降低低了了GA-NN输输入入层层的的结结点点数数,提提高高了了分分类类精精度度;通通过过RS来来提提取取个个人人信信用用评评价价规则库,有利于决策者更好地掌握数据信息和执行信贷决策。规
8、则库,有利于决策者更好地掌握数据信息和执行信贷决策。82.RS和和GA-NN集成模型集成模型RS和和GA-NN集成的个人信用评价模集成的个人信用评价模型主要由两部分组成,见图型主要由两部分组成,见图1。第一部分是模型训练,第一部分是模型训练,包括三个步骤:(1)样本数据预处理:离散化和归一化;(2)应用GA简约评价指标;(3)采用RS,基于最小简约指标提取判别规则,形成个人信用评价判别规则库。第二部分是模型检验,第二部分是模型检验,将检验样本评价指标值与规则库进行匹配,会出现匹配和不匹配两种情况。用RS判别与规则库匹配的检验样本信用等级,GA-NN算法作为辅助模型,判别不与规则库任何规则匹配的
9、检验样本信用等级。否 是 图图1:个人信用评价集成模型框架图:个人信用评价集成模型框架图YES 数据预处理训练集测试集应用遗传算法进行属性约简规则库匹配?粗糙集理论样本集基于遗传算法的BP神经网络模型分类结果分类结果92.RS和和GA-NN集成模型集成模型n评价指标属性约简评价指标属性约简 在决策过程中,并不是属性越多越好,而是遵循样本的属性特征足够刻画样本特征的选择原则。这是因为属性过多时,样本中会更容易夹杂一些噪声数据,对于计算空间的要求以及算法的时间要求都会增加,增加问题的复杂性。因此,本文对样本进行知识约简。知识约简,就是指保持知识库分类能力不变的条件下,删除其中不相关知识约简,就是指
10、保持知识库分类能力不变的条件下,删除其中不相关或不重要的冗余知识。现有的约简算法,主要是是从或不重要的冗余知识。现有的约简算法,主要是是从RS的核出发,采用启发式搜索的核出发,采用启发式搜索的方法构造所含条件属性最少的约简,即最小约简(陶志等人,的方法构造所含条件属性最少的约简,即最小约简(陶志等人,2003)8。通过删除条件指标 的前后近似质量之差 来考察条件指标 对于决策属性D 的重要性,如果 ,则认为评价指标 对于决策属性D 没有影响,可以在评价指标集中将其删除。本文采用GA寻找最小相对约简8:假设评价指标集合为 ,评价指标空间染色体为长度为制位串,每一位对应一个条件属性。若某位取值为1
11、,则表示选择其对应的条件属性;的二进102.RS和和GA-NN集成模型集成模型n评价指标属性约简评价指标属性约简 若某位取值为0,则去除其对应的条件属性。这样,每一个染色体个体对应了条件属性空间中的一个属性子集。定义自适应函数为自适应函数为(柯孔林等人,2008)7:式中:L表示染色体 选择了的评价指标个数,Z表示染色体 覆盖决策表的行数,为评价指标个数,为训练样本数。112.RS和和GA-NN集成模型集成模型n信用评价规则生成信用评价规则生成商业银行零售客户的数据库以二维数据表的形式表示商业银行零售客户的数据库以二维数据表的形式表示,决策表 表示为 ,表中的每一行描述一个零售客户,所有零售客
12、户的集合称为论域 ,每一列描述一个属性,属性可以分为条件属性(评价指标)和决策属性(贷款与否),为属性集合,C 和D分别为评价指标集和决策属性集合,是属性 的值域 9。利用RS生成商业银行零售客户信用评价规则库是以决策表作为单位进行的,将GA约简的评价指标作为规则的前部,决策属性作为规则的后部,由此形成判别规则。若 为评价指标 的离散值,为决策属性D 的取值,则由简化后的评价指标生成的个人信用判别规则表示为:122.RS和和GA-NN集成模型集成模型nGA-NN构造构造基于采用标准GA简约得到的最小评价指标集及相应的经过归一化之后的标准化数据形成最新的学习样本,对GA-NN系统进行学习和训练。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 粗糙 遗传 神经网络 集成 个人信用 评价 模型
限制150内