基于数据挖掘的中小企业信用评估研究0707.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于数据挖掘的中小企业信用评估研究0707.docx》由会员分享,可在线阅读,更多相关《基于数据挖掘的中小企业信用评估研究0707.docx(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学生毕业论文作者声明本人郑重声明所提交的毕业论文(设计)是本人在指导教师指导下进行研究工作并取得的研究成果。论文中所引用他人的无论以何种方式发布的文字、研究成果,均已在论文中加以标注和说明,未标注部分不包含其他人已经发表或撰写过的研究成果,也不包含为获得xxxx学院以外的其他教育机构的学位或证书而使用过的材料。论文写作过程中采纳的有关教师、同学和其他人员的意见、建议,均已在我的致谢辞中加以说明并深致谢意。本人同意学校根据中华人民共和国学位条例暂行实施办法等有关规定保留本人学位论文并向国家有关部门或资料库送交论文或电子版,允许论文被查阅或借阅,本人授权xxxx学院可以将本人学位论文的全部或部分内
2、容编入有关数据库进行检索,可以采用影印、编印或其他复制手段对学位论文汇编(保密论文在解密后应遵守此规定)。论文作者(签字):强巴热杰 2020年 5 月 3 日指导教师(签字): 年 月 日摘 要新世纪初以来,在国家支持民间经济发展,经济进入新的常态的情况下,中小企业的经济主旋律之间的信贷业务越来越频繁。开发受到限制,因此必须建立良好的评级体系作为保证。另外信用评估也可以为中小企业的风险评估,银行信贷提供有价值的参考。本文重点是对CART分类算法的研究,通过对中小板企业财务数据的数据挖掘,得出了10个信用评估的财务指标,然后选取了层次分析法进行信用评估,通过对数据挖掘后指标的权重分析,利用标准
3、普尔公司指数,对某地中型电气A企业进行了信用评估,并分析了结果。关键词:中小企业;信用评估;CART;层次分析法AbstractSince the beginning of the new century, as the state has supported the development of the private economy and the economy has entered a new normal, the credit business between the economic main theme of SMEs has become more frequent. De
4、velopment is restricted, so a good rating system must be established as a guarantee. In addition, credit evaluation can also provide a valuable reference for the risk assessment of SMEs and bank credit.This article focuses on the study of the CART classification algorithm. Through data mining on the
5、 financial data of small and medium-sized board companies, 10 financial indicators for credit evaluation are obtained, and then the analytic hierarchy process is selected for credit evaluation. The weight of the indicators after data mining is selected. Analysis, using the Standard & Poors index, co
6、nducted a credit evaluation of a medium-sized electric company A in a certain place, and analyzed the results.Keywords: Small and medium-sized enterprises;Credit assessment;The CART;Analytic hierarchy process目 录摘 要IAbstractII第1章绪论11.1 课题研究的背景和意义11.1.1 研究背景11.1.2 研究意义21.2 信用评级国内外研究现状21.2.1 国内研究现状21.2
7、.2 国外研究现状31.3 论文的研究内容和组织结构3第2章中小企业概念及信用评级方法52.1 中小企业的概念52.2 中小企业信用评级方法62.2.1 指标提取62.2.2 评估方法72.3 本章小节9第3章数据挖掘理论及中小企业信用指标的挖掘103.1 数据挖掘概述103.2 数据挖掘的具体步骤103.3 中小企业信用指标体系建立113.3.1 中小企业指标选取的原则113.3.2 中小企业信用指标数据源选取123.4 CART分类算法133.4.1 CART分类算法原理133.4.2 Matlab对中小企业数据进行分类挖掘提取指标143.5 本章小节17第4章中小企业信用模型评估184.
8、1 层次分析法概述184.1.1 层次分析法简介184.1.2 层次分析法的建模流程184.2 层次分析法进行评估224.2.1 构建层次结构图224.2.2 构建第二层相对于第一层的判断矩阵及权重224.2.3 构造第三层相对于第二层各个指标的判断矩阵及权重234.3 中小企业信用评级实例274.4 本章小节29第5章总结与展望30参考文献31附录:32致谢36IV第1章 绪论1.1 课题研究的背景和意义1.1.1 研究背景随着社会和经济发展的必然会产生针对中小企业有各种信贷、入股以及投资,这是现代社会和经济生活不可分割的一部分,为了降低银行或者股东及投资人的风险必须评估中小企业信贷风险,可
9、以降低双方的交易成本。客观科学的能力是指基于共识和广泛分析的评估。经济、证券市场和市场控制在有效保护和保护信用风险方面发挥着积极的作用,促进投资者和整个市场的利益。具体有以下三点: 第一:特别是,大多数个人投资者应了解相关发行人,优化投资机会,以保护投资者的利益和资本市场的组织。第二:客户增加对公司投资的兴趣,同时对企业信用的科学分析可以最大限度地发挥信用评级的作用。第三:企业风险评级是确定信用风险和信用管理的基础。信贷公司的生产经营取决于银行信贷的安全与效率、银行的生存与发展、金融机构的稳定以及信贷风险的大小。改革开放以来,中小企业已成为国民经济的重要力量,通过提供就业机会,为我国经济发展作
10、出了重大贡献。在中国工商注册的1000万中小企业中。当工业总产值转化为销售额时,实现的利润、税收和出口总额分别占全国总产值的67%、44%和64%,创造了75%以上的城市就业机会。然而,中小企业生存发展环境不理想,融资渠道不畅,中小企业融资难已成为制约中小企业发展的主要障碍。中小企业如何融资成为我国金融业的一个重要课题。中小企业融资困难的主要原因有以下两个方面:第一:我国中小企业基础设施薄弱,规模小,储蓄低,个别企业有逃税漏税事件发生,导致中小企业信贷总量减少。第二,社会信用体系不完善,贷款渠道单一。从理论上讲,SME的资金筹措方法应该包括所有企业的资金筹措方法,除了内部的资金筹措方法以外,外
11、部的资金筹措方法也可以使用。外部融资方式包括资本融资、股票资本融资、债券融资和商业期票。融资、商业信用融资等直接融资,以及银行融资和租赁融资等间接融资。由于中国社会信用体系不完善,中小企业除了内部融资外,还可以使用外部融资。外部融资包括投资资本、股票融资、债券发行等直接融资、商业债务证券发行、商业信用融资、银行贷款和租赁融资等间接融资。但是,对于中国的中小企业来说,直接融资是非常困难的。1.1.2 研究意义进入新世纪以来,我国中小企业发展迅速,为经济发展和就业增长做出了重大贡献,与大企业相比,中小企业更容易受到冲击,在历次金融危机期间,中小企业抵御外部风险的能力较弱,因此,对我国中小企业信用评
12、估进行研究,可以有效识别信用风险,对于避免美国次贷危机等金融危机的不利影响,具有重要的理论和现实意义,保持我国金融信贷市场正常运行,保持经济持续稳定增长。1.2 国内外研究现状1.2.1 国内研究现状近年来,关于中小企业信用等级的研究十分活跃,主要集中在中小企业信用等级体系和指标体系的建立上。中小企业的情况,建模所需的数据非常不足,因此,中小企业的信用评价被模型化方法主要数学分析,回归分析,职业比特分析法、多重辨别分析,主要是上市企业或大企业的信用等级被使用。近年来,关于中小企业信用等级的研究比较活跃,主要集中在中小企业信用等级体系和指数体系的建立。SME评级建模的主要方法有专家评级法、层次分
13、析法、模糊数学法、Logitic回归分析法、Probit回归分析法,多元判别分析和BP神经网络。西安交通大学研究生提出了公司贷款指标的选择,并完成了财务指标确定因素的分析。为了考察信贷额度,内蒙古大学的牛曹林对中小企业评估体系进行了评审,建立了适应于中小企业的信用指标体系。广西大学的研究设计了中小企业财务分析系统,涵盖中小企业的资本结构、偿付能力、盈利能力、可行性、成长性、流动性和财务整合。1.2.2 国外研究现状约翰穆迪于1900年在美国成立了穆迪独立服务公司。1909年他第一次分析了各种各样的美国铁路公司和他们发行的债券的风险,记录了美国证券评级事业的诞生。关于海外企业信用等级的研究的序章
14、。国外对企业信用评价的研究起步较早,已有100多年的历史,评价体系和测定模型的开发比较成熟。作为现有评价模型的基础的统计判别法,是菲舍尔在1936年进行启蒙研究后提出的。SME模型、VAR模型和信用风险模型主要用于计算财务活动中的企业违约概率,或者基于每个企业的已知信用等级计算财务风险。这些模型从不同的角度提出了信用风险管理的要点。虽然焦点、目的、适用方向和时期不同,但这些都是高度发达的管理概念,基本上涵盖了整个信用风险管理过程。但是,这些模型在实际应用中还存在一些问题,因为这些模型主要由模型建立的数学条件和假设难以确定。信用评估机构,即模型是离散的,假设相同信用等级的债务人的汇款是完全相同的
15、,违反实际违约率的概率等于过去统计的平均违约率。由于现实并非完全正确,这些模型的使用受到限制。1.3 论文的研究内容和组织结构本论文的研究工作重点是研究关联分析算法在中医古籍数据挖掘上的应用。本文主要由以下几个章节组成:第一章 是引论,介绍这篇论文研究的重要性和相关背景,以及与这篇论文相关的国内外研究开发现状。最后,展示论文的整体组织结构。第二章 第二章 中小企业概念及信用评级方法,主要论述了中小企业的概念、中小企业信用评级方法、指标提取和评估方法。第三章 主要论述了数据挖掘理论及中小企业信用指标的挖掘。论述了使用CART算法对中小板上中小企业569条数据挖掘的具体实现流程,并得出了10个评价
16、信用的重要指标。第四章 基于层次分析法对中小企业数据进行评估。详细介绍了层次分析法的原理,并对10个指标进行权重求解,最后对某中型电气企业进行信用评估。第五章的摘要和展望。总结了论文的工作,并展望了将来的研究开发。第2章 中小企业概念及信用评级方法2.1 中小企业的概念中小企业的国际分类通常基于三个标准,第一是员工人数,第二是实际资本,第三是一定期间的销售额。中小企业的领域,有地域的,现代的,和产业的特征。为了洗练中小企业的定义,中小企业评级系统的建立必须满足中小企业的需求,评估标准和行业评级系统也需要根据企业的特定特性进行调整。2003年原国家经贸委,原国家计委,财政部,国家统计局等部门联合
17、制定发布了中小企业标准暂行规定1。如表2-1 表2-1 中小企业标准行业中小企业标准工业中小企业需要满足以下条件。员工人数不超过2000人,营业额不超过3亿元,或者总资产不超过4000万元。其中,骨干企业必须满足员工300人以上,销售3000万元以上,总资产4000万元以上。建筑业中小企业必须满足以下条件。员工人数不足3,000人或销售不足3亿元,或者总资产不足4000万元。其中,中型企业需要同时见面,员工超过600人,营业额超过3000万元,总资产超过4000万元。批发和零售业零售业的中小企业必须满足以下条件。员工人数不超过500人,或者营业额不超过1.5亿元,其中中型企业也需要满足100人
18、以上的员工人数,营业额在1000万以上。批发的中小企业必须满足以下条件。在200人以下或3亿元以下的销售额中,中坚企业必须满足100人以上,同时满足3000万元以上的员工人数。交通和邮政业运输行业的中小企业必须满足以下条件。员工人数不超过3000人,或者营业额不超过3亿元,其中中型企业也需要满足500人以上的员工人数,营业额在3000万以上。邮政行业的中小企业需要满足以下条件。职工人数不足1000人,或者销售金额不足3亿元,其中,骨干企业需要满足400人以上的职工人数,销售金额在3000万元以上。住宿和餐饮业中小企业需要满足以下条件。员工人数不超过800人,或者营业额不超过1.5亿元,其中中型
19、企业也需要满足400人以上的员工人数,营业额在3000万元以上。2.2 中小企业信用评级方法从指标提取和评估方法两大角度入手:2.2.1 指标提取指标提取的方法主要分为统计分析和数据挖掘两种方法:统计分析:包括层次分析法、逻辑回归分析法、主成分分析法和因子分析法。首先,层次分析法采用了灵活实用的多准则决策方法,特别适用于难以定量分析的问题,需要层次结构模型和判断矩阵,主观性强,使用方便,结果形状直观用指标权重表示。Logistic回归分析是广义线性回归分析,从现有指标体系中剔除关联性较低的指标,建立新的指标体系,结合后续的评价得出企业信用评价结果。与主成分分析和因子分析算法一样,Logisti
20、c回归分析模型是由数据指标本身建立的,其结果更加客观3。数据挖掘:主要有粗糙集和wrapper算法,在原始的索引系统中,具有冗余信息的冗余属性被减少,最优功能的子集被提取,后续的评估模型的训练时间被缩短。前者通常与其他方法(主要是数据挖掘算法)组合以建立后续评估模型;后者的提取标准实际上与后续的评估模型(通常是数据挖掘算法)相关联(即,根据评估模型)来确定最优的功能子集的分类性能。2.2.2 评估方法目前国内研究的评估方法主要有以下三种(1) 数理统计模型判别分析和逻辑回归分析具有最广泛的统计模型,前者是基于线性判别的。前者的应用中,Altman最具代表性。基于多变量线性判别分析,5个指标被筛
21、选,公司是否设定担保贷款违约预测模型,即5因子z分数模型,以此为基础确立被改善,5 7因子扩张因子,并确立了zeta模型。这两个模型有广泛的影响,对逻辑回归分析有普遍的使用价值。在这个研究中,发现预测精度比线性判别分析要高。张佳敏(2014)使用了150家昆明高新科技微型贷款企业作为调查样本。分为默认和非默认,构建逻辑回归模型和代理回归模型,发现前者的假阳性率比后者低4。(2) 专家分析法(Expert analysis)。20世纪50年代以前,外国的信用评价技术主要依赖于专家的经验和判断,即综合研究企业主的基本个人信息、与事业运营相关的财务信息、事业竞争力、经济环境、开发等方面的专家分析。评
22、估企业主的个人资质和公司资产评估等的前景及其他因素,以决定是否投资该项目。其中,5 c法(品质、能力、资本、抵押贷款,条件),5 p法(个人因素,资金使用的因素,前因素、债券偿还保证因素,企业前景的因素),5 w法(借入人,偿还贷款的目的、偿还期限、担保、方法),lapp法(流动性、收益性,活动,可能性)等企业的信用评价历史上重要的创意是英里,斯通作为其内核此前广为流通,但那是个人的判断,专家的资质,依赖于专家的道德修养太过分了。之后,逐渐进行定性分析,定量信息被添加到结果中,如分析分级过程和模糊综合评价方法等,更加直观。比如,Zhang Chao et al。(2014)从中小企业的财务状况
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 中小 企业信用 评估 研究 0707
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内