基于数据挖掘的上市公司财务预警建模与分析.doc
《基于数据挖掘的上市公司财务预警建模与分析.doc》由会员分享,可在线阅读,更多相关《基于数据挖掘的上市公司财务预警建模与分析.doc(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 本科毕业论文基于数据挖掘的上市公司财务预警建模与分析孙新苗201512080217指导教师 周燕 讲师学院名称数学与信息学院 专业名称统计学论文提交日期2019年4月27日 论文答辩日期2019年5月11日摘 要随着经济体制的改革,我国经济呈现出快速增长的态势,上市公司的数量也迅速增长。但是根据国际通用的衡量标准,我国上市公司的财务状况并不乐观,企业财务风险评估作为企业财务预警和帮助变更经营策略的关键,目前越来越受到政府、业界以及学术界的关注。一个好的财务风险评估模型,能够精准预测企业的财务风险,从而促进我国上市公司的经营和发展。因此,从企业的海量财务数据中提取出对企业财务风险具有预警作用的
2、信息,建立预测精度高的财务风险预警体系,成为我国上市公司亟待解决的问题。本文的上市公司财务风险建模分析是基于Logistic回归、神经网络和C5.0决策树这三种算法来实现的。首先,介绍财务预警的流程和研究方法,解释本文使用的三种数据挖掘方法。然后,结合前人的研究成果,根据我国企业实情,筛选财务指标,构建基于因子分析方法的财务风险预警指标体系。最后,使用SPSS22.0和R软件,对选取的样本数据进行财务风险预警的实证分析。模型结果表明,基于数据挖掘的上市公司财务预警结果更准确。就本文使用的三种算法来看,财务风险发生的时间越近,预测精度越高。从短期预警来看,预测准确率最高的是C5.0决策树算法;从
3、长远来看,相比较于Logistic回归和决策树算法,神经网络模型的预测能力更强。此外,模型的结果显示,盈利能力和偿债能力指标是企业在接下来的经营过程中应当引起重视,有利于帮助企业及时发现财务问题,调整经营策略和方法。关键词 财务预警 数据挖掘 Logistic回归 神经网络 决策树Modeling and Analysis of Financial Early Warning of Listed Companies Based on Data MiningSun Xinmiao(College of Mathematics and Information, South China Agricu
4、ltural University, Guangzhou 510642, China)Abstract: With the reform of the economic system, Chinas economy has grown rapidly, and the number of listed companies has also grown rapidly. However, according to the internationally accepted measurement standards, the financial status of Chinese listed c
5、ompanies is not optimistic. As the key corporating financial early warning and helping to change business strategies, corporate financial risk assessment is receiving more and more attention from the government, industry and academia. A good financial risk assessment model can accurately predict the
6、 financial risks of enterprises, thus promoting the operation and development of listed companies in China. Therefore, extracting information that has early warning effect on corporate financial risk from the massive financial data of enterprises, and establishing a financial risk early warning syst
7、em with high prediction accuracy has become an urgent problem for listed companies in China.The financial risk modeling analysis of listed companies in this paper is based on Logistic regression, neural network and C5.0 decision tree. First, introduce the process and research methods of financial ea
8、rly warning, and explain the three data mining methods. Then, based on the previous research results, according to the actual situation of Chinese enterprises, select financial indicators, construct a financial risk early warning index system based on factor analysis method. Finally, using SPSS22.0
9、and R software, the empirical analysis of financial risk warning is performed on the selected sample data.The model shows that the financial early warning results of based on data mining are more accurate. Acorrding to the three algorithms used in this paper , the closer the financial risk occurs, t
10、he higher the prediction accuracy. The C5.0 decision tree algorithm is the most accurate in short-term . In the long run, the neural network model has stronger predictive ability in long-term. In addition, the company should pay attention to the profitability and solvency indicators in the next busi
11、ness process, which helps the company to find financial problems and adjust business strategies in time.Key words: Financial warning Data mining Logistic regression Neural Networks Decision tree目 录1 前言11.1 研究背景及意义11.2 文献综述11.3 本文的研究方法31.3.1 本文的研究内容及方法31.3.2 本文的结构32 数据挖掘理论52.1 数据挖掘的步骤52.2 主要数据挖掘方法63
12、上市公司财务风险预警模型的构建63.1 财务风险预警模型的研究和设计73.2 财务风险预警指标体系的构建83.3 本文采用的数据挖掘方法93.3.1 因子分析93.3.2 Logistic回归103.3.3 神经网络103.3.4 C5.0决策树114 上市公司财务风险预警的实证分析134.1 数据准备134.1.1 数据样本的选取134.1.2 数据样本的描述分析134.2 因子分析174.2.1 Bartlett检验和KMO检验174.2.2 因子确定和解释184.2.3 确定公共因子表达式204.3 Logistic回归204.3.1 建立Logistic回归模型214.4 BP神经网络
13、234.4.1 模型建立234.4.2 模型结果分析234.5 C5.0决策树254.5.1 模型建立254.5.2 模型结果分析254.6 模型结果评价265 结论285.1 研究结论285.1.1 模型结果285.1.2 现实意义295.2 模型局限性29参 考 文 献31附 录32致 谢431 前言1.1 研究背景及意义随着改革开放和经济变革的发展,目前我国上市公司的数目约为3500家。经济变革和发展,给上市公司带来了机遇,同时也伴随着风险和挑战。我国证监会每年会对具有退市风险的上市公司进行特别处理(ST),绝大多数上市公司被特别处理是因为财务状况异常。目前,国际上已经有通用的会计准则衡
14、量,按照该通用准则,我国存在财务风险的上市公司的数目超过80%。结合我国的实际情况,降低标准,依然有超过20%的企业将面临财务危机。由此看来,目前我国的上市公司财务状况堪忧,企业的生存和发展受到财务风险的威胁。上市公司的财务问题,不仅对公司的生存和发展产生威胁,也损害了相关利益者的利益。投资者不能获取期望的收益;银行贷款不能按期收回;证券市场的秩序混乱,监管部门也面临着巨大的监管压力。因此,对于我国上市公司越来越深重的财务风险问题,急需行之有效的预警体系,对可能存在财务问题的上市公司提出预警,以尽快调整企业的经营和管理模式,摆脱财务问题。数据挖掘技术的发展,为开发有效的财务风险预警体系提供了可
15、靠的技术支持。企业在经营过程中会产生大量的财务数据,数据挖掘技术可以从这些海量数据中提取有用的信息并且自动进行分析,最后总结归纳,发掘上市公司财务数据背后的信息。数据挖掘得到的结果可以指导企业调整自己的战略计划、经营手段等,以规避风险,帮助企业更好地生存和发展。1.2 文献综述由于公司财务风险问题影响深重,研究者们一直致力于构建公司财务预警模型,目前已经有许多成果,并且这一课题的研究仍然十分火热。1966年,在当时比较成熟的单变量模型由研究者Beaver提出。79家破产的企业被选取为样本组,以相同数量的经营成功的企业为配对组,使用30 个财务指标,进行了一元判定预测。模型结果显示,离公司破产日
16、期越近,判别的正确率越高,在公司破产前一年的判别正确率高达87%。1977年,预测准确率更高的-ZETA模型由Altman 与Haldeman提出。两位研究者选取53 家破产公司为样本,配对样本为58 家经营成功的公司,建立财务风险的预警模型,模型的结果表明,单变量模型的预测效果不如-ZETA模型。由于Altman的-ZETA模型对预警变量的要求极为严格,在现实生活中,大部分的公司和企业的财务数据不能达到这样的要求,为此,Logistic回归模型被研究者Martin和Ohlson用来尝试构建企业的财务风险预警模型。在1977年, 58 家有财务问题的银行被选取为样本,一共8个财务指标被纳入财务
17、风险预警指标体系。这个基于Logistic回归方法的模型结果显示,它的预测精度是高于前面的模型。随着信息科学技术的发展,研究者们将目光从传统的分析方法转向数据挖掘技术。1987年,神经网络模型首次被应用于银行的信用进行评估和预测时。Lapedes 和 Fyaber建立的模型结果表明,神经网络这一数据挖掘技术的预测优于传统的统计学分析方法。除此之外,1985年Frydman运用决策树分类技术进行预警评估;1999年,多准则决策理论被研究者Zopounidis应用于财务预警模型的构建。2001年,Feng Yu Lin 和 Sally Mc Clean尝试将多种数据挖掘技术进行组合,构建混合模式的
18、财务风险预警模型,这其中就包括Logistic 回归、决策树、神经网络和判别分析。经过实证分析,基于数据挖掘技术的混合模式的预警模型预测能力高于单个模式的预警模型。在我国,2007年,赵芳芳在筛选财务指标时,采用了相关分析方法和 Logistic 回归,并且选则沪深两市的64 家上市公司作为样本。在对财务指标进行约简时,采用主成分分析法,最后构建基于神经网络技术的财务预警模型。上市公司财务预警建模的步骤主要有以下几个方面:界定财务风险、选择研究对象并搜集数据、构建预警指标体系、模型所使用的技术方法的选择、模型的评价。基于前人的研究,结合我国国情,本文对财务风险的界定标准为是否被证监会特别处理,
19、基于Logistic回归、神经网络和C5.0决策树这三种算法,选择15个财务指标,对上市公司的财务风险进行实证分析。1.3 本文的研究方法1.3.1 本文的研究内容及方法本文主要从以下几个方面对上市公司的财务状况进行研究:(1)阅读文献,找出衡量公司财务状况的指标,建立财务风险指标预警体系;(2)对被特殊处理的样本组和未被特殊处理的样本组做显著性T检验,目的是为了分析被特殊处理的样本组和未被特殊处理的样本组在财务指标上是否具有显著性差异;(3)进行因子分析,根据建模需要,将主因子提出,从而对财务指标进行约简;(4)基于Logistic回归、神经网络和C5.0决策树这三种算法进行实证分析;(5)
20、对研究的结果进行比较并且从模型和实际意义两个方面进行评价。本文不仅仅从理论上对上市公司财务预警进行建模分析,并且收集实际数据进行实证分析,运用Logistic回归,神经网络和C5.0决策树这三种数据挖掘方法,通过对三种方法评估结果的比较,选出最优挖掘策略。1.3.2 本文的结构本文的研究内容分为以下几部分:第一章,前言。对上市财务风险的研究背景及意义进行阐述,对国内和国外关于财务预警的研究成果进行总结归纳,从理论和实际两个方面确定本文的研究方法。第二章,数据挖掘理论,阐述数据挖掘技术的主要方法和流程,为本文的开展做技术铺垫。第三章,构建财务预警指标体系,并详细说明本文所运用的数据挖掘方法。第四
21、章,上市公司财务预警的实证分析。首先说明本文所选取的样本数据,接着运用前文阐述的三种数据挖掘技术进行实证分析,最后比较和评估三种挖掘技术的结果。第五章,结论。总结本文研究得出的结论,从模型结果和现实意义两个方面阐述本文得到的关于上市公司财务风险预警的结论。本文的研究结构如图1.1所示。图1.1 本文的结构流程图通过以上的分析,本文建立的模型预期结果如下。在对上市公司的财务预警进行实证分析后,比较三个挖掘技术的判断正确率和预测准确率,依此对三个挖掘技术的预警效果进行评价。通过对模型结果的分析,挖掘财务危机产生的原因,得到能够帮助制造业上市公司规避或减弱财务风险的建议。2 数据挖掘技术2.1 数据
22、挖掘流程根据数据挖掘的一般步骤,绘制了如图2.1所示的流程图。图2.1 数据挖掘流程图在进行数据挖掘的过程中,比起算法,对数据进行预处理更为关键。通常我们得到的一手数据是不规范的,如果直接使用原始数据进行分析,得到的结果可能和真实情况大相径庭,因此在数据挖掘之前进行数据预处理是非常必要的。2.2 主要的数据挖掘方法数据挖掘的主要目的是从数据中提取有效信息,得到研究所需要的结果。使用的数据挖掘技术需要针对不同的课题要求和不同类型的数据而变化。以下数据挖掘方法是经常被使用的。(1)统计学方法这是最传统和最基础的一部分,其中描述性统计帮助我们更清楚地认识数据。统计方法中的回归建模,在实际生活中有着广
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 上市公司 财务 预警 建模 分析
限制150内