上市公司财务报表稳健性因子分析,应用数学论文.docx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《上市公司财务报表稳健性因子分析,应用数学论文.docx》由会员分享,可在线阅读,更多相关《上市公司财务报表稳健性因子分析,应用数学论文.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、上市公司财务报表稳健性因子分析,应用数学论文为了避免异常值的影响,需要使用稳健性估计量。多元均值和协方差阵的经典估计量是样本均值和样本协方差阵。假如数据来自正态总体的话,它们是最优的估计量,但是它们对异常值非常敏感。假如数据中有异常值,异常值会影响样本均值和样本协方差阵,进而会影响依靠于它们的经典因子分析1.因而有必要考虑使用样本均值和样本协方差阵的稳健性估计量。本文所采用的数据是上证A股2020-09-30三季度财务数据,共有957只股票样本,10个财务指标变量,数据下载自免费的大智慧软件。为了愈加客观地对待每一个样本点,本文采用稳健性因子分析。使用的上市公司财务量化指标包括:主营业务收入x
2、1,元、主营业务利润x2,元、利润总额x3,元、净利润x4,元、每股收益x5,元、每股净资产x6,元、净资产收益率x7,%、总资产收益率x8,%、资产总计x9,元、股本x10。需要讲明的是,大智慧软件中没有总资产收益率这个指标,但它能够由公式总资产收益率x8=净利润x4资产总计x9计算得到。本文采用R软件2进行计算。1 实证从图1能够看出异常点在经典因子分析中的影响。我们所采用的数据是经典的Hawkins,Bradu and Kass hbk数据集,它来自软件包robustbase3,有75个样本,4个变量一个响应变量,三个解释变量。前10个样本是坏的杠杆点,1114样本是好的杠杆点即:它们的
3、x部分是异常的,但是它们的y部分对模型拟合得很好。在这里我们只考虑hbk数据集的x部分。左图显示的是经典因子分析前两个因子的散点图,前两个因子解释了总方差的99.4%.异常点114被有效地区分了出来,但是正常点远离原点因子得分的样本均值理应在原点,由于因子得分是从样本相关阵出发计算的。除此之外,97.5%的置信椭圆没有覆盖正常点,这表示清楚置信椭圆被异常点严重地影响了注意:经典因子分析的置信椭圆并不一定要比稳健性因子分析的置信椭圆大,置信椭圆的大小由特征值的大小确定。右图显示的是稳健性因子分析前两个因子的散点图,前两个因子解释了总方差的71.5%.我们发现稳健性因子得分的样本均值没有遭到异常点
4、的影响,并且异常点被97.5%的置信椭圆很好地区分开来。进一步计算因子得分的样本均值,我们发现:经典因子分析的因子得分在所有点的样本均值为0 3.700743e-18, 4.302114e-18,而在正常点上不为0 4.545664, 1.874009;稳健性因子分析的 因 子 得 分 在 所 有 点 的 样 本 均 值 不 为 0-0.3613164, -0.3013054, 而 在 正 常 点 上 为 01.069557e-16, 2.832434e-17。下面我们利用FaCov函数计算稳健性因子分析。它的一般使用格式为:FaCovx, factors = 2, cor = FALSE,
5、cov.control = CovControlMcd, method = c mle , pca , pfa ,scoresMethod = c none ,regression ,Bartlett , 华而不实x是一个数值矩阵或者是一个能够强迫为数值矩阵的对象如数据框。factors是因子个数,默认值为2.cor是一个逻辑变量,假如cor = TRUE则用相关阵进行计算,假如 cor = FALSE默认值则用协方差阵进行计算。cov.control用来确定用什么样的稳健性估计量来计算稳健性样本均值和稳健性样本协方差阵,它的取值为类为CovControl的对象,默认值为CovControlM
6、cd,这时所取的稳健性估计量为MCD.假如cov.control = NULL,则用经典的估计量来计算样本均值和样本协方差阵。method是因子分析所用的方式方法,它的取值为 mle 默认值,极大似然法, pca 主成分法和 pfa 主因子法。scoresMethod表示计算因子得分的方式方法,默认值是 none 即不计算因子得分, regression 表示用回归法计算Thompson因子得分, Bartlett 表示用加权最小二乘法计算Bartlett因子得分。既然计算因子分析的方式方法有 mle , pca 和 pfa 3种,而cov.control的取值有CovControlOgk,C
7、ovControlMcd,CovControlMest,CovControlMve,CovControlSde,Cov-ControlSest等6种。那么哪一种配对是最佳的呢?我们采用的准则是选择使残差矩阵 E 的元素平方和 Q E 最小的方式方法。见文献.华而不实E = R - AAT+D = eijp pQ E = i = 1pi = 1peij2.结果见表1.同时我们也计算了3种因子分析方式方法下经典估计量的 Q E 。在表1中 Q E 最小的组合是pfa,Classic,但是由经典估计量计算的样本均值和样本协方差阵严重地遭到了异常点的影响,所以我们在剩下的稳健性估计量中选择最小的 Q
8、E ,它就是组合pfa, Sde,此时的 Q E =0.09865221.注意:表1中的结果是在set.seed2下得到的,假如不set.seed,则每次运行的结果会稍有不同,但是对此数据集在绝大多数情况下,组合pfa, Sde得到的 Q E 都是最好的。并且对某些 set.seed,method = mle 会报错,比方当set.seed5时,method = mle 且cov-Control = CovControlMve会报错。如今我们利用robustfa4软件包中plot-utils.R中的my-plotDD函数来画类为Cov的对象,如此图2所示。此处使用的稳健性估计量是Sde估计量,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内