《上市公司年报数据分析案例010041.pdf》由会员分享,可在线阅读,更多相关《上市公司年报数据分析案例010041.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、谋事在人,成事在天!增广贤文百川东到海,何时复西归?少壮不尽力,老大徒伤悲。汉乐府长歌行统计教学案例二 上市公司年报数据分析案例 经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其依存因素。其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不
2、同特征相互联系的紧密程度,揭示变化形式和规律。本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。本章由 1 个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。上市公司年报数据分析案例的教学目的:数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对 1999年沪深
3、股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。案例的背景分析与数据资料 一、案例的现实意义 上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通
4、过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。二、案例所依托的总体及其现状与研究目的(一)案例所依托的客体 本案例所依托的客体是 1999 年上市公司年报中的有关财务指标。1999 年末,沪、深两市共有上市公司 949家。这些上市公司分布在 13 个行业部门。根据中国证监会的上市公司分类指引中规定的分类方法,其中制造业共有 578 家,占%。总股本 1938 亿元,占%,制造业是上市公司最集中的行业。截止 2000 年 4 月 30 日,已公布年报的有 560 家。所以本案例研究的总体范围确定为如期公布年报的制造业560 家上市公司。(二
5、)案例研究的目的与任务 1 上市公司年报财务数据统计分析的目的 通过对制造业 1999 年报有关数据进行系统的统计整理、描述和回归分析,揭示 1999 年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。2上市公司年报财务数据统计分析的任务 对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。3上市公司年报财务数据统计分析的对象 本案例所引用资料取自上海证券报,包括了制造业 560
6、 家上市公司。共选有 8 个财务指标:总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。其中,前4 个为反映资产、收益方面的总量指标,后 4 个为反映盈利能力、业绩水平的相对指标。云路鹏程九万里,雪窗萤火二十年。王实甫人人好公,则天下太平;人人营私,则天下大乱。刘鹗4数据的初步分析制造业上市公司行业结构 在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据上市公司分类指引,制造业进一步分为 10 个行业种类,编码为 C0、C1
7、、C2、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。表 21 制造业上市公司行业分布 代 码 行业分类 上市公司数 比重(%)C0 食品、饮料 48 C1 纺织、服装、皮毛 45 C2 木材、家具 2 C3 造纸、印刷 16 C4 石油、化学 130 C5 橡胶、塑料 10 C6 金属、非金属 96 C7 机械、仪表、设备 151 C8 通讯、电子 51 C9 其他 11 合 计 560 这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999 年 560 个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等)
8、;23%是石化类行业;而冶金、钢铁等金属非金属类公司占 17%;通讯电子章 9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业政策导向,在 1999 年新发行的 A 股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。方 案 设 计 一、案例设计的思路 本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据
9、进行处理:1分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。2分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。3分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。4分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。5分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。6在上述研究分析的基础上给出关于对对象的定性认识结论。二、案例设计
10、的工作过程(一)数据整理与描述 1编制按各财务指标的变量数列(1)将数据顺序排列。(2)计算描述统计指标。人人好公,则天下太平;人人营私,则天下大乱。刘鹗天行健,君子以自强不息。地势坤,君子以厚德载物。易经在 Excel“工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是;平均算术平均数,即x=nx 标准误差抽样平均误差,即n 中值中位数,即 Me;模式众数,即 Mo;标准偏差标准差,即;样本方差方差,即2 峰值峰度,即44m 偏斜度偏度,即33m;区域全距,即最大值减最小值;求和标志总量;计数总体单位总数;最大(K)第 K 个最大值;最小(K)第 K 个最
11、小值;置信度“数据分析”中默认概率为95%(也可自行选择)的 1/2 误差范围。(3)分析描述统计指标比较平均数、众数、中位数的大小;偏度系数的大小、方向等。(4)确定组数和组距当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以 K 倍标准差为组距。(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。2制造业公司主要财务指标的分布(1)总资产分布数列和直方图 总资产描述统计 1 平均 标准误差 中值 模式 标准偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 +10 2178598 2190846 560 谋事在人,成事在天!
12、增广贤文常将有日思无日,莫待无时思有时。增广贤文 置信度 (95%)总资产描述统计 2 平均 标准误差 中值 模式 标 准 偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95%)=10 547 从描述统计 1 看,560 家公司的总资产呈高度偏态。总资产最大值是上海石化 219 亿元,最小值是 ST 黔凯涤亿元,相差近 200 倍。将 6 个总资产 100 亿和 7 个 2 亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。不论何种分布,均值和方差其分布的两个主要特征值。根据切
13、比雪夫定理,可以平均数为中心,以K 倍的标准差为组距,因为此时平均数K 倍的标准差所涵盖的数据范围不小于 11/2K。本例中,均值亿元,中位数亿元,标准差 15 亿元,说明 560 家公司的总资产分布为右偏态。若以 1 个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用 1/2 标准差,即亿元为组距,由于 100 亿元以上只有 7 家,将 105 亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。表 22 560 家上市公司总资产分组统计 分组(万元)频数 频率(%)75000 以下 75000150000 150000225000 225000300000 3
14、00000375000 375000450000 450000525000 525000600000 600000675000 675000750000 750000825000 825000900000 900000975000 9750001050000 1050000 以上 209 192 64 33 18 15 4 2 4 6 2 1 3 1 6 合计 560 我尽一杯,与君发三愿:一愿世清平,二愿身强健,三愿临老头,数与君相见。白居易天行健,君子以自强不息。地势坤,君子以厚德载物。易经 从图表中可以知道,制造业中,总资产 8866 亿元,平均规模在 15 亿元左右。82%的上市公司总
15、姿产在亿元以下,100亿元以上的只有 1%。在各行业中,总资产规模最大的是 C8通信电子行业亿元,最低的是 C2木材家具业亿元,另外,C4石油化工、C5橡胶塑料、C6金属非金属的总资产规模在平均之上。频数050100150200250750001500002250003000003750004500005250006000006750007500008250009000009750001050000其他 图 21 560 家制造业公司总资产分布(2)净利润分布数列和直方图 净利润描述统计 平均 标准误差 中值 模式 标准偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(9
16、5%)#N/A +08 3734913 560 净利润分布呈右偏态。以 1/2 标准差 6500 万元为组距,可分 17 组。分组后亿元以上各组不仅频数少,而且有两组频数为 0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表 23 和图 22。表 23 560 家上市公司净利润分布 先天下之忧而忧,后天下之乐而乐。范仲淹人不知而不愠,不亦君子乎?论语净利润分组(万元)频 数(个)频 率(%)13000 以下 130006500 65000 06500 650013000 1300019500 1950026000 2600032500 32500 以上 14 10 2
17、2 332 112 24 13 16 17 79 合 计 560 净利润分组(万元)图 22 560 家上市公司净利润分布 将亏损亿元以下的公司合并为一组,亿元以上的公司合并为一组,组数减少到9 组,总体仍为右偏态。从整理后的净利润的资料我们注意到:第一,制造业中,1999 年度 46 家公司亏损,亏损面%,最多的亏损亿元。第二,制造业 1999 年度净利润总额亿元,受亏损公司的影响,560 家公司总体平均利润只有 6500 万元。79%的上市公司净利润在 70 万亿元之间。第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在 7 亿元以上;年净利润在亿元以上的公司有
18、16 个,不足总数的 3%,但它们的净利润占到制造业全行业的%,充分体现了大型国企确实是国民经济的脊梁。第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0食品饮料净利闰亿元;C6金属非金属净利闰亿元;C8通信电子净利闰 1 亿元。(3)每股收益分布数列和直方图 每股收益描述统计 1 平均 标准误差 中值 模式 标准偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95%)560 每股收益描述统计 2 平均 标准误差 中值 模式 标准偏差;其身正,不令而行;其身不正,虽令不从。论语良辰美景奈何天,便赏心乐事谁家院。则为你如花美眷,似水流年。汤显祖样本方差
19、 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95%)556 每股收益是一强度相对指标。从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:组数=1+560=10;组距=2/10=,极值用开口组处理。见表 24 和图 23。表 24 560 家上市公司每股收益分组统计 分 组 频数(个)频率(%)以下 0 0 以上 14 6 13 13 197 231 60 19 6 1 合 计 560 频数050100150200250-0.6-0.4-0.200.20.40.60.81 每股收益分组(元)图 23 560 家上市公司每股收益
20、分布 每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。古之立大事者,不惟有超世之才,亦必有坚忍不拔之志。苏轼勿以恶小而为之,勿以善小而不为。刘备不仅在行业之间,而且可以在公司之间进行比较。从表 24 图 23 看 560 家公司每股收益的特点:第一,1999 年制造业的每股收益的分布略乘左偏态,即平均数为元,但是相对多数的公司每股收益高于元。第二,35%的公司在元的微利水平,52%的公司盈利水平再元之间。26 家公司盈利水平较高,在元以上,但只占%。1999 年的改制表状元是五粮液,达到每股收益元。第三,分行也看,经营业绩差别的行业因素非常
21、明显:最高的是 C0食品饮料,达到每股收益元;大于等于每股收益元的还有 C1纺织、服装,C5橡胶塑料,C8 同新点子,C9其他;最低的事 C2木材家具,只有元。(4)净资产收益率分布数列和直方图 净资产收益率 1 平均 标准误差 中值 模式 标准偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95%)558 净资产收益率 2 平均 标准误差 中值 模式 标准偏差;样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度(95%)540 由于资料中两个公司(0515PT 渝钛白和 600818ST 永久)的净利润 净资产为负值,所以此处只有 58 个公司的数据。5
22、58 个公司的净资产旅呈高度左偏态。净资产收益率过高或过低,都数不正常情况。舍弃 40%以上和40%以下的 18 个极端值后,描述指标基本正常。以 1 倍标准差 8%为组距、48%以上和48%一下合并各 1 组,共分 14 组。表 25 和图 24 显示,集中趋势非常明显。表 25 560 家公司净资产收益率分组统计 分组(%)频数 频率(%)百学须先立志。朱熹以家为家,以乡为乡,以国为国,以天下为天下。管子牧民小于48 4840 4032 3224 2416 168 80 08 816 1624 2432 3240 4048 大于 48 13 1 2 5 6 8 10 190 270 39
23、7 3 1 3 合计 558 净资产收益率分组(%)图 24 560 家上市公司净资产收益率分布 净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:第一,1999 年度,制造业的总体净资产收益率 9%(这里采用了中位数,因为忽略极值厚中位数没有变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致)。第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。第三,34%的公司净资产收益率在%8%之间;48%的公司在%16%之间。第四,8%的公司净资产在 16%32%的高水平上,从行业看,这些公司集中在生物制药、
24、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。3制造业各行业主要财务指标的分布 接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。(1)制造业各行业净利润分布频数统计表和频率统计表 合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表 26、表 25)。表 26 制造业各行业净利润分布统计(频数)代 码 净利润分组(万元)行业分类 小于 0 0 大于 合计 C0 食品、饮料 1 27 14 3 1 1 1 48 C1 纺织、服装、皮毛 1 1 2 27 13 1 45 C2 木材、家具
25、1 1 2 C3 造纸、印刷 1 12 3 16 C4 石油、化工 2 2 5 81 28 6 2 4 130 C5 橡胶、塑料 8 1 1 10 C6 金属、非金属 3 4 2 53 17 4 3 5 5 96 C7 机械、仪表、设备 6 10 94 24 4 5 4 4 151 C8 通信、电子 2 2 1 22 10 3 4 4 3 51 C9 其他 7 2 2 11 合计 14 10 22 332 112 24 13 16 17 560 从表 26、27 中可以看到:人不知而不愠,不亦君子乎?论语百学须先立志。朱熹第一,总共 45 个亏损公司,占全部公司的 8%,他们的行业间分布是:C
26、7机械、仪表、设备行业亏损面最大,有16 家,占行业%;其次是 C8、C6 和 C1分别为%、%、%;C2木材家具仅有 2 家公司,亏损 1 家。第二,C5橡胶、塑料和C9其他行业无亏损企业,且净利润水均衡,集中在019500 万元。第三,净利润绝对水平的高低与行业类别有关联,3 亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。表 27 制造业各行业净利润分布统计(频率%)代 码 净利润分组(万元)行业分类 小于 0 0 大于 合计 C0 食品、饮料 C1 纺织、服装、皮毛 C2 木材、家具 50 C3 造纸、印刷 C4 石油、化工 C
27、5 橡胶、塑料 C6 金属、非金属 C7 机械、仪表、设备 C8 通信、电子 C9 其他 合计 (2)制造业各行业每股净收益分布频数统计和频率统计 表 28、29 显示的是不同行业每股收益的不同水平的分布。在%的盈利公司中,若每股收益元以上为绩优股,则绩优股的比率%。绩优股的行业特征也非常明显:食品行业最高,为%,其后依次是通信电子行业%、机械仪表设备%。从表面上看其他行业最高(%),但是其他行业属于主营收入不明显的“收容”类,其较高的每股收益得益于多元化经营,因此在比较时,应予以忽略。表 28 制造业各行业每股收益分布统计(频数)代 码 净利润分组(元)行业分类 小于 0 0 大于 合计 C
28、0 食品、饮料 1 10 24 9 2 1 1 48 C1 纺织、服装、皮毛 1 2 1 11 27 1 2 45 C2 木材、家具 1 1 2 C3 造纸、印刷 1 8 7 16 C4 石油、化工 3 1 2 3 58 52 9 2 130 C5 橡胶、塑料 4 4 2 10 C6 金属、非金属 2 6 1 32 43 10 2 96 C7 机械、仪表、设备 2 3 4 7 56 52 16 9 2 151 C8 通信、电子 4 1 14 16 12 3 1 51 C9 其他 4 5 1 1 11 合计 14 6 13 13 197 231 60 19 6 1 560 表 29 制造业各行业
29、每股收益分布统计(频率%)代 码 净利润分组(元)行业分类 小于 0 0 大于 合计 C0 食品、饮料 先天下之忧而忧,后天下之乐而乐。范仲淹以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。旧唐书魏征列传C1 纺织、服装、皮毛 C2 木材、家具 C3 造纸、印刷 C4 石油、化工 C5 橡胶、塑料 C6 金属、非金属 C7 机械、仪表、设备 C8 通信、电子 C9 其他 合计 (二)相关和回归分析 本案例相关和回归分析研究主要是 8 个财务指标间的相互关系问题。各财务指标分别说明上市公司的财务状况的某一侧面。那么这些指标之间有无关系?若有关系,是什么样的关系?通过本案例的探讨
30、,可以帮助我们筛选主要个财务指标作为分析公司业绩变动的因素。1制造业业绩指标之间的关系研究 表 210 是 8 个财务指标的两两指标间的线性相关系数。表 210 制造业有关业绩指标相关系数矩阵 净资产 收益率 净利润 净资产 总资产 主营业务收入 每股 收益 每股净资产 股东权益比率 净资产收益率 1 净利润 1 净资产 1 总资产 1 主营业务收入 1 每股收益 1 每股净资产 1 股东权益比率 1 从相关系数矩阵看,可以得到以下几点共性的结论:(1)主营业务收入与总资产、净资产、净利润这些总量指标显着相关,其中与总资产高度正相关。总资产比较大时,主营业务收入也倾向于比较大,而主营业务收入比
31、较大时,净资产、净利润也比较高。这从实际情况看是可以理解的。在正常情况下,制造业的净资产除了货币资金外,主要就存货和厂房、设备等固定资产。尤其是固定资产,使生产活动的物质技术基础,其数量的多少、技术的高低决定了产品的方向及生产方式,从而决定了收入水平,并且决定了净资产的水平。(2)虽然净资产收益率等于净利润除以净资产,但是净资产除了与净利润微弱相关外,与其他总量指标几乎不相关,也就是说,净资产收益率与资产规模、主营业务收入没有线性关系。主营业务收入水平高低并不决定盈利能力。(3)几个相对指标之间,净资产收益率和每股收益显着正相关。在绝大多数行业中,这种相关程度均高于制造业总体的相关系数。这一点
32、告诉我们,在说明上市公司经营业绩时,净资产收益率和每股收益两个指标选择其中之一就够了。(4)每股收益、每股净资产作为总量指标的派生指标,除每股收益与净利润外,其他均与净利润、净资产和总资产微弱相关,说明他们抽象了投入规模的不同,可载的行业、各类型的上市公司之间比较。(5)一般地,派生指标与他们的分子指标相关系数要高于与它们的分母指标之间的相关系数。例如:净资产收益率与净利润的相关关系属要高于与净资产的相关系数。(6)就不同行业来看,各指标之间的相关系数均有所差别,表211 显示:不论从整个制造业还是个行业,主营业务收入、净资产与总资产高度正相关是一致的;在相对指标上产生了分化。其他行业由于主业
33、不明,指标之间相关也很微弱。除此之外,净资产收益率与净利润和每股收益呈现不同程度的相关,机械行业表现得最明显。老当益壮,宁移白首之心;穷且益坚,不坠青云之志。唐王勃老当益壮,宁移白首之心;穷且益坚,不坠青云之志。唐王勃表 211 制造业上市公司行业有关指标的相关系数 行 业 分 类 主 营业 务 收入与总资产 净资产与 总资产 净资产 收 益率与净利润 净资产收益率与每股收益 C0 食品、饮料 C1 纺织、服装、皮毛 C3 造纸、印刷 C4 石油、化工 C5 橡胶、塑料 C6 金属、非金属 C7 机械、仪表、设备 C8 通信、电子 C9 其他 合 计 2制造业业绩指标间的回归分析 回归分析是用
34、函数关系近似描述相关关系的表现形式,它反映的是变量之间的一种变动规律。一般地,选择哪种形式的回归模型可以通过:观察散点图;根据专业知识和经验判断。本案例中,除以上两点外,还可以根据相关系数判断,由于皮尔生积矩相关系数是对两变量线性相关程度的侧度,所以对显着相关程度以上的变量可建立线性回归函数来模拟变量间的关系,即:(1)主营业务收入与总资产的回归分析 由于主营业务收入与总资产的线性相关系数最大,以主营业务收入为因变量 Y,总资产为自变量 X,用 560 家制造业公司数据建立一元线性回归方程:Excel“工具”栏中“数据分析”的“回归”提供了相关和回归分析的结果:Multiple R相关系数;R
35、 Square判定系数;Adjusted R Square调整的判定系数 teSSSSpnn111 标准误差估计标准误xyS;观测值X、Y 变量的对数。方差分析有关指标含义见表212。表 212 df F 值 Significance F 回归分析 回归偏差 自由度 回归偏差 平方和 回归偏差平均平方和 残差 剩余偏差 自由度 剩余偏差 平方和 剩余偏差平均 平方和 总计 总偏差 自由度 总偏差 平方和 总偏差平均 平方和 Intercept截距 a;X Variable一元回归的回归系数 b;标准误差截距 a 的标准差为a;回归系数 b 的标准误差为b;T 统计量对 a 和 b 检验时采用的
36、统计量;丈夫志四方,有事先悬弧,焉能钧三江,终年守菰蒲。顾炎武先天下之忧而忧,后天下之乐而乐。范仲淹 P-value P 值;Lower95%,Uooer95%;截距 a 或回归系数 b 的 95%置信峡县、置信上限;此为墨任值,若选择其他置信水平,相应的置信下限、置信上限在后面列出。回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值 560 方差分析 df SS MS F Significance F 回归分析 残 差 1 +13 +13 558 +12 +09 总 计 559 +13 主营业务收入对总资产的一元线性方程:Y=-13975+
37、回归系数说明,总资产每增加 1 万元,制造业主营业务收入平均增加万元.从判定系数看,在总资产对主营业务收入的影响中,有 83%可以由该线性回归方程解释,从 t 检验看,回归系数是显着的.回归分析中,对随机误差,我们要求它均值为0,并假定其服从正态分布.从F检验看,假定成立,从残差分布图看,其分布是”杂乱无章”的,回归方程是合适的.建立回归方程,不仅为我们描述了主营业务收入和总资产这两个指标间的联系形式,我们利用它还可以进行预报和控制.给定总资产,可以对主营业务收入水平作区间估计.本案例样本较大,当 X=X0时,Y 的 1-a 置信区间:Y=XYSZY2 这里的SXY是残差平均平方和MS的平方根
38、,即”回归统计”表中的”标准误差”或从”方差分析”表资料中可以计算得到;Y是 X=X0时回归方程得到的点估计值;2Z是给定 a 时的临界值。例如,我们想知道,当 X=20 万元时,主营业务收入 95%置信区间:点估计值是Y=13975+200000=122025(万元)估计值标准误差是残差 MS21=(00)1/2=65879 主营业务收入置信区间:65879Y122025+65879=-7098251148 即总资产为 20 亿元规模时,估计主营业务收入的上限为 25 亿元,下限可能是亏损的.(2)净利润与主营业务收入和每股收益的二元回归分析 由于指标间的关系在不同行业表现各异,本案例仅研究
39、了 C8-通信电子行业.通信电子行业相关系数矩阵见表 212 Coeffici-标 准 T 统 下限 上限 ents 误 差 计 量 P 值%Intercept X1 Variable-13975 百学须先立志。朱熹以家为家,以乡为乡,以国为国,以天下为天下。管子牧民表 212 通信电子有关业绩指标相关系数矩阵 净资产 收益率 净利润 净资产 总资产 主营业务收入 每股 收益 每股净资产 股东权益比率 净资产收益率 1 净利润 1 净资产 1 总资产 1 主营业务收入 1 每股收益 1 每股净资产 1 股东权益比率 1 从定性分析角度知道,净利润与主营业务收入、总资产、净资产有密切关系,其相关
40、系数又从定量角度给予证明.另外,从表中还看到,净利润与每股收益、每股净资产也表现出了显着正相关的关系,可能的解释在于:财务指标不是孤立的,它们之间彼此有直接关系的影响,同时包含了间接关系的影响.可以用多元回归研究净利润和其他指标的关系.但是,在主营业务收入、总资产、净资产之间存在着高度关系,研究净利润与多个指标的关系时它们或者可以相互替代,或者必须删去以避免多重共线性对回归模型的影响.因此,这里选择主营业务收入和每股收益(它们之间的相关系数,小于,建立净利润与主营业务收入和每股收益的二元线性回归方程.计算结果如下:回归统计 Multiple R R Square Adjusted R Squa
41、re 标准误差 观测值 51 方差分析 df SS MS F Significance F 回归分析 残 差 2 +09 +09 48 +09 总 计 50 +10 净利润 Y 与主营业务收入 X1和每股收益 X2的线性回归方程为:Y=+1+2 T 检验的 P 值,除了截距 B0 的 P 值稍大,B1、B2 的 P 值均小于,回归系数是显着的.F 检验的结果证明,模型整体也是显着的,即净利润与主营业务收入及每股收益整体看存在线性相关关系.复相关系数,高于净利润与主营业务收入及与每股收益的单相关系数.偏相关系数经计算可得:Coeffici-标 准 T 统 下限 上限 ents 误 差 计 量 P
42、 值%Intercept X1 Variable X2 Variable 云路鹏程九万里,雪窗萤火二十年。王实甫以铜为镜,可以正衣冠;以古为镜,可以知兴替;以人为镜,可以明得失。旧唐书魏征列传两个指标对净利润仍旧是正相关的关系,比较而言,主营业务收入(X1)的影响更大些。三、数据整理和分析的客观评价(一)案例对 560 家上市公司 1999 年报 8 个财务指标数据整理分析过程的优点 1 整理频数分布的时候首先借助于描述指标的判断,使统计整理工作有了着眼点当面对纷繁的、大量的原始数据,总体的分布及数据的分布特征根本无从得知.因此编制数据的频数分布从那里着手呢?根据的是什么呢?当然是数据总体的几
43、个主要特征值:平均数(众数、中位数)、全距、方差、偏度等.而应用 Excel 的”数据分析”,这些特征值很容易得到.掌握了这些特征值,对分组的组数、组距的确定才有了依据.所以案例提出的方法,解决了整理频数分布的可操作性问题。2在研究指标(变量)间关系时,利用相关系数矩阵全面比较判断,使进一步确定建立回归函数的形式、建立回归模型有了明确的依据。(二)几个有待进一步研究的问题 1频数分布的编制没有固定的模式,因此不是唯一的,采用不同的组距、组限,就有不同的分布数列.如何评价哪一个数列最恰当或者最确切反映总体分布特征是一个值得研究的问题。2统计整理中的制造业行业分组所汇总的统计表,是按照全行业整理时的组距分组的.对不同行业来说,这种组距、组数的划分不一定是最恰当的.若要研究某一行业情况,可根据其指标(变量)差异情况另行分组。3相关系数矩阵表描述的是一元线性相关系数,反映的是线性关系的程度.线性相关系数值很小,只是说明两指标(变量)间不存在线性相关,但是否存在非线性相关,需进一步测定.本案例中,通过散点图(图 5-6、图 5-7)可以发现,有些指标如主营业务收入和每股收益之间,就存在非线性关系,其规律有待进一步研究。(本案例参考李晓玉编着的统计描述与相关回归分析案例)
限制150内