统计案例复习.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计案例复习.pptx》由会员分享,可在线阅读,更多相关《统计案例复习.pptx(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1统计案例复习统计案例复习 统计案例统计案例要点梳理要点梳理1.1.回归分析回归分析 (1 1)定义:对具有)定义:对具有 的两个变量进行统计的两个变量进行统计 分析的一种常用方法分析的一种常用方法.(2 2)随随机机误误差差:线线性性回回归归模模型型用用y y=bxbx+a a+e e表表示示,其其 中中a a和和b b为模型的为模型的 ,称为随机误差称为随机误差.(3 3)样本点的中心)样本点的中心 在具有线性相关关系的数据(在具有线性相关关系的数据(x x1 1,y y1 1),(,(x x2 2,y y2 2),),(,(x xn n,y yn n)中,回归方程的截距和斜率的最小
2、二乘中,回归方程的截距和斜率的最小二乘 估计公式分别为:估计公式分别为:相关关系相关关系未知参数未知参数e e基础知识基础知识 自主学习自主学习第1页/共62页其中其中 称称为样本点的中心为样本点的中心.(4 4)相关系数)相关系数,.,r r=第2页/共62页当当r r 0 0时,表明两个变量时,表明两个变量 ;当当r r 0 0时,表明两个变量时,表明两个变量 .r r 的绝对值越接近于的绝对值越接近于1 1,表明两个变量的线性相关性,表明两个变量的线性相关性 .r r 的绝对值越接近于的绝对值越接近于0 0时,表明两个变量之间时,表明两个变量之间 .通常通常|r r|大于大于 时,认时,
3、认为两个变量有很强的线性相关性为两个变量有很强的线性相关性.正相关正相关负相关负相关越强越强几乎不存在线性相关关系几乎不存在线性相关关系0.750.75第3页/共62页2.2.残差分析残差分析 (1 1)总偏差平方和)总偏差平方和 把把每每个个效效应应(观观测测值值减减去去总总的的平平均均值值)的的平平方方加加起来即:起来即:.(2 2)残差)残差 数据点和它回归直线上相应位置的差异(数据点和它回归直线上相应位置的差异(y yi i-)是是 的效应,称的效应,称 为残差为残差.(3 3)残差平方和)残差平方和 .随机误差随机误差第4页/共62页3.3.独立性检验独立性检验 (1 1)分分类类变
4、变量量:变变量量的的不不同同“值值”表表示示个个体体所所属属的的 ,像这类变量称为分类变量,像这类变量称为分类变量.(4)(4)相关指数相关指数R R2 2=.R R2 2的值越大,说明残差平方和的值越大,说明残差平方和 ,也就是说模型,也就是说模型的拟合效果越好的拟合效果越好.在线性回归模型中,在线性回归模型中,R R2 2表示解释变表示解释变量对预报变量变化的贡献率,量对预报变量变化的贡献率,R R2 2越接近于越接近于1 1,表示回,表示回归的效果越好归的效果越好.越小越小不同类别不同类别第5页/共62页 (2 2)列列联联表表:列列出出两两个个分分类类变变量量的的 ,称称为为列列联联表
5、表.假假设设有有两两个个分分类类变变量量X X和和Y Y,它它们们的的可可能能取取值值分分别别为为 x x1 1,x x2 2 和和 y y1 1,y y2 2,其其样样本本频频数数列列联表(称为联表(称为2222列联表)为列联表)为2222列联表列联表y y1 1 y y2 2 总计总计 x x1 1 a a b b a+b a+b x x2 2 c c d d c+d c+d 总计总计 a+c a+c b+d b+d a+b+c+d a+b+c+d 频数表频数表第6页/共62页构造一个随机变量构造一个随机变量K K2 2=,其其中中n n=为样本容量为样本容量.(3 3)独立性检验)独立性
6、检验利用随机变量利用随机变量 来确定是否能以一定把握认为来确定是否能以一定把握认为“两两个分类变量个分类变量 ”的方法称为两个分类变量的独的方法称为两个分类变量的独立性检验立性检验.a+b+c+da+b+c+dK K2 2有关系有关系第7页/共62页基础自测基础自测1.1.相关系数度量相关系数度量()A.A.两个变量之间线性相关关系的强度两个变量之间线性相关关系的强度 B.B.散点图是否显示有意义的模型散点图是否显示有意义的模型 C.C.两个变量之间是否存在因果关系两个变量之间是否存在因果关系 D.D.两个变量之间是否存在关系两个变量之间是否存在关系 解解析析 相相关关系系数数来来衡衡量量两两
7、个个变变量量之之间间线线性性相相关关关关系的强弱系的强弱.A第8页/共62页2.2.甲、乙、丙、丁四位同学各自对甲、乙、丙、丁四位同学各自对A A、B B两变量的线性两变量的线性 相关性作试验,并用回归分析方法分别求得相关系相关性作试验,并用回归分析方法分别求得相关系 数数r r与残差平方和与残差平方和m m如下表:如下表:则哪位同学的试验结果体现则哪位同学的试验结果体现A A、B B两变量更强的线性两变量更强的线性相关性?相关性?()A.A.甲甲B.B.乙乙C.C.丙丙D.D.丁丁解析解析 r r0 0且丁最接近且丁最接近1 1,残差平方和越小,相关性,残差平方和越小,相关性越高,故选越高,
8、故选D.D.甲甲 乙乙 丙丙 丁丁r r0.82 0.82 0.78 0.78 0.69 0.69 0.850.85m m115 115 106 106 124 124 103 103 D第9页/共62页3.3.已已知知x x、y y之之间间的的数数据据如如表表所所示示,则则回回归归直直线线过过点点()A.(0,0)B.(,0)C.(0,)D.(,)A.(0,0)B.(,0)C.(0,)D.(,)解析解析 回归直线过样本点的中心(回归直线过样本点的中心(,).x x 1.081.08 1.121.12 1.191.19 1.281.28 y y 2.252.25 2.372.37 2.402.
9、40 2.552.55 D第10页/共62页4.4.下列说法中正确的有:下列说法中正确的有:若若r r0 0,则,则x x增大时,增大时,y y也相应也相应增大;增大;若若r r0 0,则,则x x增大时,增大时,y y也相应增大;也相应增大;若若r r=1=1或或r r=-1=-1,则,则x x与与y y的关系完全对应(有函数关系),在的关系完全对应(有函数关系),在散点图上各个点均在一条直线上散点图上各个点均在一条直线上()A.B.C.D.A.B.C.D.解析解析 若若r r0 0,表示两个相关变量正相关,表示两个相关变量正相关,x x增大时,增大时,y y也相应增大,故也相应增大,故正确
10、正确.r r0 0,表示两个变量负相关,表示两个变量负相关,x x增大时,增大时,y y相应减小,故相应减小,故错误错误.|.|r r|越接近越接近1 1,表示两,表示两个变量相关性越高,个变量相关性越高,|r r|=1|=1表示两个变量有确定的关系表示两个变量有确定的关系(即函数关系),故(即函数关系),故正确正确.C第11页/共62页5.5.在在一一项项打打鼾鼾与与患患心心脏脏病病的的调调查查中中,共共调调查查了了1 1 671671人人,经经过过计计算算K K2 2=27.63=27.63,根根据据这这一一数数据据分分析析,我我们们有有理理由由认认为为打打鼾鼾与与患患心心脏脏病病是是 的
11、的(有有关关,无关)无关).解析解析 K K2 2=27.63=27.6310.828,10.828,有有99.9%99.9%的把握认为的把握认为“打鼾与患心脏病有关打鼾与患心脏病有关”.有关有关第12页/共62页题型一题型一 线性回归分析线性回归分析【例例1 1】假假设设关关于于某某种种设设备备的的使使用用年年限限x x(年年)与与所所支支出的维修费用出的维修费用y y(万元)有如下统计资料:(万元)有如下统计资料:2 23 34 45 56 6y y2.22.23.83.85.55.56.56.57.07.0已知已知(1 1)求)求 ,;,;(2 2)对)对x x,y y进行线性相关性检验
12、;进行线性相关性检验;(3)如果)如果x与与y具有线性相关关系,求出线性回归方具有线性相关关系,求出线性回归方程;程;(4)估计使用年限为)估计使用年限为10年时,维修费用约是多少?年时,维修费用约是多少?x x第13页/共62页(3 3)如如果果x x与与y y具具有有线线性性相相关关关关系系,求求出出线线性性回回归归方方程;程;(4 4)估计使用年限为)估计使用年限为1010年时,维修费用约是多少?年时,维修费用约是多少?(1 1)先先根根据据已已知知计计算算相相关关系系数数r r,判判断断是否具有相关关系是否具有相关关系.(2 2)再利用公式求出回归方程进行回归分析)再利用公式求出回归方
13、程进行回归分析.解解 (1 1)思维启迪思维启迪第14页/共62页(2 2)步骤如下:)步骤如下:作统计假设作统计假设H H0 0:x x与与y y不具有线性相关关系不具有线性相关关系.n n-2=3-2=3时,时,r r0.050.05=0.878.=0.878.=112.3-545=12.3,=112.3-545=12.3,=90-54 =90-542 2=10,=10,=140.8-125=15.8,=140.8-125=15.8,r r=|r r|=0.987|=0.9870.878,0.878,即即|r r|r r0.050.05,所以有所以有95%95%的把握认为的把握认为“x x
14、与与y y之间具有线性相关关之间具有线性相关关系系”,去求线性回归方程是有意义的,去求线性回归方程是有意义的.第15页/共62页所以线性回归方程为所以线性回归方程为 =1.23=1.23x x+0.08.+0.08.(4 4)当)当x x=10=10时,时,=1.2310+0.08=12.38=1.2310+0.08=12.38(万元)(万元),即估计使用即估计使用1010年时,维修费用约为年时,维修费用约为12.3812.38万元万元.在解决具体问题时,要先进行相关性检在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相关关系验,通过检验确认两个变量是否具有线性相关关系.
15、若它们之间具有相关关系,再求回归方程,否则,若它们之间具有相关关系,再求回归方程,否则,即使求出回归方程也是毫无意义的即使求出回归方程也是毫无意义的,而且用其估计和而且用其估计和预测的量也是不可信的预测的量也是不可信的.探究提高探究提高第16页/共62页题型二题型二 非线性回归分析非线性回归分析【例例2 2】下下表表是是某某年年美美国国旧旧轿轿车车价价格格的的调调查查资资料料,以以x x表表示示轿轿车车的的使使用用年年数数,y y表表示示相相应应的的年年均均价价格格,求求y y关于关于x x的回归方程的回归方程.使用年使用年数数x x 1 1 2 23 34 45 56 67 78 89 91
16、010年均价年均价格格y y(美美元元)2 6512 6511 9431 9431 4941 4941 087 1 087 765765538538484484290290226226204204 由已知表格先画出散点图,可以看出随由已知表格先画出散点图,可以看出随着使用年数的增加,轿车的平均价格在递减,但不着使用年数的增加,轿车的平均价格在递减,但不在一条直线附近在一条直线附近.但据此认为但据此认为y y与与x x之间具有线性相关之间具有线性相关关系是不科学的,要根据图形的形状进行合理转化关系是不科学的,要根据图形的形状进行合理转化,转化成线性关系的变量间的关系转化成线性关系的变量间的关系.
17、思维启迪思维启迪第20页/共62页解解 作出散点图如图所示作出散点图如图所示.可以发现,各点并不是基本处于一条直线附近,因可以发现,各点并不是基本处于一条直线附近,因此,此,y y与与x x之间应是非线性相关关系之间应是非线性相关关系.与已学函数图象与已学函数图象比较,用比较,用 来刻画题中模型更为合理来刻画题中模型更为合理,令令 ,则,则 ,题中数据变成如下表所示:,题中数据变成如下表所示:第21页/共62页相应的散点图如图所示,从图中可以看出,变换的相应的散点图如图所示,从图中可以看出,变换的样本点分布在一条直线附近,因此可以用线性回归样本点分布在一条直线附近,因此可以用线性回归方程拟合方
18、程拟合.x x1 12 23 34 45 56 67 78 89 91010z z7.8837.8837.5727.5727.3097.3096.9916.9916.6406.6406.2886.2886.1826.1825.6705.6705.4215.4215.3185.318第22页/共62页由表中数据可得由表中数据可得r r-0.996.|-0.996.|r r|0.75.|0.75.认为认为x x与与z z之之间具有线性相关关系,由表中数据得间具有线性相关关系,由表中数据得 -0.298,-0.298,8.165,8.165,所以所以 =-0.298=-0.298x x+8.165,
19、+8.165,最后回代最后回代 =ln ,=ln ,即即 =e=e-0.298-0.298x x+8.165+8.165为所求为所求.非线性回归问题有时并不给出经验公式非线性回归问题有时并不给出经验公式.这时我们可以画出已知数据的散点图,把它与学过这时我们可以画出已知数据的散点图,把它与学过的各种函数(幂函数、指数函数、对数函数等)图的各种函数(幂函数、指数函数、对数函数等)图象作比较,挑选一种跟这些散点拟合得最好的函数象作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量置换,把问题化为线性回归分然后采用适当的变量置换,把问题化为线性回归分析问题,使之得到解决析问题,使之得到解决.
20、探究提高探究提高第23页/共62页题型三题型三 独立性检验独立性检验在在对对人人们们休休闲闲方方式式的的一一次次调调查查中中,共共调调查查了了124124人人,其其中中女女性性7070人人,男男性性5454人人.女女性性中中有有4343人人主主要要的的休休闲闲方方式式是是看看电电视视,另另外外2727人人的的休休闲闲方方式式是是运运动动;男男性性中中有有2121人人主主要要的的休休闲闲方方式式是是看看电电视视,另另外外3333人主要的休闲方式是运动人主要的休闲方式是运动.(1 1)根据以上数据建立一个)根据以上数据建立一个2222列联表;列联表;(2 2)画出二维条形图;)画出二维条形图;(3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 案例 复习
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内