最新张德存统计学7PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最新张德存统计学7PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新张德存统计学7PPT课件.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、张德存统计学张德存统计学77-2统计学统计学STATISTICS(第第2版版)警惕过多地假设检验。你对数据越苛求,数据会越多地向你供认,但在威逼下得到的供词,在科学询查的法庭上是不容许的。StephenM.Stigler统计名言统计名言2008年8月7-4统计学统计学STATISTICS(第第2版版)7-5统计学统计学STATISTICS(第第2版版)7-6统计学统计学STATISTICS(第第2版版)7-9统计学统计学STATISTICS(第第2版版)什么是方差分析什么是方差分析(ANOVA)?(analysisofvariance)1.1.方方差差分分析析的的基基本本原原理理是是在在202
2、0世世纪纪2020年年代代由由英英国国统统计计学学家家Ronald Ronald A.FisherA.Fisher在在进进行行实实验验设设计计时时为为解解释释实实验验数据而首先引入的数据而首先引入的 2.2.检验多个总体均值是否相等检验多个总体均值是否相等 通过分析数据的误差判断各总体均值是否相等通过分析数据的误差判断各总体均值是否相等3.3.研究分类型自变量对数值型因变量的影响研究分类型自变量对数值型因变量的影响 一个或多个分类型自变量一个或多个分类型自变量l l两个或多个两个或多个 (k(k 个个)处理水平或分类处理水平或分类 一个数值型因变量一个数值型因变量4.4.有单因子方差分析和双因
3、子方差分析有单因子方差分析和双因子方差分析n n单因子方差分析:涉及一个分类的自变量单因子方差分析:涉及一个分类的自变量n n双因子方差分析:涉及两个分类的自变量双因子方差分析:涉及两个分类的自变量2008年8月7-10统计学统计学STATISTICS(第第2版版)什么是方差分析什么是方差分析?(例题分析例题分析)【例例例例】确定超市的位置和竞争者的数量对销售额是否有确定超市的位置和竞争者的数量对销售额是否有显著影响,获得的年销售额数据显著影响,获得的年销售额数据(单位:万元单位:万元)如下表如下表因子因子因子因子水平或处理水平或处理水平或处理水平或处理样本数据样本数据样本数据样本数据2008
4、年8月7-11统计学统计学STATISTICS(第第2版版)什么是方差分析什么是方差分析?(例题分析例题分析)1.1.如如果果只只考考虑虑“超超市市位位置置”对对销销售售额额是是否否有有显显著著影影响响,实实际上也就是要判断不同位置超市的销售额均值是否相同际上也就是要判断不同位置超市的销售额均值是否相同n n若若它它们们的的均均值值相相同同,意意味味着着“超超市市位位置置”对对销销售售额额没没有有显显著著影影响响;若若均均值值不不全全相相同同,则则意意味味着着“超超市市位位置置”对对销销售售额额有有显显著著影响影响n n“超超市市位位置置”就就是是分分类类自自变变量量,“销销售售额额”则则是是
5、数数值值因因变变量量。“超超市市位位置置”是是要要检检验验的的对对象象,称称为为因因因因子子子子(factor)(factor),商商业业区区、居居民民小小区区、写写字字楼楼是是因因子子的的3 3个个取取值值,称称为为水水水水平平平平(level)(level)或或处处处处理理理理(treatment)treatment)。每个因子水平下得到的销售额为样本。每个因子水平下得到的销售额为样本观测值观测值观测值观测值2.2.方方差差分分析析要要解解决决的的问问题题就就是是判判断断超超市市的的位位置置对对销销售售额额是是否否有有显显著著影影响响。设设商商业业区区、居居民民小小区区和和写写字字楼楼3
6、3个个位位置置超超市的销售额均值是否相同市的销售额均值是否相同 2008年8月7.1.2从误差分析入手从误差分析入手7.1方差分析的基本原理方差分析的基本原理7-13统计学统计学STATISTICS(第第2版版)方差分析的基本原理方差分析的基本原理(误差分解误差分解)1.总误总误总误总误差差差差(total error)(total error)反映全部观测数据的误差称反映全部观测数据的误差称所抽取的全部所抽取的全部3636家超市的销售额之间差异家超市的销售额之间差异 2.随机随机随机随机误误误误差差差差(random error)(random error)组内误差组内误差(within-g
7、roup error)(within-group error)由于抽样的随机性造成的误差由于抽样的随机性造成的误差反映样本内部数据之间的随机误差反映样本内部数据之间的随机误差3.处处处处理理理理误误误误差差差差(treatment(treatment error)error)组组间间误误差差(between-group(between-group error)error)不同的处理影响所造成的误差不同的处理影响所造成的误差 反映样本之间数据的差异反映样本之间数据的差异 2008年8月7-14统计学统计学STATISTICS(第第2版版)方差分析的基本原理方差分析的基本原理(误差分解误差分解)1
8、.1.数据的误差用数据的误差用平方和平方和平方和平方和(sum of squaressum of squares)表示,记为表示,记为SSSS2.2.总总总总平方和平方和平方和平方和(sum of squares for total)sum of squares for total)记为记为SSTSSTn n反映全部数据总误差大小的平方和反映全部数据总误差大小的平方和n n抽取的全部抽取的全部3636家超市销售额之间的误差平方和家超市销售额之间的误差平方和3.3.组组组组内平方和内平方和内平方和内平方和(within-group sum of squares(within-group sum
9、of squares)记为记为SSSS组内组内 反映组内误差大小的平方和反映组内误差大小的平方和 比如,每个位置超市销售额的误差平方和比如,每个位置超市销售额的误差平方和 只包含只包含随机误差随机误差随机误差随机误差4.4.组间平方和组间平方和组间平方和组间平方和(between-group sum of squares)(between-group sum of squares)记为记为SSSS组间组间 反映组间误差大小的平方和反映组间误差大小的平方和 比如,同位置超市销售额之间的误差平方和比如,同位置超市销售额之间的误差平方和 既包括既包括随机误差随机误差随机误差随机误差,也包括,也包括处
10、理误差处理误差处理误差处理误差2008年8月7-15统计学统计学STATISTICS(第第2版版)方差分析的基本原理方差分析的基本原理(误差分解误差分解)误差平方和的分解及其关系误差平方和的分解及其关系总误差总误差总平方和总平方和(SST)随机误差随机误差处理误差处理误差组内平方和组内平方和(SS组内组内)组间平方和组间平方和(SS组间组间)=+2008年8月7-16统计学统计学STATISTICS(第第2版版)方差分析的基本原理方差分析的基本原理(误差分析误差分析)1.误误差差的的大大小小用用均均方方(mean(mean square)square)来来表表示示,也也称称为为方差方差(var
11、iance)(variance)n n平方和除以相应的自由度平方和除以相应的自由度n n总总平平方方和和(SST)(SST)的的自自由由度度为为n-1n-1;组组内内平平方方和和(SS(SS组组内内)的自由度为的自由度为n-k n-k;组间平方和;组间平方和(SS(SS组间组间)的自由度为的自由度为k-1k-12.组组内内平平方方和和除除以以相相应应的的自自由由度度结结果果称称为为组组组组内内内内方方方方差差差差(within-group(within-group variance)variance);组组间间平平方方和和除除以以相相应应的的自自 由由 度度 结结 果果 称称 为为 组组组组
12、间间间间 方方方方 差差差差(between-group(between-group variance)variance)2008年8月7-17统计学统计学STATISTICS(第第2版版)方差分析的基本原理方差分析的基本原理(误差分析误差分析)1.判断原假设是否成立,就是判断组间方差与组内方差是否有显著差异2.若原假设成立,组间均方与组内均方的数值就应该很接近,它们的比值就会接近13.若原假设不成立,组间均方会大于组内均方,它们之间的比值就会大于14.当这个比值大到某种程度时,就可以说不同水平之间存在着显著差异,即自变量对因变量有影响2008年8月7.1.3在什么样的前提下分析?在什么样的前
13、提下分析?7.1方差分析的基本原理方差分析的基本原理7-19统计学统计学STATISTICS(第第2版版)方差分析的基本假定方差分析的基本假定1.1.正正态态性性(normality)(normality)。每每个个总总体体都都应应服服从从正正态态分分布布,即即对对于于因因子子的的每每一一个个水水平平,其其观观测测值值是是来来自自正正态态分分布布总总体体的的简简单单随机样本随机样本n n在例在例7.17.1中,要求每个位置超市的销售额必须服从正态分布中,要求每个位置超市的销售额必须服从正态分布n n检检验验总总体体是是否否服服从从正正态态分分布布的的方方法法有有很很多多,包包括括对对样样本本数
14、数据据作作直直方方图图、茎茎叶叶图图、箱箱线线图图、正正态态概概率率图图做做描描述述性性判判断断,也也可可以以进行非参数检验等进行非参数检验等 2.2.方方差差齐齐性性(homogeneity(homogeneity variance)variance)。各各个个总总体体的的方方差差必必须须相同,对于分类变量的个水平,有相同,对于分类变量的个水平,有 1 12 2=2 22 2=k k2 2n n在例在例7.17.1中,要求不同位置超市的销售额的方差都相同中,要求不同位置超市的销售额的方差都相同3.3.独独立立性性(independence)(independence)。每每个个样样本本数数据
15、据是是来来自自因因子子各各水水平平的独立样本的独立样本(该假定不满足对结果影响较大该假定不满足对结果影响较大)n n在例在例7.17.1中,中,3 3个样本数据是来自不同位置超市的个样本数据是来自不同位置超市的3 3个独立样本个独立样本2008年8月7-20统计学统计学STATISTICS(第第2版版)方差分析中基本假定方差分析中基本假定 如果原假设成立,即如果原假设成立,即H H0 0:1 1=2 2=3 3n n不同位置超市的平均销售额相等不同位置超市的平均销售额相等 n n意味着意味着每个样本都来自均值为每个样本都来自均值为、方差为、方差为 2 2的同一的同一正态总体正态总体 X X X
16、f(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4 2008年8月7-21统计学统计学STATISTICS(第第2版版)方差分析中基本假定方差分析中基本假定若备择假设成立,即若备择假设成立,即H H1 1:i i(i i=1,2,3=1,2,3)不全相等不全相等n n至少有一个总体的均值是不同的至少有一个总体的均值是不同的n n3 3个样本分别来自均值不同的个样本分别来自均值不同的3 3个正态总体个正态总体 X X Xf(X)f(X)f(X)1 1 1 1 2 2 2 2 3 3 3 3 2008年8月7.2单因子方差分析因子方差分析7.2.1检验步骤检验步
17、骤7.2.2关系有多强?关系有多强?7.2.3哪些均值之间有显著差异?哪些均值之间有显著差异?第第7章章方差分析与实验设计方差分析与实验设计7.2.1检验步骤检验步骤7.2单因子因子方差分析方差分析7-24统计学统计学STATISTICS(第第2版版)单因子方差分析单因子方差分析(one-wayanalysisofvariance)1.只考虑一个分类型自变量影响的方差分析n n比比如如,在在例例7.17.1中中,只只考考虑虑超超市市位位置置一一个个因因子子对对销销售售额额度度影影响响,或或者者只只考考虑虑竞竞争争者者数数量量对对销销售额的影响,都属于单因子方差分析售额的影响,都属于单因子方差分
18、析2.分析步骤包括n n提出假设提出假设n n构造检验统计量构造检验统计量n n做出决策做出决策 2008年8月7-25统计学统计学STATISTICS(第第2版版)提出假设提出假设1.一般提法H H0 0 :1 1=2 2=k k 自变量对因变量没有显著影响自变量对因变量没有显著影响 H H1 1:1 1 ,2 2 ,k k不全相等不全相等自变量对因变量有显著影响自变量对因变量有显著影响 2.注意:拒绝原假设,只表明至少有两个总体的均值不相等,并不意味着所有的均值都不相等 2008年8月7-26统计学统计学STATISTICS(第第2版版)构造检验的统计量构造检验的统计量F1.将将组组间间方
19、方差差MSMS组组间间除除以以组组内内方方差差MSMS组组内内即即得得到到所所需要的检验统计量需要的检验统计量F F2.当当H H0 0为为真真时时,二二者者的的比比值值服服从从分分子子自自由由度度为为k k-1 1、分母自由度为分母自由度为 n n-k k 的的 F F 分布,即分布,即 组间平方和组间平方和组间平方和组间平方和组内平方和组内平方和组内平方和组内平方和2008年8月7-27统计学统计学STATISTICS(第第2版版)做出决策做出决策 将统计量的值F与给定的显著性水平的临界值F进行比较(或计算出统计量的P值),做出决策若若P P FFF ,不不拒拒绝绝原原假假设设H H0 0
20、 ,无无证证据据表表明明所所检验的因子对观察值有显著影响检验的因子对观察值有显著影响 2008年8月7-28统计学统计学STATISTICS(第第2版版)作出决策作出决策(F分布与拒绝域分布与拒绝域)如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,如果均值相等,F F F=MS=MS=MS组间组间组间组间组间组间/MS/MS/MS组内组内组内组内组内组内1 1 1 F 分布分布F(k-1,n-k)0 0拒绝拒绝拒绝拒绝HH0 0不拒绝不拒绝不拒绝不拒绝H H H H0 0 0 0F F2008年8月7-29统计学统计学STATISTICS(第第2版版)单因子方差分析单因子
21、方差分析(例题分析例题分析)【例例例例】检验检验超市位超市位置对销置对销售额是售额是否有显否有显著影响著影响(=0.05=0.05)2008年8月7-30统计学统计学STATISTICS(第第2版版)单因子方差分析单因子方差分析(例题分析例题分析)1.提出假设。设不同位置超市销售额的均值分别为 1(商业区)、2(居民小区)和 3(写字楼),提出的假设为H H00:1 1 2 2 3 3 H H11:1 1,2 2,3 3 不全相等不全相等不全相等不全相等2.检验方差分析的前提3.进行分析并做出决策2008年8月7-31统计学统计学STATISTICS(第第2版版)单因子方差分析单因子方差分析(
22、方差分析假定的判断方差分析假定的判断)箱线图分析好像不一样?好像不一样?2008年8月7-32统计学统计学STATISTICS(第第2版版)单因子方差分析单因子方差分析(方差分析假定的判断方差分析假定的判断)概率图分析2008年8月7-33统计学统计学STATISTICS(第第2版版)用用Excel进行方差分析进行方差分析第第第第1 1步:步:步:步:选择选择“工具工具工具工具”下拉菜单下拉菜单第第第第2 2步:步:步:步:选择选择【数据分析数据分析数据分析数据分析】选项选项第第第第3 3步:步:步:步:在分析工具中选择在分析工具中选择【单因子方差分析单因子方差分析单因子方差分析单因子方差分析
23、】,然后选择然后选择【确定确定确定确定】第第第第4 4步:步:步:步:当对话框出现时当对话框出现时 在在【输入区域输入区域输入区域输入区域】方框内键入数据单元格区域方框内键入数据单元格区域 在在【】方框内键入方框内键入0.050.05(可根据需要确定可根据需要确定)在在【输出选项输出选项输出选项输出选项】中选择输出区域中选择输出区域用用Excel进行方差分析进行方差分析2008年8月7-34统计学统计学STATISTICS(第第2版版)单因子方差分析单因子方差分析(例题分析例题分析)拒绝拒绝H02008年8月7.2.2关系有多强?关系有多强?7.2单因子因子方差分析方差分析7-36统计学统计学
24、STATISTICS(第第2版版)关系强度的测量关系强度的测量1.拒拒绝绝原原假假设设表表明明因因子子(自自变变量量)与与观观测测值值之之间间有有显显著著关系关系2.组组间间平平方方和和(SS(SS组组间间)度度量量了了自自变变量量(超超市市位位置置)对对因因变量变量(销售额销售额)的影响效应的影响效应当当组组间间平平方方和和比比组组内内平平方方和和(SSESSE)大大,而而且且大大到到一一定定程程度度时时,就就意意味味着着两两个个变变量量之之间间的的关关系系显显著著,大大得得越越多多,表表明明它它们们之之间间的的关关系系就就越越强强。反反之之,就就意意味味着着两两个个变变量量之之间间的的关关
25、系系不不显显著著,小小得得越越多多,表表明明它它们们之之间间的关系就越弱的关系就越弱2008年8月7-37统计学统计学STATISTICS(第第2版版)关系强度的测量关系强度的测量1.1.变变量量间间关关系系的的强强度度用用自自变变量量平平方方和和(SSSS组组间间)占占总总平平方和方和(SSTSST)的比例大小来反映的比例大小来反映2.2.自变量平方和占总平方和的比例记为自变量平方和占总平方和的比例记为R R2 2,即即3.3.其平方根其平方根R R可以用来测量两个变量之间的关系强度可以用来测量两个变量之间的关系强度 例例题题分分析析:R2=44.74%,R=0.6689。表表明明超超市市位
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 张德存 统计学 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内