研究生统计学讲义第4讲第4章正态性检验和方差齐性检验.pptx
《研究生统计学讲义第4讲第4章正态性检验和方差齐性检验.pptx》由会员分享,可在线阅读,更多相关《研究生统计学讲义第4讲第4章正态性检验和方差齐性检验.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1研究生统计学讲义第研究生统计学讲义第4讲第讲第4章正态性检章正态性检验和方差齐性检验验和方差齐性检验分布的峰度如图4-5中的两条实线所示,一条“高、瘦”,峰态尖峭而尾部伸展,为尖峭峰;另一条“矮、胖”,峰顶平阔且尾部短促,为平阔峰。尖峭峰与平阔峰都不同于正态峰。第1页/共52页描述对称的统计量常用偏度系数(coefficientofskewness),描述正态峰的统计量常用峰度系数(coefficientofkurtosis),计算公式为:Skewness=Kurtosis=第2页/共52页偏度s=0表示正态;偏度系数s0,表示数据分布有长尾拖在右边为正偏态;偏度系数s0表示数据分布有
2、长尾拖在左边为负偏态。偏度系数的绝对值愈大,表示数据分布形态的偏斜程度愈大。峰度系数k=0,表示数据分布与正态分布的陡缓峭程度相同;峰度系数k0,表示比正态分布峰高,为尖峭峰;峰度系数k0表示比正态分布峰低为平阔峰。H0:总体服从正态分布;H1:总体不服从正态分布。用统计软件不方便时,否定正态性的方法最简单的是将均数与中位数及标准差进行比较,均数与中位数两者不等且相差较大时,分布不对称;标准差大于均数时,表示数据分散,曲线“矮、胖”,峰平阔,与正态峰度不同,可以判定不符合正态分布。第3页/共52页t 检验或方差分析对正态性的要求:(1)当变量x 值有正有负时,一般用 3S+3S范围内是否包括了
3、该批数据的最小值与最大值作出判断,当最小值与最大值均在此范围之间时,可采用 t检验或方差分析作统计推断。(2)医药指标的测定值通常为正值,反映数据分布情况的频数曲线左侧50%的数据只可能在0,范围内变化,而标准差S是频数分布曲线上拐点到均数的距离,故S,由于存在抽样误差,S可能大于 ,也可能略小于2S,但一般不会小于2S很多。若 2S或略小于2S时,可用 t检验或方差分析法;若 远小于2S时,则不用 t检验或方差分析法作统计推断。第4页/共52页例4.4判断例3.1资料的数据文件血糖的正态性。H0:总体服从正态分布,H1:总体不服从正态分布。使用SPSS打开数据文件L1101.sav 以后,可
4、用1-SampleK-STest法(柯尔莫哥诺夫-斯米尔诺夫检验)二、方差齐性检验 总体方差相等(即差异无统计学意义),称为方差齐性(homogeneityofvariance).方差齐性检验(testforhomogeneityofvariance)是利用理论上来自正态分布的总体的各样本信息,来推断它们的总体方差是否相等。第5页/共52页方差齐性检验主要用于:两组或多组间变异度的比较;两个或多个样本均数间比较时,须先进行方差齐性检验,若方差齐,可用t 检验或方差分析,否则可用变量变换的方法,使之方差齐后再用t 检验或方差分析,或用对方差没有特别要求的t检验或其他非参数的统计方法。二、预备知识
5、F分布与2分布 总体方差相等(即差异无统计学意义),称为方差齐性(homogeneityofvariance)。方差齐性检验(testforhomogeneityofvariance)是利用理论上来自正态总体的各样本信息,来推断它们的总体方差是否相等。我们先介绍两个检验统计量的分布-F分布和2分布。第6页/共52页(1)F分布数理统计中定义:如果随机变量X1、X2分别服从自由度为df1,df2的2分布,则称随机变量F=服从自由度为df1,df2的F分布(F-distribution)。F分布(F-distribution)有两个自由度,第一自由度为分子自由度df1;第二自由度为分母自由度df2
6、,且位置不能更换。F分布曲线偏向左边,随着自由度df1,df2的同时增大,F分布曲线趋向于对称。第7页/共52页不同配对自由度的F 分布F分布曲线偏向左边,随着自由度df1,df2的同时增大,F分布曲线趋向于对称。我们用F(df1,df2)表示自由度为df1,df2时,检验水准的F界值,第8页/共52页本书附表6录用了按P(FF(df1,df2)=编制的F界值表,表中横标目为分母的自由度df2,纵标目为分子的自由度df1,表中数字表示F的界值F(df1,df2);附表6右上角插图中阴影部分,表示 F分布曲线下,界值F(df1,df2)右侧面积占总面积的百分数,意义是:从正态总体作随机抽样,得到
7、统计量F值大于界值 F(df1,df2)的概率P(FF(df1,df2)=。例如:查附表6,界值F0.05(5,10)=3.33,它表示自由度df1=5,df2=10时,F 值大于3.33的概率为0.05,即P(F 3.33)=0.05;显然P(F12.1)=0.01,P(F12.1)=0.99。因一般都按组成统计量F的分子大于分母计算 F值。所以附表4中F界值都大于1。从附表6最后一列看的出来,随机变量取值的单侧 P界值(即单侧时的界值)与同侧的双侧2P界值(即双侧时的界值)相等,F 分布具有倒数性质:F(1),(df2,df1)第10页/共52页 利用 F分布的倒数性质可以求得单侧 F界值
8、表中没有列出的 F界值,也可以求得按组成统计量 F的分子小于分母时F分布的界值。例如,查附表6,F0.05(2,5)=5.786,F界值表中没有列出F0.95(5,2),利用 F分布的倒数性质可得F0.95(5,2)=1/F0.05(2,5)=1/5.79=0.173F分布用于方差分析和两样本比较时的方差齐性检验的重要依据是下面的性质:如果分别从两个正态总体N(1,1)和N(2,2)中,随机抽取样本含量为n1,n2的两个样本,算出样本均数和方差分别为1,S和2,S,则统计量第11页/共52页F=服从自由度为df1=n1-1,df2=n2-1的F分布。F分子的自由度df1=1时,单侧F界值=双侧
9、t界值的平方,即单侧F(1,df)=双侧t2(df)。(2).2分布数理统计中定义:如果u1,u2,.,un是n个独立的标准正态变量,则称随机变量2=u12+u22+.+un2(4-25)服从自由度为df=n的2分布(2-distribution)。第12页/共52页卡方分布的均数是n1或自由度df,卡方总体方差等于2(n1)或df2分布曲线偏向左边,随自由度df的不同而不同,自由度越小越偏,自由度相当大时,2分布曲线接近正态分布曲线。第13页/共52页附表4列出自由度从1到500的卡方分布一些重要累积分布函数值范围从0.995到0.005,表的左边列出的自由度确定不同的分布例如下图中,自由度
10、df=3,=3,并且Var()=6Var=variance第14页/共52页2分布的规律可从附表4得到。附表4为单侧2界值表,表中横标目为自由度df,纵标目为概率P,表中数字表示自由度为df时,水准下的2界值2(df);附表右上角插图中阴影部分,表示2分布曲线下,界值2(df)右侧面积占总面积的百分数,表示从正态总体作随机抽样,得到统计量2值大于界值2(df)的概率为。单侧的界值2(df)可由附表4直接查出;求双侧的2界值时:需用/2值查附表4,得出右侧的2界值,由于2分布不对称,另一侧的2界值,需用(1-/2)查附表4得出。例如,直接查附表2,得单侧2界值20.05(5)=11.07,它表示
11、自由度df=5时,2值大于11.07的概率为0.05,P(23时,可认为不满足方差齐性的条件。四.样本方差与已知总体方差比较记已知的(或规定的)总体方差为20。按(式4-28)计算检验统计量2(2分布见第十章),可检验H0:2=20是否成立,若由样本算得的22(n1)界值,则P,按水准拒绝H0;否则不能拒绝H0。2=(n-1)s2/2=(n-1)s2/20,df=n-1(4-28)第21页/共52页【例4.6】某剂型药物正常生产过程中,含碳量(%))服从均数为1.408,方差为0.0482的正态分布。今从某班产品中随机抽取5件,测得其含碳量(%)为1.32,1.55,1.36,1.40和1.4
12、4,判断该班生产该剂型药物含碳量的波动性是否超标?解:样本方差S2=0.0882。20=0.0482H0:20.0482;H1:20.0482。=0.05。检验统计量2=(n-1)s2/20=(5-1)0.0882/0.0482=13.5;以自由度df=n-1=4查2界值表(附表4),得20.01(51)=13.28,Pt0.018),P0.01,拒绝H0,可认为人工培植人参中M物质的含量与野生人参不同。也可用可信区间推断,本例,差值的95%可信区间为(-22.2129,-20.0538),不包含0(如果H0成立,则差值的均数应为0),所以,按=0.05水准,可认为人工培植人参中M物质含量与野
13、生人参不同。B.SPSS软件计算第29页/共52页操作过程:AnalyzeCompareMeansOne-SampleTTest,将M物质的含量x选入Testvariables(检验变量)框中,在TestValue(检验值)对话框中改原系统默认值0为检验值63.5(如图5-5),OK。输出结果:One-SampleStatisticsNMeanStd.DeviationStd.ErrorMeanM物质含量942.36671.40446.46815如图,n=9,差别的均数=42.3667,标准差S=1.40446,标准误=s/=0.46815;第30页/共52页One-SampleTestTes
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 统计学 讲义 章正态性 检验 方差
限制150内