第十章卡方检验精选PPT.ppt





《第十章卡方检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第十章卡方检验精选PPT.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章卡方检验第1页,此课件共59页哦 2 2检验(检验(chi-square test)是专门用于)是专门用于计数计数数数据的统计方法。据的统计方法。由于这类数据在整理时,常常以由于这类数据在整理时,常常以列联表列联表(contingency table)或交叉表()或交叉表(cross tabulation)呈现,因此这种分析方法又被称)呈现,因此这种分析方法又被称为列联表分析或交叉表分析。为列联表分析或交叉表分析。第2页,此课件共59页哦一.2 2检验及其特点 1 12 2分布分布2 2分布是统计学中应用较多的一种抽样分布。分布是统计学中应用较多的一种抽样分布。2 2值是从同一总体中随机
2、抽取的无限多个容量为值是从同一总体中随机抽取的无限多个容量为 n 的的样本数据的平方和或标准分数的平方和,即样本数据的平方和或标准分数的平方和,即或或此时此时2分布的自由度为分布的自由度为dfn。第3页,此课件共59页哦如果正态总体的平均数未知,需要用样本平均数作如果正态总体的平均数未知,需要用样本平均数作为总体平均数的估计值,这时公式变为:为总体平均数的估计值,这时公式变为:此时,此时,2 2分布的自由度为分布的自由度为df n1 1。第4页,此课件共59页哦2 2分布曲线相相对对频频数数图图15151 1 几种不同自由度的几种不同自由度的2 2分布曲线(分布曲线(0.050.05)n=1n
3、=4n=10n=202显而易见,显而易见,2 2检验主要应用的是检验主要应用的是右侧概率。右侧概率。第5页,此课件共59页哦22 2分布的特点 2 2分布呈分布呈正偏态正偏态,曲线的右侧无限延伸,曲线的右侧无限延伸,但不与基线相交。但不与基线相交。2 2值都是值都是正值正值。2 2分布的分布的和和也是也是2 2分布。分布。2 2分布随分布随自由度自由度的变化而不同。自由度的变化而不同。自由度越小,曲线偏斜度越大;自由度越大,分布形态越越小,曲线偏斜度越大;自由度越大,分布形态越趋于对称。趋于对称。第6页,此课件共59页哦32 2检验2 2检检验验用用于于对对点点计计而而来来的的离离散散型型数数
4、据据资资料料进进行行假假设设检检验验,对对总总体体的的分分布布不不做做要要求求,也也不不对对总总体体参参数数进进行行推推论论。2 2检检验验主主要要是是对对总总体体的的数数据据分分布布进进行行假假设设检检验验,因因此此属属于于自自由由分分布布的非参数检验。的非参数检验。第7页,此课件共59页哦2 2 2 2检验是对由样本得来的检验是对由样本得来的实际实际频数与频数与理论理论频数的分布是否有显著性差异所进行的检验。频数的分布是否有显著性差异所进行的检验。其计算公式为:其计算公式为:这一公式是根据这一公式是根据18991899年统计学家皮尔逊推导的配合年统计学家皮尔逊推导的配合适度的理论公式而来。
5、这是与前述适度的理论公式而来。这是与前述2 2分布非常近似的次分布非常近似的次数分布。当数分布。当 f e 越大时,其接近的越好。越大时,其接近的越好。(151)第8页,此课件共59页哦2 2值的特点2 2值具有可加性;值具有可加性;2 2永远是正值;永远是正值;2 2的大小随实际频数与理论频数差的大的大小随实际频数与理论频数差的大小而变化。两者之差越小,说明样本分布与假设的小而变化。两者之差越小,说明样本分布与假设的理论分布越一致;两者之差越大,说明样本分布与理论分布越一致;两者之差越大,说明样本分布与假设的理论分布越不一致。假设的理论分布越不一致。理理论论频频数数也也称为期望次数称为期望次
6、数。第9页,此课件共59页哦二单向表的2检验(配合度检验)把实得的点计数据只按一种分类标准编制把实得的点计数据只按一种分类标准编制成表就是单向表。对单向表的数据所进行的成表就是单向表。对单向表的数据所进行的2 2检验,称为单向表的检验,称为单向表的2 2检验,也称为配合度检检验,也称为配合度检验(验(goodness of fit testgoodness of fit test)。)。第10页,此课件共59页哦1单向表2 2检验的计算公式单向表中只有一个变量,被按一定标准分单向表中只有一个变量,被按一定标准分为为k 组。单向表组。单向表2 2检验中,检验中,2 2值的计算公值的计算公式可采用
7、,自由度为式可采用,自由度为dfk1 1。第11页,此课件共59页哦2单向表2 2检验中理论频数的计算两种情形各类别理论频数相等各类别理论频数符合一定的比例计算要点将总频数平均分到几个类别将总频数按已知比例分到几个类别第12页,此课件共59页哦32 2检验的计算表15-1 单向表2检验计算表分组分组分组分组分组分组总总 和和2 第13页,此课件共59页哦例1:随机抽取随机抽取6060名学生,询问他们在高中名学生,询问他们在高中是否需要文理分科,赞成分科的是否需要文理分科,赞成分科的3939人,反对分科人,反对分科的的2121人,问他们对分科的意见是否有显著差异?人,问他们对分科的意见是否有显著
8、差异?解:1.提出假设H H0 0:学生对分科的意见没有显著差异:学生对分科的意见没有显著差异H H1 1:学生对分科的意见有显著差异:学生对分科的意见有显著差异 2.选择检验统计量并计算对点计数据进行差异检验对点计数据进行差异检验,可选择可选择2 2检验检验第14页,此课件共59页哦计 算表15-2 学生对分科意见的2检验计算表赞成赞成39309812.7反对反对2130-9812.7总总 和和60605.4 自由度为自由度为:df=k-1=1第15页,此课件共59页哦3.统计决断查查2 2值表,当值表,当 df =1=1 时时计算结果为:计算结果为:2=5.4*3.84 2=5.4 6.6
9、3,则 0.05 P 0.01结论:学生对高中文理分科的态度有显著差异。结论:学生对高中文理分科的态度有显著差异。第16页,此课件共59页哦表153 2 2检验统计决断规则2 2与临界值比较与临界值比较 P P值值 显著性显著性 检验结果检验结果 2 2 P P0.050.05不显著不显著保留保留H H0 0,拒绝,拒绝H H1 1 2 2 0.05P0.05P0.010.01显著显著在在0.050.05显著性水平显著性水平拒绝拒绝H H0 0,接受,接受H H1 12 2 P0.01P0.01极其显著极其显著在在0.010.01显著性水平显著性水平拒绝拒绝H H0 0,接受,接受H H1 1
10、第17页,此课件共59页哦例2:大学某系大学某系5454位老年教师中,健康状位老年教师中,健康状况属于好的有况属于好的有1515人,中等的有人,中等的有2323人,差的有人,差的有1616人。问该校老年教师健康状况好、中、差的人数比人。问该校老年教师健康状况好、中、差的人数比例是否为例是否为1 1:2 2:1 1?1.1.提出假设提出假设H H0 0:健康状况好、中、差的人数比例是:健康状况好、中、差的人数比例是1 1:2 2:1 1H H1 1:健康状况好、中、差的人数比例不是:健康状况好、中、差的人数比例不是1 1:2 2:1 1第18页,此课件共59页哦2.计 算表15-4 老年教师健康
11、状况的2检验计算表好好1513.51.52.250.167中中2327.0-4.016.00.593差差1613.52.56.250.463总总 和和54541.22第19页,此课件共59页哦3.3.结结 论论查查2 2值表,当值表,当 df =k-1=2-1=2 时时计算结果为:计算结果为:2=1.222=1.22 5.99,则,则 P 0.05结论:理论频数与实际频数差异不显著结论:理论频数与实际频数差异不显著,表明该校老年表明该校老年教师健康状况的人数比例是教师健康状况的人数比例是1:2:1。第20页,此课件共59页哦42 2的连续性校正当当dfdf1 1时,其中只要有一个组的时,其中只
12、要有一个组的理论频理论频数数小于小于5 5,就要运用亚茨(,就要运用亚茨(YatesYates)连续性)连续性校正校正法,计算公式为:法,计算公式为:(152)第21页,此课件共59页哦 之所以要进行连续性校正,是因为由点计之所以要进行连续性校正,是因为由点计数据求得的数据求得的2 2值是间断数列,当值是间断数列,当df1 1,fe5 5时,其间断性尤其明显。而时,其间断性尤其明显。而2 2值表上的理论值值表上的理论值是用连续量表表示的,其是用连续量表表示的,其2 2分布是一条连续的光分布是一条连续的光滑曲线。为了对连续的滑曲线。为了对连续的2 2曲线作较好的估计,曲线作较好的估计,需要在每个
13、小于理论频数的实际频数上加需要在每个小于理论频数的实际频数上加0.5,而在大于理论频数的实际频数上减去而在大于理论频数的实际频数上减去0.5。第22页,此课件共59页哦例3:历年优秀学生干部中男女比例为历年优秀学生干部中男女比例为2 2:8 8,今年优秀学生干部中有,今年优秀学生干部中有3 3个男生,个男生,7 7个女生。问个女生。问今年优秀学生干部的性别比例与往年是否有显著今年优秀学生干部的性别比例与往年是否有显著差异?差异?1.1.提出假设提出假设H H0 0:今年优秀学生干部的性别比例与往年没有显著差异:今年优秀学生干部的性别比例与往年没有显著差异H H1 1:今年优秀学生干部的性别比例
14、与往年有显著差异:今年优秀学生干部的性别比例与往年有显著差异第23页,此课件共59页哦2.计 算表15-5 学生干部性别比例的2检验计算表男男3210.50.250.125女女78-10.50.250.031总和总和10100.156自由度为自由度为:df=k-1=1第24页,此课件共59页哦3.统计决断查查2 2值表,当值表,当 df =1=1 时时计算结果为:计算结果为:2=0.1562=0.156 3.84,则,则 P 0.05结论:优秀学生干部中的性别比例与往年一样。结论:优秀学生干部中的性别比例与往年一样。思考:为什么只有思考:为什么只有 df=1 时需要校正时需要校正?第25页,此
15、课件共59页哦三频数分布正态性的2检验实际应用中,常常需要对一组数据的分布实际应用中,常常需要对一组数据的分布是否符合正态的情况进行检验。除了用累积分是否符合正态的情况进行检验。除了用累积分布曲线的形状和皮尔逊的经验公式进行大致判布曲线的形状和皮尔逊的经验公式进行大致判断之外,对实际频数分布与理论频数的分布是断之外,对实际频数分布与理论频数的分布是否一致的否一致的2 2检验是对数据分布形态进行检验的比检验是对数据分布形态进行检验的比较精确和可靠的方法。较精确和可靠的方法。第26页,此课件共59页哦频数分布正态性检验的基本思路将待检验的一组数据列成次数分布表。将待检验的一组数据列成次数分布表。根
16、据次数分布表的分组界限,计算出该组根据次数分布表的分组界限,计算出该组数据正态分布情况下的理论频数。数据正态分布情况下的理论频数。对实际频数与理论频数是否一致进行对实际频数与理论频数是否一致进行2 2检检验。验。思考:如何计算各组的理论频数?第27页,此课件共59页哦频数分布正态性检验的计算要点将次数分布表中各分组区间的上、下将次数分布表中各分组区间的上、下限转换成标准分数限转换成标准分数Z Z值;值;根据各组上、下限根据各组上、下限Z Z值查表,寻找值查表,寻找Z Z0 0至各组上、下限至各组上、下限Z Z值之间的面积;值之间的面积;求各组的面积(即概率)。求各组的面积(即概率)。计算中应注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十 章卡方 检验 精选 PPT

限制150内