卡方检验方法PPT讲稿.ppt
《卡方检验方法PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《卡方检验方法PPT讲稿.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卡方检验方法卡方检验方法1第1页,共61页,编辑于2022年,星期五掌握内容:掌握内容:几种常见设计类型资料的卡方检验几种常见设计类型资料的卡方检验熟悉的内容熟悉的内容卡方检验的适用范围卡方检验的适用范围了解内容了解内容1 1四格表资料的四格表资料的FisherFisher精确概率法精确概率法2第2页,共61页,编辑于2022年,星期五用样本信息推论总体特征的过程。用样本信息推论总体特征的过程。包括:包括:参数估计参数估计:运用统计学原理,用从样本计算出来的运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。统计指标量,对总体统计指标量进行估计。假设检验:假设检验:又称显著
2、性检验,是指由样本间存在的差又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。别对样本所代表的总体间是否存在着差别做出判断。3第3页,共61页,编辑于2022年,星期五 统计描述统计描述统计推断统计推断应应 用用计量资料计量资料 频数分布频数分布集中趋势集中趋势离散趋势离散趋势统计图表统计图表抽样误差、抽样误差、标准误标准误 t u F检验检验正常值范围正常值范围区间估计区间估计计数资料计数资料相对数及其相对数及其标准化标准化统计图表统计图表标准误标准误 2检验检验率的区间率的区间估计估计人口统计人口统计疾病统计疾病统计相关与回归相关与回归 r b统计图表统计图
3、表 t检验检验 4第4页,共61页,编辑于2022年,星期五在总体率为在总体率为的二项分布总体中做的二项分布总体中做n1和和n2抽样抽样,样本率样本率p1和和p2与与的差别的差别,称称为率抽样误差。为率抽样误差。已知已知0 nP5,n(1-P)55第5页,共61页,编辑于2022年,星期五例为了解铅中毒病人是否有尿棕色素增加现象,分别例为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见对病人组和对照组的尿液作尿棕色素定性检查,结果见下表,问铅中毒病人与对照人群的尿棕色素阳性率差别下表,问铅中毒病人与对照人群的尿棕色素阳性率差别有无统计学意义?有无统计学
4、意义?表两组人群尿棕色素阳性率比较表两组人群尿棕色素阳性率比较组别组别阳性数阳性数阴性数阴性数合计合计阳性率阳性率(%)铅中毒病人铅中毒病人2973680.56对照组对照组9283724.32合计合计38357352.056第6页,共61页,编辑于2022年,星期五 2检验检验(Chi-square test)是现代统计学的是现代统计学的创始人之一,英国人创始人之一,英国人K.Pearson(1857-1936)于)于1900年提出的年提出的一种具有广泛用途的统计方法。一种具有广泛用途的统计方法。7第7页,共61页,编辑于2022年,星期五 2 检验的用途检验的用途用途较为广泛的假设检验方法用
5、途较为广泛的假设检验方法,本章仅介绍用于本章仅介绍用于分类计数资料分类计数资料的假设检验,用于检验两个(或多个)的假设检验,用于检验两个(或多个)率或构成比之间差别是否有统计学意义,配对率或构成比之间差别是否有统计学意义,配对 2 2检检验检验配对计数资料的差异是否有统计学意义。验检验配对计数资料的差异是否有统计学意义。8第8页,共61页,编辑于2022年,星期五2检验的基本思想检验实际频数检验实际频数(A)(A)和理论频数和理论频数(T)(T)的差别的差别是否由抽样误差所引起的。也就是由样是否由抽样误差所引起的。也就是由样本率(或样本构成比)来推断总体率或本率(或样本构成比)来推断总体率或构
6、成比。构成比。9第9页,共61页,编辑于2022年,星期五表表7-1 两种药物治疗胃溃疡有效率的比较两种药物治疗胃溃疡有效率的比较 目的:推断是否目的:推断是否1 1=2 2?10第10页,共61页,编辑于2022年,星期五本例资料经整理成下表形式,本例资料经整理成下表形式,即有两个处理组,每个处理组即有两个处理组,每个处理组的例数由发生数和未发生数两的例数由发生数和未发生数两部分组成。表内有部分组成。表内有 四个基本数据,其余数据均四个基本数据,其余数据均由此四个数据推算出来的,故由此四个数据推算出来的,故称称四格表资料四格表资料。11第11页,共61页,编辑于2022年,星期五 表表7-1
7、 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11(T11)A12(T12)n1(固定值固定值)2 A21(T21)A22(T22)n2(固定值固定值)合计合计 m1 m2n12第12页,共61页,编辑于2022年,星期五衡量理论频数衡量理论频数与实际频数的差别与实际频数的差别ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数,TRC是位于是位于R行行C列交叉处的理列交叉处的理论频数。论频数。(ARC-TRC)反映实际频数与理论频数的差距,除以)反映实际频数与理论频数的差距,除以TRC 为为的是考虑相对差距。
8、所以,的是考虑相对差距。所以,2 值反映了实际频数与理论频数的吻合程度,值反映了实际频数与理论频数的吻合程度,2 值大,说明实际频数与理论频数的差距大。值大,说明实际频数与理论频数的差距大。2 值的大小除了与实际频数值的大小除了与实际频数和理论频数的差的大小有关外,还与它们的行、列数有关。即自由度的大和理论频数的差的大小有关外,还与它们的行、列数有关。即自由度的大小。小。=(行(行-1)(列(列-1)13第13页,共61页,编辑于2022年,星期五理论频数的计算理论频数的计算n nR R是是A ARCRC所在行的合计,所在行的合计,n nC C是是A ARCRC所在列的所在列的合计,是两个样本
9、例数的合计合计,是两个样本例数的合计14第14页,共61页,编辑于2022年,星期五 理论频数理论频数 是根据检验假设是根据检验假设 且用合并率且用合并率 来估计来估计 而定的。而定的。如本例,无效假设是如本例,无效假设是A药组与药组与B药组的总体有药组的总体有效率相等,均等于合计的阳性率效率相等,均等于合计的阳性率66.67%(110/165)。那么理论上,)。那么理论上,A药组的药组的85例中阳性人数应为例中阳性人数应为85(110/165)=56.67,阴性人,阴性人数为数为85(55/165)=28.33;同理,;同理,B药组的药组的80例中例中阳性人数应为阳性人数应为80(110/1
10、65)=53.33,阴性人数为,阴性人数为80(55/165)=26.67。15第15页,共61页,编辑于2022年,星期五2检验的基本公式 上述上述基本公式基本公式由由PearsonPearson提出,因此软件上提出,因此软件上常称这种检验为常称这种检验为PearesonPeareson卡方检验,下面将要卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于起来的。它不仅适用于四格表资料,也适用于其它的其它的“行行列表列表”。16第16页,共61页,编辑于2022年,星期五 分布是一种连续型分布分布是一种连续
11、型分布(Continuous distribution),v 个相个相互独立的标准正态变量互独立的标准正态变量(standard normal variable)的平方和称为的平方和称为 变量,其分布即为变量,其分布即为 分布;自由度分布;自由度(degree of freedom)为为v。17第17页,共61页,编辑于2022年,星期五 2分布是一种连续型分布分布是一种连续型分布(Continuous(Continuous distribution)distribution),v v 个相互独立的标准正态变量个相互独立的标准正态变量(standard normal variable)(sta
12、ndard normal variable)的平方和称为的平方和称为 2 变量,其分布即为变量,其分布即为 2 分布;分布;自由度自由度(degree of freedom)(degree of freedom)为为v v。v=1v=4v=6v=918第18页,共61页,编辑于2022年,星期五 2分布的形状依赖于自由度分布的形状依赖于自由度 的大小:的大小:当自由度当自由度2时,曲线呈时,曲线呈“L”型;型;随着随着 的增加,曲线逐渐趋于对称;的增加,曲线逐渐趋于对称;当自由度当自由度 时,曲线逼近于正态曲线。时,曲线逼近于正态曲线。19第19页,共61页,编辑于2022年,星期五如果假设检
13、验成立,如果假设检验成立,A与与T不应该相差不应该相差太大。太大。理论上可以证明理论上可以证明 (A-T)2/T服从服从x2分分布,计算出布,计算出x2值后,查表判断这么大的值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否为小概率事件,以判断建设检验是否成立。是否成立。20第20页,共61页,编辑于2022年,星期五在在=1,21第21页,共61页,编辑于2022年,星期五自由度一定时,自由度一定时,P值越小,值越小,x2值越大,值越大,反比关系。反比关系。当当P 值一定时,自由度越大,值一定时,自由度越大,x2越大。越大。=1时,时,P=0.05,x2=3.84 P=0.01,
14、x2=6.63 P=0.05时,时,=1,x2=3.84 =2,x2=5.9922第22页,共61页,编辑于2022年,星期五第一节第一节 四格表资料四格表资料2检验检验B1B2合计合计A1aba+bA2cdc+d合计合计a+cb+dn=a+b+c+d一般四格表的基本形式一般四格表的基本形式23第23页,共61页,编辑于2022年,星期五 表表7-1 完全随机设计两样本率比较的四格表完全随机设计两样本率比较的四格表 处理组处理组属性属性合计合计阳性阳性阴性阴性1 A11(T11)A12(T12)n1(固定值固定值)2 A21(T21)A22(T22)n2(固定值固定值)合计合计 m1 m2n2
15、4第24页,共61页,编辑于2022年,星期五四格表四格表 2检验的检验的专用公式专用公式n40,T525第25页,共61页,编辑于2022年,星期五 为了不计算理论频数为了不计算理论频数T,可由基本公式推导出可由基本公式推导出,直接由各格子的实际频数(直接由各格子的实际频数(a、b、c、d)计)计 算算卡方值的公式:卡方值的公式:第26页,共61页,编辑于2022年,星期五1建立检验假设建立检验假设:,两总体率不等,两总体率不等 :,两总体率相等,两总体率相等 检验统计量检验统计量2值反映了实际频数与理论频数值反映了实际频数与理论频数的吻合程度的吻合程度。27第27页,共61页,编辑于202
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 检验 方法 PPT 讲稿
限制150内