《卡方检验方法》PPT课件.ppt
《《卡方检验方法》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《卡方检验方法》PPT课件.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章 2检验Chi-square test1掌握内容:掌握内容:几种常几种常见设计类型型资料的卡方料的卡方检验熟悉的内容熟悉的内容卡方卡方检验的适用范的适用范围了解内容了解内容1 1四格表四格表资料的料的FisherFisher精确概率法精确概率法2用用样本信息推本信息推论总体特征的体特征的过程。程。包括:包括:参数估参数估计:运用运用统计学原理,用从学原理,用从样本本计算出算出来的来的统计指指标量,量,对总体体统计指指标量量进行估行估计。假假设检验:又称又称显著性著性检验,是指由,是指由样本本间存存在的差在的差别对样本所代表的本所代表的总体体间是否存在着是否存在着差差别做出判断。做出
2、判断。3 统计描述描述统计推断推断应 用用计量量资料料 频数分布数分布集中集中趋势离散离散趋势统计图表表抽抽样误差、差、标准准误 t u F检验正常正常值范范围区区间估估计计数数资料料相相对数及数及其其标准化准化统计图表表标准准误 2检验率的区率的区间估估计人口人口统计疾病疾病统计相关与回相关与回归 r b统计图表表 t检验 4在在总体率体率为的二的二项分布分布总体中做体中做n1和和n2抽抽样,样本率本率p1和和p2与与的差的差别,称称为率抽率抽样误差。差。已知已知0 nP5,n(1-P)55例例为了解了解铅中毒病人是否有尿棕色素增加中毒病人是否有尿棕色素增加现象,象,分分别对病人病人组和和对
3、照照组的尿液作尿棕色素定性的尿液作尿棕色素定性检查,结果果见下表,下表,问铅中毒病人与中毒病人与对照人群的尿棕色素照人群的尿棕色素阳性率差阳性率差别有无有无统计学意学意义?表两表两组人群尿棕色素阳性率比人群尿棕色素阳性率比较组别阳性数阳性数阴性数阴性数合合计阳性率阳性率(%)铅中毒病人中毒病人2973680.56对照照组9283724.32合合计38357352.056 2检验(Chi-square test)是是现代代统计学的学的创始人之一,英国人始人之一,英国人K.Pearson(1857-1936)于)于1900年提出的年提出的一种具有广泛用途的一种具有广泛用途的统计方法。方法。7 2
4、检验的用途检验的用途用途用途较为广泛的假广泛的假设检验方法方法,本章本章仅介介绍用用于于分分类计数数资料料的假的假设检验,用于,用于检验两个两个(或多个)率或构成比之(或多个)率或构成比之间差差别是否有是否有统计学意学意义,配,配对 2 2检验检验配配对计数数资料的差料的差异是否有异是否有统计学意学意义。82检验的基本思想检验实际频数数(A)(A)和理和理论频数数(T)(T)的差的差别是否由抽是否由抽样误差所引起的。也就是由差所引起的。也就是由样本率(或本率(或样本构成比)来推断本构成比)来推断总体率或体率或构成比。构成比。9表表7-1 两种两种药物治物治疗胃胃溃疡有效率的比有效率的比较 目的
5、:推断是否目的:推断是否1 1=2 2?10本例本例资料料经整理成下表形式,整理成下表形式,即有两个即有两个处理理组,每个,每个处理理组的例数由的例数由发生数和未生数和未发生生数两部分数两部分组成。表内有成。表内有四个基本数据,其余数据四个基本数据,其余数据均由此四个数据推算出来的,均由此四个数据推算出来的,故称故称四格表四格表资料料。11 表表7-1 完全随机完全随机设计两两样本率比本率比较的四格表的四格表 处理理组属性属性合合计阳性阳性阴性阴性1 A11(T11)A12(T12)n1(固定固定值)2 A21(T21)A22(T22)n2(固定固定值)合合计 m1 m2n12衡量衡量理论频数
6、理论频数与实际频数的差别与实际频数的差别ARC是位于是位于R行行C列交叉处的实际频数,列交叉处的实际频数,TRC是位于是位于R行行C列交叉列交叉处的理论频数。处的理论频数。(ARC-TRC)反映实际频数与理论频数的差)反映实际频数与理论频数的差距,除以距,除以TRC 为的是考虑相对差距。所以,为的是考虑相对差距。所以,2 值反映了实际频值反映了实际频数与理论频数的吻合程度,数与理论频数的吻合程度,2 值大,说明实际频数与理论频值大,说明实际频数与理论频数的差距大。数的差距大。2 值的大小除了与实际频数和理论频数的差的值的大小除了与实际频数和理论频数的差的大小有关外,还与它们的行、列数有关。即自
7、由度的大小。大小有关外,还与它们的行、列数有关。即自由度的大小。=(行(行-1)(列(列-1)13理理论频数的数的计算算n nR R是是A ARCRC所在行的合所在行的合计,nnC C是是A ARCRC所在列所在列的合的合计,是两个,是两个样本例数的合本例数的合计14 理理论频数数 是根据是根据检验假假设 且用合并率且用合并率 来估来估计 而定的。而定的。如本例,无效假如本例,无效假设是是A药组与与B药组的的总体体有效率相等,均等于合有效率相等,均等于合计的阳性率的阳性率66.67%(110/165)。那么理)。那么理论上,上,A药组的的85例中阳性人数例中阳性人数应为,阴性人数,阴性人数为;
8、同理,;同理,B药组的的80例中阳性人数例中阳性人数应为,阴性人数,阴性人数为。152检验的基本公式 上述上述基本公式基本公式由由PearsonPearson提出,因此提出,因此软件上常称件上常称这种种检验为PearesonPeareson卡方卡方检验,下面将要介下面将要介绍的其他卡方的其他卡方检验公式都是在公式都是在此基此基础上上发展起来的。它不展起来的。它不仅适用于四格适用于四格表表资料,也适用于其它的料,也适用于其它的“行行列表列表”。16 分布是一种分布是一种连续型分布型分布(Continuous distribution),v 个相个相互独立的互独立的标准正准正态变量量(standa
9、rd normal variable)的平方和称的平方和称为 变量,其分布即量,其分布即为 分布;自由度分布;自由度(degree of freedom)为v。17 2 2分布是一种分布是一种连续型分布型分布(Continuous(Continuousdistribution)distribution),vv个相互独立的个相互独立的标准正准正态变量量(standardnormalvariable)(standardnormalvariable)的平方和称的平方和称为 2 2 变量,其分布即量,其分布即为 2 2 分布;分布;自由度自由度(degreeoffreedom)(degreeoffre
10、edom)为v v。v=1v=4v=6v=918 2分布的形状依分布的形状依赖于自由度于自由度 的大小:的大小:当自由度当自由度2时,曲,曲线呈呈“L”型;型;随着随着 的增加,曲的增加,曲线逐逐渐趋于于对称;称;当自由度当自由度 时,曲,曲线逼近于正逼近于正态曲曲线。19如果假如果假设检验成立,成立,A与与T不不应该相差相差太大。太大。理理论上可以上可以证明明 (A-T)2/T服从服从x2分分布,布,计算出算出x2值后,后,查表判断表判断这么大的么大的x2是否是否为小概率事件,以判断建小概率事件,以判断建设检验是否成立。是否成立。20在在=1,21自由度一定自由度一定时,P值越小,越小,x2
11、值越大,越大,反比关系。反比关系。当当P 值一定一定时,自由度越大,自由度越大,x2越大。越大。=1时,x2=3.84,x2 时,=1,x2 =2,x2 22第一第一节 四格表四格表资料料2检验B1B2合合计A1aba+bA2cdc+d合合计a+cb+dn=a+b+c+d一般四格表的基本形式一般四格表的基本形式23 表表7-1 完全随机完全随机设计两两样本率比本率比较的四格表的四格表 处理理组属性属性合合计阳性阳性阴性阴性1 A11(T11)A12(T12)n1(固定固定值)2 A21(T21)A22(T22)n2(固定固定值)合合计 m1 m2n24四格表四格表 2检验的的专用公式用公式n4
12、0,T525 为了不了不计算理算理论频数数T,可由基本公式推可由基本公式推导出出,直接由各格子的直接由各格子的实际频数(数(a、b、c、d)计 算算卡方卡方值的公式:的公式:261建立建立检验假假设:,两总体率不等,两总体率不等 :,两总体率相等,两总体率相等 检验统计量量2值反映了反映了实际频数与理数与理论频数的吻合程度数的吻合程度。27 若若检验假假设H0:1=2成成立立,四四个个格格子子的的实际频数数A 与与理理论频数数T 相相差差不不应该很很大大,即即统计量量2 2 不不应该很很大大。如如果果2 2 值很很大大,即即相相对应的的P 值很很小小,若若 P,则反反过来来推推断断A与与T相相
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卡方检验方法 检验 方法 PPT 课件
限制150内