(精品)同济医学院-《SAS》课件-SAS的卡方检验(正式).ppt
-
资源ID:85523560
资源大小:549.01KB
全文页数:39页
- 资源格式: PPT
下载积分:16金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
(精品)同济医学院-《SAS》课件-SAS的卡方检验(正式).ppt
华中科技大学公卫学院流行病与卫生统计系卡方检验卡方检验SAS应用应用蒋红卫蒋红卫Email:JHWCCC21CN.COM学习目标学习目标掌握四格表普通卡方检验和配对卡方检验方法以及相应的掌握四格表普通卡方检验和配对卡方检验方法以及相应的SASSAS程序;程序;了解了解FREQFREQ过程语句格式;过程语句格式;熟悉熟悉R RC C表资料的分类类型以及相应的统计检验方法;表资料的分类类型以及相应的统计检验方法;掌握双向无序掌握双向无序R RC C表资料检验表资料检验以及以及SASSAS程序;程序;掌握单向有序掌握单向有序R RC C表资料检验以及表资料检验以及SASSAS程序;程序;掌握趋势卡方检验方法以及掌握趋势卡方检验方法以及SASSAS程序;程序;掌握分层掌握分层R RC C表表的分析以及的分析以及SASSAS程序程序;概述概述前面已介绍了两个率比较的检验,在观察例数不前面已介绍了两个率比较的检验,在观察例数不够大或拟对多个率进行比较时,检验就不适宜了,够大或拟对多个率进行比较时,检验就不适宜了,因为直接对多个样本率作两两间的检验有可能增因为直接对多个样本率作两两间的检验有可能增加第一类误差。加第一类误差。2 2检验可解决此类问题。检验可解决此类问题。卡方检验是用途很广的一种假设检验方法,这里卡方检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料个率或多个构成比比较的卡方检验以及分类资料的相关分析等。的相关分析等。四格表资料四格表资料定性指标分为有序的(如:疗效分为定性指标分为有序的(如:疗效分为“治愈、显效、好转、治愈、显效、好转、无效、死亡无效、死亡”)和名义的(如:血型分为)和名义的(如:血型分为“OO、A A、B B、ABAB”型)类,对于每个受试者来说,有序指标的观型)类,对于每个受试者来说,有序指标的观测结果只能是该有序指标若干等级中的级(如某人的疗测结果只能是该有序指标若干等级中的级(如某人的疗效为效为“显效显效”);名义指标的观测结果只能是该名义指标);名义指标的观测结果只能是该名义指标若干标志中的个(如某人的血型为型),显然,无法若干标志中的个(如某人的血型为型),显然,无法像处理定量指标那样去直接分析定性指标,故这类资料常像处理定量指标那样去直接分析定性指标,故这类资料常被整理成列联表的形式后再进行分析。被整理成列联表的形式后再进行分析。当表中只有个定性指标时,称为维列联表;有个或当表中只有个定性指标时,称为维列联表;有个或个以上定性指标时,称为多维列联表。常用个以上定性指标时,称为多维列联表。常用R R、C C表示表示维列联表的行数和列数,并称为维列联表的行数和列数,并称为R RC C表;当表;当R=C=R=C=时,时,称为称为表(或四格表)。表(或四格表)。表看起来很简单,但表看起来很简单,但根据资料所具备的条件有许多不同的处理方法。根据资料所具备的条件有许多不同的处理方法。四格表卡方检验的四格表卡方检验的SASSAS程序程序 在在SAS/STATSAS/STAT模块中模块中FREQFREQ、TABULATETABULATE和和SUMMARYSUMMARY等过程可用于分类资料的统计描述,其中等过程可用于分类资料的统计描述,其中FREQFREQ过程兼具过程兼具统计描述和统计推断的功能,对分类变量计算频数分布,统计描述和统计推断的功能,对分类变量计算频数分布,产生从一维到产生从一维到n n维的频数表和列联表;对于二维表,可进维的频数表和列联表;对于二维表,可进行行 2 2检验,对于三维表,可作检验,对于三维表,可作Mentel-HanszelMentel-Hanszel分层分析。分层分析。FREQFREQ过程是过程是SASSAS用于分析分类资料的一个常用过程。本用于分析分类资料的一个常用过程。本节将先向大家介绍节将先向大家介绍FREQFREQ过程的语句及其格式。过程的语句及其格式。FREQFREQ过程的语句基本格式如下:过程的语句基本格式如下:Proc freq data=order=;Proc freq data=order=;Table Table 分类变量分类变量*分类变量分类变量/;/;Weight Weight 变量变量;Run;Run;四格表卡方检验的四格表卡方检验的SASSAS程序程序DATADATA数据集:规定数据集:规定PROC FREQPROC FREQ语句使用的数据集;语句使用的数据集;ORDERORDERFREQFREQ,按频数递减顺序排列;,按频数递减顺序排列;ORDERORDERDATADATA,按数据集中出现的顺序排列;,按数据集中出现的顺序排列;ORDERORDERINTERNALINTERNAL,按内部值排列,按内部值排列(缺省缺省);ORDERORDERFORMATTEDFORMATTED,按外部格式值排列;,按外部格式值排列;TableTable语句指定构成表格的变量和表格结构。表格的结构语句指定构成表格的变量和表格结构。表格的结构由变量个数和变量排列顺序决定,一个由变量个数和变量排列顺序决定,一个tabletable语句允许列语句允许列出多个表格结构。出多个表格结构。PROC FREQPROC FREQ过程中可有多条过程中可有多条TABLESTABLES语句,语句,TABLESTABLES语句后可接多个表格请求式,每个请求式语句后可接多个表格请求式,每个请求式可包含任何数量的变量,从而得到所需的表格。可包含任何数量的变量,从而得到所需的表格。四格表卡方检验的四格表卡方检验的SASSAS程序程序如果如果TABLESTABLES语句缺省,则语句缺省,则FREQFREQ过程对数据集中的所有过程对数据集中的所有变量都给出相应的一维频数表。不规定任何选项时,若需变量都给出相应的一维频数表。不规定任何选项时,若需某变量的一维频数,某变量的一维频数,FREQFREQ给出该变量每一水平的频数、给出该变量每一水平的频数、累积频数、频数的百分比和累积百分比;若需二维频数表,累积频数、频数的百分比和累积百分比;若需二维频数表,FREQFREQ产生交叉分组列表,即包括各格的频数、总频数的产生交叉分组列表,即包括各格的频数、总频数的格百分数、行频数的格百分数和列频数的格百分数。格百分数、行频数的格百分数和列频数的格百分数。请求式由一个或多个用请求式由一个或多个用“*”连接起来的变量名组成。几连接起来的变量名组成。几个变量可放在括号中,如:个变量可放在括号中,如:TABLES A*(B C)TABLES A*(B C);等价于;等价于TABLES A*B A*CTABLES A*B A*C;TABLES(A-C)*DTABLES(A-C)*D;等价于;等价于TABLES A*D B*D C*DTABLES A*D B*D C*D;四格表卡方检验的四格表卡方检验的SASSAS程序程序下列选项可用于下列选项可用于TABLESTABLES语句中语句中“/”的后面:的后面:OUTOUT数据集:建立一个包含变量值和频数计数的输出数数据集:建立一个包含变量值和频数计数的输出数据集。如果据集。如果TABLESTABLES语句中不止一个请求式,数据集的内语句中不止一个请求式,数据集的内容相应于容相应于TABLESTABLES语句中最后一个请求。语句中最后一个请求。CHISQCHISQ对每层作对每层作c2c2检验,包括检验,包括Pearson c2Pearson c2、似然比、似然比c2c2和和Mantel-Haenszel c2Mantel-Haenszel c2。此外还给出与。此外还给出与c2c2检验有关的关联检验有关的关联指标包括指标包括PhiPhi系数、列联系数和系数、列联系数和CramerCramers Vs V。对于。对于2 22 2表,给出表,给出FisherFisher精确概率。精确概率。AGREE AGREE 进行配对进行配对c 2c 2检验。检验。EXACT EXACT 对大于对大于2 22 2的列联表计算的列联表计算FisherFisher精确概率。同时精确概率。同时也给出也给出CHISQCHISQ选项的全部统计量。选项的全部统计量。四格表卡方检验的四格表卡方检验的SASSAS程序程序MEASURESMEASURES对每层的二维表计算一系列关联指标及相应对每层的二维表计算一系列关联指标及相应的标准误,包括的标准误,包括PearsonPearson和和SpearmanSpearman相关系数,以及相关系数,以及GammaGamma和和KendallKendall系数等。对于系数等。对于2 22 2表,还给出常用的表,还给出常用的危险度指标及其标准误。危险度指标及其标准误。CMH CMH 给出给出Cochran-Mantel-HaenszelCochran-Mantel-Haenszel统计量,可检验统计量,可检验在调整了在调整了TABLESTABLES语句中其它变量后,行变量与列变量之语句中其它变量后,行变量与列变量之间的关联程度。对于间的关联程度。对于2 22 2表,表,FREQFREQ过程给出相对危险度过程给出相对危险度估计及其可信区间,还给出各层关联度指标是否齐性的估计及其可信区间,还给出各层关联度指标是否齐性的BreslowBreslow检验。检验。ALL ALL 给出给出CHISQCHISQ、MEASURESMEASURES、CMHCMH所请求的全部统所请求的全部统计量。计量。ALPHAALPHAp p给出检验水准。缺省为给出检验水准。缺省为0.050.05。四格表卡方检验的四格表卡方检验的SASSAS程序程序EXPECTEDEXPECTED给出期望频数。给出期望频数。DEVIATIONDEVIATION给出每格的实际频数与期望频给出每格的实际频数与期望频数的差值。数的差值。CELLCHISQCELLCHISQ给出每格对总给出每格对总c2c2的贡献,即的贡献,即计算每格的计算每格的(实际频数实际频数-期望频数期望频数)2/)2/期望频期望频数。数。CUMCOLCUMCOL给出累积列百分数。给出累积列百分数。NOFREQNOFREQ不给出列联表中的格频数。不给出列联表中的格频数。NOPERCENTNOPERCENT不给出列联表中的格百分数。不给出列联表中的格百分数。四格表卡方检验的四格表卡方检验的SASSAS程序程序NOROWNOROW不给出列联表中各格的行百分数。不给出列联表中各格的行百分数。NOCOLNOCOL不给出列联表中各格的列百分数。不给出列联表中各格的列百分数。NOCUMNOCUM不给出频数表的累积频数和累积百分数。不给出频数表的累积频数和累积百分数。NOPRINTNOPRINT不给出表格,但给出不给出表格,但给出CHISQCHISQ、MEASURESMEASURES或或CMHCMH等语句所指定的统计量。等语句所指定的统计量。TrendTrend指令系统对指令系统对2 2C C频数表的频数表的C C个百分率进行个百分率进行Cochran-ArmitageCochran-Armitage趋势检验;趋势检验;WEIGHTWEIGHT语句:通常每个观察值提供数值语句:通常每个观察值提供数值1 1给频数计数,给频数计数,当当WEIGHTWEIGHT语句出现时,每个观察值提供的是该观察值的语句出现时,每个观察值提供的是该观察值的加权变量值。该值必须非负,但可不必为整数。只能使用加权变量值。该值必须非负,但可不必为整数。只能使用一个一个WEIGHTWEIGHT语句,且该语句作用于所有的表。语句,且该语句作用于所有的表。四格表卡方检验四格表卡方检验理论理论频数频数,记,记为为T T。理论。理论数的计算公式为:数的计算公式为:四格表卡方检验四格表卡方检验卡方检验的统计量是卡方检验的统计量是 2 2值,它是每个格子实际频值,它是每个格子实际频数数A A与理论频数与理论频数T T差值平方与理论频数之比的累计差值平方与理论频数之比的累计和。每个格子中的理论频数和。每个格子中的理论频数T T是在假定两组的是在假定两组的发病发病率相等的率相等的情况下计算出来的,故情况下计算出来的,故 2 2值越大,说明值越大,说明实际频数与理论频数的差别越明显,两组实际频数与理论频数的差别越明显,两组发病率发病率不同的可能性越大。不同的可能性越大。例题例题某医院欲比较异梨醇口服液(试验组)和某医院欲比较异梨醇口服液(试验组)和氢氯噻嗪氢氯噻嗪+地塞米松(对照组)降低颅内压地塞米松(对照组)降低颅内压的疗效。将的疗效。将200200例颅内压增高症患者随机分例颅内压增高症患者随机分为两组。问两组降低颅内压的总体有效率为两组。问两组降低颅内压的总体有效率有无差别?有无差别?连续性校正公式连续性校正公式 2 2分布是正态变量的一种分布。设分布是正态变量的一种分布。设 是是k k个独立的标准正态变量,则个独立的标准正态变量,则 。2 2界值表就是根据这种连续性分布计算出来的。界值表就是根据这种连续性分布计算出来的。2 2统计量计算公式实质上是正态近似法。分类资统计量计算公式实质上是正态近似法。分类资料是间断性的,由此计算的料是间断性的,由此计算的 2 2值不连续,尤其自值不连续,尤其自由度为由度为1 1的四格表,求出的概率可能偏小,此时需的四格表,求出的概率可能偏小,此时需要对要对 2 2值进行连续性校正,公式为值进行连续性校正,公式为 2 2检验的应用条件检验的应用条件 连续性校正主要针对四格表资料,尤其理连续性校正主要针对四格表资料,尤其理论数较小时,连续性校正不可忽略。论数较小时,连续性校正不可忽略。四格表四格表 2 2检验的应用条件为:检验的应用条件为:当当n40n40且所有且所有T5T5时,用普通的时,用普通的 2 2检验,检验,若所得,改用确切概率法;若所得,改用确切概率法;当当n40n40但有但有1T51T5时,用校正的时,用校正的 2 2检验;检验;当当n40n40或有或有T1T1时,不能用时,不能用 2 2检验,改用检验,改用确切概率法。确切概率法。例题例题某医师欲比较胞磷胆碱与神经节苷酯治疗某医师欲比较胞磷胆碱与神经节苷酯治疗脑血管疾病的疗效,将脑血管疾病的疗效,将7878例脑血管疾病患例脑血管疾病患者随机分为两组。问两种药物治疗脑血管者随机分为两组。问两种药物治疗脑血管疾病的有效率是否有差别?疾病的有效率是否有差别?配对计数资料的卡方检验配对计数资料的卡方检验 把每一份样本平均分成两份,分别用两种把每一份样本平均分成两份,分别用两种方法进行化验,比较此两种化验方法的结方法进行化验,比较此两种化验方法的结果(两类计数资料)是否有本质的不同;果(两类计数资料)是否有本质的不同;或者分别采用甲、乙两种方法对同一批病或者分别采用甲、乙两种方法对同一批病人进行检查,比较此两种检查方法的结果人进行检查,比较此两种检查方法的结果(两类计数资料)是否有本质的不同,此(两类计数资料)是否有本质的不同,此时要用配对卡方检验。时要用配对卡方检验。配对计数资料的卡方检验配对计数资料的卡方检验比较两法结果有无差别,要着眼于两法结果不一比较两法结果有无差别,要着眼于两法结果不一致的部分。表中观察变量是对子中两法的差值或致的部分。表中观察变量是对子中两法的差值或差别,由差别,由b b和和c c两格数据来反映,总体中与两格数据来反映,总体中与b b和和c c对对应的数据可用应的数据可用B B和和C C表示(表示(a a格和格和d d格表示两法差格表示两法差值为值为0 0,不予考虑)。,不予考虑)。当当4040时,时,当当4040时,需作连续性校正:时,需作连续性校正:例题例题某实验室分别用乳胶凝集法和免疫荧光法某实验室分别用乳胶凝集法和免疫荧光法对对5858名可疑系统红斑狼疮患者血清中抗核名可疑系统红斑狼疮患者血清中抗核抗体进行测定。问两种方法的检测结果有抗体进行测定。问两种方法的检测结果有无差别?无差别?行行列表资料的列表资料的 2 2检验检验 前面介绍了两个样本率比较的前面介绍了两个样本率比较的 2 2检验方法,检验方法,其基本数据有其基本数据有2 2行行2 2列,称为列,称为2 22 2表或四格表或四格表资料。本节介绍的行表资料。本节介绍的行列表资料的列表资料的 2 2检检验,用于多个样本率的比较、两个或多个验,用于多个样本率的比较、两个或多个构成比的比较以及双向有序或无序分类资构成比的比较以及双向有序或无序分类资料的检验等。料的检验等。R RC C表可以分为双向无序、单向有序、双表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同向有序属性相同和双向有序属性不同4 4类。类。双向无序双向无序RCRC表表 R RC C表中两个分类变量皆为无序分类变量,表中两个分类变量皆为无序分类变量,对于该类资料:对于该类资料:若研究目的为多个样本若研究目的为多个样本率(或构成比)的比较,可用行率(或构成比)的比较,可用行列表资列表资料的料的 2 2检验;检验;若研究目的为分析两个分类若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度变量之间有无关联性以及关系的密切程度时,可以用行时,可以用行列表资料的列表资料的 2 2检验以及检验以及PearsonPearson列联系数进行分析。列联系数进行分析。例题例题1 1某医师研究物理疗法、药物治疗和外用膏某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围性面神经麻痹的疗效。药三种疗法治疗周围性面神经麻痹的疗效。问三种疗法的有效率有无差别?问三种疗法的有效率有无差别?例题例题2 2测得某地测得某地58015801人的人的ABOABO血型和血型和MNMN血型结血型结果,问两种血型系统之间是否有关联?果,问两种血型系统之间是否有关联?单向有序单向有序RCRC表表 有两种形式。一种是有两种形式。一种是R RC C表中的分组变量表中的分组变量是有序的,而指标变量是无序的。此种单是有序的,而指标变量是无序的。此种单向有序向有序R RC C表资料可用行表资料可用行列表资料的列表资料的 2 2检验进行分析。另一种情况是检验进行分析。另一种情况是R RC C表中的表中的分组变量是无序的,而指标变量是有序的,分组变量是无序的,而指标变量是有序的,此种单向有序此种单向有序R RC C表资料宜用秩和检验进表资料宜用秩和检验进行分析。行分析。例题例题某地城市与农村高血压患者严重程度情况,某地城市与农村高血压患者严重程度情况,试比较该地城市和农村高血压患者高血压试比较该地城市和农村高血压患者高血压严重程度是否有差别?严重程度是否有差别?双向有序双向有序RCRC表表 双向有序属性相同的双向有序属性相同的R RC C表表 R RC C表中的表中的两分类变量皆为有序且属性相同。实际上两分类变量皆为有序且属性相同。实际上是是2 22 2配对设计的扩展,此时宜用一致性配对设计的扩展,此时宜用一致性检验(或称检验(或称KappaKappa检验)。检验)。双向有序属性不同的双向有序属性不同的R RC C表表 R RC C表中的表中的两分类变量皆为有序且属性不相同。对于两分类变量皆为有序且属性不相同。对于该类资料,需要分析两有序分类变量间是该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料否存在线性变化趋势,宜用有序分组资料的线性趋势检验。的线性趋势检验。行列均为顺序变量的相关检验行列均为顺序变量的相关检验 变量虽然是有序的,但毕竟还不是定量的,变量虽然是有序的,但毕竟还不是定量的,需要给有序变量的各等级赋值方可进行相需要给有序变量的各等级赋值方可进行相关分析。最简单的赋值法是按顺序赋给秩关分析。最简单的赋值法是按顺序赋给秩次次(即得分即得分),即给行变量的等级赋值,即给行变量的等级赋值1 1,2 2,R R和给列变量的等级赋值和给列变量的等级赋值1 1,2 2,C C。这样。这样(X,Y)(X,Y)的不同取值就有的不同取值就有R RC C对,表中对,表中的的R RC C个频数就是这个频数就是这R RC C对取值所对应的对取值所对应的频数,然后计算频数,然后计算SpearmanSpearman秩相关系数,秩相关系数,并作显著性检验,这是比较粗糙的分析方并作显著性检验,这是比较粗糙的分析方法。法。行列均为顺序变量的相关检验行列均为顺序变量的相关检验SpearmanSpearman秩相关分析比较粗糙,这是因为它给有序变量秩相关分析比较粗糙,这是因为它给有序变量的等级赋值过于简单,不能最大限度地获得有序变量之间的等级赋值过于简单,不能最大限度地获得有序变量之间的相关信息。而典型相关分析是在使有序变量的相关达到的相关信息。而典型相关分析是在使有序变量的相关达到极大的前提下给有序变量的各等级赋值,就是对于表的边极大的前提下给有序变量的各等级赋值,就是对于表的边缘(指缘(指“行合计行合计”与与“列合计列合计”)设法产生一双变量正态,)设法产生一双变量正态,从而进行相关分析。因产生各等级的得分值的计算过程中从而进行相关分析。因产生各等级的得分值的计算过程中涉及矩阵运算,故手工计算较麻烦,将用涉及矩阵运算,故手工计算较麻烦,将用SASSAS程序实现统程序实现统计计算。一旦有了各等级的得分值后,就可运用求维频计计算。一旦有了各等级的得分值后,就可运用求维频数资料相关系数的公式计算了。典型相关分析可以得出几数资料相关系数的公式计算了。典型相关分析可以得出几个典型相关系数个典型相关系数R R,与每一个典型相关系数对应的检验为与每一个典型相关系数对应的检验为卡方检验,其数值为卡方检验,其数值为nR2nR2,其中,其中n n为为R RC C表中的总频数,表中的总频数,与第与第k k个卡方值对应的自由度个卡方值对应的自由度dfk=R+C-2k-1dfk=R+C-2k-1。行列均为顺序变量的相关检验行列均为顺序变量的相关检验与与定量资料定量资料的相关与回归分析类似,也可的相关与回归分析类似,也可对对R RC C表资料中有序变量之间是否存在线表资料中有序变量之间是否存在线性趋势作显著性检验,通常这两种检验的性趋势作显著性检验,通常这两种检验的结果是基本一致的,即相关分析结果显著,结果是基本一致的,即相关分析结果显著,线性趋势检验结果也显著。可以通过检验线性趋势检验结果也显著。可以通过检验实现线性趋势检验,即利用回归分析思想实现线性趋势检验,即利用回归分析思想产生的与线性回归有关的卡分量和偏离线产生的与线性回归有关的卡分量和偏离线性回归的卡分量。性回归的卡分量。行列均为顺序变量的相关检验行列均为顺序变量的相关检验首先计算首先计算R RC C表的值,然后将总的值分解表的值,然后将总的值分解成线性回归分量与偏离线性回归分量。若成线性回归分量与偏离线性回归分量。若两分量均具有统计学意义,说明两分类变两分量均具有统计学意义,说明两分类变量存在相关关系,但关系不是简单的直线量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意义,偏关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两离线性回归分量无统计学意义时,说明两分类变量不仅存在相关关系,而且是线性分类变量不仅存在相关关系,而且是线性关系。关系。行列均为顺序变量的相关检验行列均为顺序变量的相关检验计算计算 总的值总的值计算线性回归分量计算线性回归分量 回归回归 b b为回归系为回归系数数计算偏线性回归分量计算偏线性回归分量将总的将总的 值分解成线性回归分量和偏离线性回归分量。若值分解成线性回归分量和偏离线性回归分量。若两分量均有统计学意义,说明两分类变量存在相关关系,两分量均有统计学意义,说明两分类变量存在相关关系,但关系不是简单的直线关系;若线性回归分量有统计学意但关系不是简单的直线关系;若线性回归分量有统计学意义,偏离线性回归分量无统计学意义时,说明两变量不仅义,偏离线性回归分量无统计学意义时,说明两变量不仅存在相关关系,而且是线性关系。存在相关关系,而且是线性关系。例题例题某研究者欲研究年龄与冠状动脉粥样硬化某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将等级之间的关系,将278278例尸解资料整理成例尸解资料整理成行乘列表,问年龄与冠状动脉粥样硬化等行乘列表,问年龄与冠状动脉粥样硬化等级之间是否存在线性变化趋势?级之间是否存在线性变化趋势?分层资料的分析分层资料的分析按一个或多个因素分层后,研究行变量与按一个或多个因素分层后,研究行变量与列变量间的联系。列变量间的联系。通过控制分层变量的影响,检验研究行变通过控制分层变量的影响,检验研究行变量与列变量的关系。量与列变量的关系。例题例题某研究者欲研究男女性使用别嘌某研究者欲研究男女性使用别嘌 呤是否引呤是否引发皮疹。发皮疹。本章小节本章小节 2 2检验是用途很广的一种假设检验方法,这里我们主要学检验是用途很广的一种假设检验方法,这里我们主要学习它在分类资料统计推断中的应用,包括:两个率或两个习它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。检验以及分类资料的相关分析等。本章第一节介绍了四格表的普通本章第一节介绍了四格表的普通 2 2检验方法,理论频数与检验方法,理论频数与实际频数的定义,实际频数的定义,2 2检验统计量的计算方法,检验统计量的计算方法,2 2分布以及分布以及 2 2界值表确定界值表确定P P值的方法。说明了四格表值的方法。说明了四格表 2 2检验的应用条检验的应用条件,以及连续性校正公式和四格表专用公式。通过件,以及连续性校正公式和四格表专用公式。通过SASSAS分分析实例演示了四格表析实例演示了四格表 2 2检验过程以及结果解释。我们需要检验过程以及结果解释。我们需要重点理解重点理解 2 2检验的含义以及应用。掌握检验的含义以及应用。掌握 2 2检验的应用条件检验的应用条件以及连续性校正公式等。以及连续性校正公式等。本章小节本章小节R RC C表可以分为双向无序、单向有序、双向有序属性相表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同同和双向有序属性不同4 4类。类。双向无序双向无序R RC C表,表,R RC C表中两个分类变量皆为无序分类变量。若研究目的为多个表中两个分类变量皆为无序分类变量。若研究目的为多个样本率(或构成比)的比较,可用行样本率(或构成比)的比较,可用行列表资料的列表资料的 2 2检验;检验;若研究目的为分析两个分类变量之间有无关联性以及关系若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可以用行的密切程度时,可以用行列表资料的列表资料的 2 2检验以及检验以及PearsonPearson列联系数进行分析。列联系数进行分析。单向有序单向有序R RC C表有两种表有两种形式:一种是形式:一种是R RC C表中的分组变量是有序的,而指标变表中的分组变量是有序的,而指标变量是无序的,此种单向有序量是无序的,此种单向有序R RC C表资料可用行表资料可用行列表资列表资料的料的 2 2检验进行分析;另一种情况是检验进行分析;另一种情况是R RC C表中的分组变表中的分组变量是无序的,而指标变量是有序的,此种单向有序量是无序的,而指标变量是有序的,此种单向有序R RC C表资料宜用秩和检验进行分析。表资料宜用秩和检验进行分析。本章小节本章小节双向有序属性相同的双向有序属性相同的R RC C表,表,R RC C表中的两分类变量表中的两分类变量皆为有序且属性相同,实际上是皆为有序且属性相同,实际上是2 22 2配对设计的扩展,此配对设计的扩展,此时宜用一致性检验(或称时宜用一致性检验(或称KappaKappa检验);双向有序属性不检验);双向有序属性不同的同的R RC C表,表,R RC C表中的两分类变量皆为有序且属性不表中的两分类变量皆为有序且属性不相同,对于该类资料,需要分析两有序分类变量间是否存相同,对于该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。在线性变化趋势,宜用有序分组资料的线性趋势检验。本章针对不同类型的本章针对不同类型的R RC C表资料分别予以介绍,并通过表资料分别予以介绍,并通过实例进行数据分析,并通过实例进行数据分析,并通过SASSAS程序完成统计分析过程,程序完成统计分析过程,大家在练习不同类型数据的分析方法时,掌握常用数据分大家在练习不同类型数据的分析方法时,掌握常用数据分析的析的SASSAS程序,并能够灵活运用。程序,并能够灵活运用。