[精选]卡方检验方法讲义18382.pptx
《[精选]卡方检验方法讲义18382.pptx》由会员分享,可在线阅读,更多相关《[精选]卡方检验方法讲义18382.pptx(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 检验检验(chi-square test)上海第二军医大学卫生统计学教研室上海第二军医大学卫生统计学教研室孟虹孟虹 分类数据组间比较的统计检验分类数据组间比较的统计检验1 第七章第七章 检验内容检验内容(计数资料组间的比较计数资料组间的比较)第一节第一节 四格表资料的四格表资料的2检验检验*第二节第二节 配对四格表资料的配对四格表资料的2 2检验检验*第三节第三节 Fisher Fisher确切概率检验确切概率检验第四节第四节 行行列表资料的列表资料的2检验检验*第五节第五节 多个样本率比较的多个样本率比较的2分割法分割法第六节第六节 有序分组资料的线性趋势检验有序分组资料的线性
2、趋势检验第七节第七节 频数分布的拟合优度检验频数分布的拟合优度检验*为重点掌握为重点掌握2实例数据实例数据1分化程度分化程度 疾病分期疾病分期 低分化低分化 10 5 3中分化中分化 8 15 7高分化高分化 2 8 19问:分化程问:分化程度与度与 分期有分期有 无无 关系关系?3研研究究肿肿瘤瘤标标志志物物癌癌胚胚抗抗原原(CEA)对对肺肺癌癌诊诊断断价价值值,抽抽取取72例例肺肺癌癌患患者者和和114例例健健康康体体检检的的非非肺肺癌癌患患者者。用用CEA进进行行检检测测,结结果果呈呈阳阳性性反反应应者者肺肺癌癌组组中中33例例,对对照照组组中中10例例。问问两两组组人群的人群的CEA阳
3、性率有无差异?阳性率有无差异?实例实例 数据数据24计数资料常回答问题计数资料常回答问题1.两组(多组)两组(多组)样本率样本率间差别间差别是否有统计意义。是否有统计意义。2.两组(多组)两组(多组)构成比的分布(结构)构成比的分布(结构)是否一致。是否一致。3.两个指标(变量)之间是否两个指标(变量)之间是否有关联关系有关联关系。5第一节第一节 四格表资料的四格表资料的 检验检验 一、一、2检验的基本思想检验的基本思想 6 1.1.2 2 分布分布 1875 1875年年 F.Helmet F.Helmet提出提出 2 2 统计量统计量,设变量设变量(X(Xi i)为来自标准正态总体的连续性
4、变量。为来自标准正态总体的连续性变量。2分布是一个连续型变量的分布。与自由度有分布是一个连续型变量的分布。与自由度有关分布。关分布。2分布分布73.847.8112.59P P0.050.05的临界值的临界值 2 2分布的概率密度函数曲线分布的概率密度函数曲线8不同不同2分布的界值分布的界值(附表附表 8 )823页页在在=1,9Pearson的的2统计量统计量1900年英国统计学家年英国统计学家K.Pearson提出下述公提出下述公式,在式,在n40时,下式值与时,下式值与2分布近似,在理分布近似,在理论数论数5,近似程度较好。,近似程度较好。上述公式实际应用于检验分类数据统计检验。上述公式
5、实际应用于检验分类数据统计检验。10Pearson 检验的用途检验的用途 1.用于检验计数资料的两组(多组)样本率用于检验计数资料的两组(多组)样本率差别有无统计意义。差别有无统计意义。如二项分布数据如二项分布数据 (binomial proportions)2.检验两个事物多个分类是否独立;两组构检验两个事物多个分类是否独立;两组构成是否一致。成是否一致。如列连表数据列连表数据(Contingency Table)112.2检验的基本思想检验的基本思想例例7-1:某院比较异梨醇(试验组)和氢氯塞嗪(对照某院比较异梨醇(试验组)和氢氯塞嗪(对照组)降低颅内压的疗效,将组)降低颅内压的疗效,将2
6、00名患者随机分为名患者随机分为两组,试验组两组,试验组104例中有效例中有效99例例,对照组对照组96例中有例中有效的效的78例例,问两种药物对降低颅内压疗效有无差问两种药物对降低颅内压疗效有无差别?别?数据整理为四格表形式数据整理为四格表形式(二维交叉表二维交叉表)研究变量研究变量:干预变量干预变量(x):试验和对照:试验和对照疗效变量疗效变量(y):有效和无效:有效和无效12计数资料的列连表计数资料的列连表(两组或多组比较数据的交叉表)两组或多组比较数据的交叉表)行(行(Row)列(列(Column)表)表行分类行分类 列分类列分类(Y)合计数合计数(X)阳性数阳性数 阴性数阴性数 甲组
7、甲组 A11 A12 n1 乙组乙组 A21 A22 n2 合计合计 A11+A21 A12+A22 nA:表示某组某分类的例数(频数):表示某组某分类的例数(频数)13表表7-1两组降低颅内压有效率比较两组降低颅内压有效率比较疗法疗法 有效人数有效人数 无效数无效数 合计合计 有效率有效率%试验组试验组 99(A11)5(A12)104 95.20 对照组对照组 75(A21)21(A22)96 78.13合计合计 174 26 200 87.00问:两组有效率差别是抽样误差或是不同药物的作问:两组有效率差别是抽样误差或是不同药物的作用用?99 575 21四格表四格表的数字的数字组别组别
8、+甲甲乙乙14Pearson 检验的基本公式检验的基本公式7-1式中符号含义:式中符号含义:A:实际频数,表中实际:实际频数,表中实际发生的阳性或阴性频数发生的阳性或阴性频数T:理论频数,按某:理论频数,按某H0假假设计算理论上的阳性或阴设计算理论上的阳性或阴性频数性频数(公式(公式7-1)(公式公式7-3)理论数(理论数(T)计算)计算15表表7-1两组疗法降低颅内压有效率两组疗法降低颅内压有效率(%)疗法疗法 有效人数有效人数 无效人数无效人数 合计合计 有效率有效率试验组试验组 99(90.48)5(13.52)104 95.2对照组对照组 75(83.52)21(12.48)96 78
9、.1合计合计 174 26 200 87.0注注:括号内为理论数(:括号内为理论数(T)理论数理论数(T)计算计算:H0:1=2=c=87.00%T=n c T11=10487%=90.4816分组分组 n 假设发生率假设发生率 实际发生数实际发生数 假设发生假设发生(T)试验组试验组 104 有效概率有效概率=0.87 99 90.48试验组试验组 无效概率无效概率1=0.13 5 13.52对照组对照组 96 有效概率有效概率=0.87 75 83.52对照组对照组 无效概率无效概率1=0.13 21 12.48 17假定两组发生率相等的理论数与实际数假定两组发生率相等的理论数与实际数组别
10、组别 死亡人数死亡人数 生存数生存数 合计合计 死亡率死亡率%抗凝血组抗凝血组 20(20)80(80)100 20.0 对照组对照组 20(20)80(80)100 20.0合计合计 40 160 200 20.0 18Pearson 检验计算与步骤检验计算与步骤1.建立检验假设:建立检验假设:H0:1=2=c(两组总体率相等)两组总体率相等)H1:1 2 (两组总体率不等)两组总体率不等)2.=0.053.计算计算 统计量:统计量:4.确定自由度(确定自由度()和)和2值的概率(值的概率(P)自由度自由度()=(行数(行数1)(列数(列数1)本例本例=(2-1)(2-1)=119 与与 比
11、较比较,得到得到p值。值。5.结论:在结论:在=0.05水准上,水准上,p0.01,拒绝,拒绝H0,两样本率差别有统计意义,具本例可认为试验两样本率差别有统计意义,具本例可认为试验组对降低颅内压有效率高于对照组组对降低颅内压有效率高于对照组。本例本例20二、四格表资料二、四格表资料 检验专用公式检验专用公式(两组样本率间差别两组样本率间差别 检验检验)两组样本率比较资料的设计分类:两组样本率比较资料的设计分类:1.两组两组(独立独立)样本率的比较样本率的比较 组间数据是相互独立组间数据是相互独立,非配对设计。非配对设计。2.配对设计两组样本率的比较配对设计两组样本率的比较 组间数据是相关的。组
12、间数据是相关的。21两组独立样本率的比较两组独立样本率的比较1)四格表形式)四格表形式组别组别 阳性数阳性数 阴性数阴性数 合计合计 率率%甲组甲组 a b a+b=n1 a/n1乙组乙组 c d c+d=n2 c/n2合计合计 a+c b+d N2)四格表独立资料检验的专用公式)四格表独立资料检验的专用公式(公式公式 7-4)二者结果等价二者结果等价各组样本例数是固定的各组样本例数是固定的22表表7-1两组降低颅内压有效率比较两组降低颅内压有效率比较疗法疗法 有效人数有效人数 无效数无效数 合计合计 试验组试验组 99(a)5(b)104(a+b)对照组对照组 75(c)21(d)96(c+
13、d)合计合计 174(a+c)26(b+d)200 (N)专用公式专用公式23三、三、四格表四格表2 检验的校正公式检验的校正公式(两组不配对资料两组不配对资料)(1)校正公式的条件:校正公式的条件:1T5,同时同时N40,用连续校正公式计算用连续校正公式计算 连续校正连续校正(continuity correction)公式:公式:公式公式7-5公式公式7-6(2)当当T1,或或N40,用,用Fisher确切概率法确切概率法24表表7-2 两药物治疗脑血管病有效率比较两药物治疗脑血管病有效率比较组别组别 有效数有效数(1)无效数无效数(0)合计合计 有效率有效率%甲药甲药=1 46 6 52
14、 88.46乙药乙药=2 18 8(4.67)26 69.23合计合计 64 14 78 82.05校正公式校正公式不校正不校正 2=4.35 p0.05P0.05.25SPSS统计软件数据录入与操作1.数据录入数据录入(频数表数据频数表数据)药物药物 疗效疗效 例数例数 1 0 6 1 1 46 2 0 8 2 1 182.数据加权数据加权:data weight cases 3.Aanlyze descriptive statistics crosstabs262728表表7-2 数据用数据用SPSS统计软件计算结果统计软件计算结果29第二节第二节 配对设计两个样本率的配对设计两个样本率的
15、2检验检验 (McNemer检验检验)用途用途:常用于比较检验方法的阳性率是否有差常用于比较检验方法的阳性率是否有差别。别。特点:对同一观察对象分别用两种方法处理,特点:对同一观察对象分别用两种方法处理,观察其阳性与阴性结果。观察其阳性与阴性结果。资料整理为配对四格表形式资料整理为配对四格表形式.30例例7-3:某实验室采用两种方法对:某实验室采用两种方法对58名可疑红斑名可疑红斑狼疮患者的血清抗体进行测定,问:两方法狼疮患者的血清抗体进行测定,问:两方法测定结果阳性检出率是否有差别?测定结果阳性检出率是否有差别?测定结果为:阳性、阴性(共测定结果为:阳性、阴性(共116标本,标本,58对)对
16、)方法方法(X)乳胶凝集法乳胶凝集法 免疫荧光法免疫荧光法 对子例数对子例数 11 33 2 1258对对结果结果31配对设计资料的四格表及公式配对设计资料的四格表及公式 表表7-3 两种方法的检测结果两种方法的检测结果 免疫免疫 乳胶凝集法乳胶凝集法荧光法荧光法 合计合计 11(a)12(b)23 (a+b)2(c)33(d)35(c+d)合计合计 13(a+c)45(b+d)58(n)公式公式7-8b+c40用用32例:配对计数资料的比较例:配对计数资料的比较1.建立检验的假设建立检验的假设H0:b=c=(12+2)/2=7(两法总体阳性率相等)两法总体阳性率相等)H1:b c (两方法总
17、体阳性率不等)两方法总体阳性率不等)2.=0.053.计算计算 2 统计量统计量(McNemer检验检验)334.确定自由度(确定自由度()和)和 2值值 的概率(的概率(P)=(行数(行数1)(列数)(列数1)本例:本例:=1本例本例2=5.793.84,P0.055.结论:在结论:在=0.05水准,拒绝水准,拒绝H0,P0.05认为两方法的检测率不同,乳胶凝集法的阳性检测认为两方法的检测率不同,乳胶凝集法的阳性检测率率22.41%低于免疫检测率低于免疫检测率39.66%。34配对设计与成组设计比较及配对设计与成组设计比较及四格表形式上的区别四格表形式上的区别n1n235第三节第三节.四格表
18、的四格表的Fisher确切概率法确切概率法(条件条件:T1,或或n40用用)例:表例:表7-4 两组新生儿两组新生儿HBV感染率的比较感染率的比较组别组别 阳性阳性 阴性阴性 合计合计 感染率感染率%预防组预防组 4 18 22 18.18非预防组非预防组 5(3)6 11 45.45合计合计 9 24 33 27.27 了解方法的条件,计算不要求。了解方法的条件,计算不要求。36公式公式7-9是四格表边际合计数固定时是四格表边际合计数固定时,出现出现表中频数为表中频数为a,b,c,d的概率的概率本例为双侧检验本例为双侧检验(143页四格表)页四格表)计算计算p=p1+p2+p3+p4+p5+
19、p10=0.1210=0.05结论结论:p 0.05,还不能认为预防注射和非预防注射组还不能认为预防注射和非预防注射组的的HBV感染率不同感染率不同.公式公式7-937SPSS统计软件统计软件计算结果计算结果38第四节第四节 行行列表的列表的2检验检验 当比较组的行或列分类数当比较组的行或列分类数2,称为行,称为行列表。列表。研究者感兴趣的问题有:研究者感兴趣的问题有:1.多组多组(独立样本独立样本)样本率差别有无统计意义样本率差别有无统计意义?2.两组两组(独立样本独立样本)的构成比的构成比(分布分布)有无统计意义有无统计意义?3.两个分类变量分布是否独立两个分类变量分布是否独立(有关联有关
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精选 检验 方法 讲义 18382
限制150内