计数资料的基本统计分析方法.ppt
第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/41第四讲第四讲 计数资料的基本统计分析方法计数资料的基本统计分析方法Qualitative data Statistical Analysis第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 定定义义:将将观观察察单单位位按按某某种种属属性性或或类类别别分分组组计计数数,分组汇总得到各组观察单位数称为计数资料。分组汇总得到各组观察单位数称为计数资料。特特点点:计计数数排排列列是是无无序序分分组组,同同组组各各观观察察单单位位之之间间没没有有量量的的差差别别,但但各各组组间间有有质质的的不不同同,各各组组互互不不相容。相容。二项分类和多项分类二项分类和多项分类计数资料(或定性资料,无序分计数资料(或定性资料,无序分 类资料)类资料)enumeration data,qualitative data,unordered category data第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/4369.2369.2345045065065060.0060.00180180300300丙药丙药合计合计75.0075.00150150200200乙药乙药80.0080.00120120150150甲药甲药治愈率治愈率(%)治愈人数治愈人数治疗人数治疗人数药名药名某药物治疗效果某药物治疗效果某药物治疗效果某药物治疗效果第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/44计数资料的统计描述计数资料的统计描述Statistical Description第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/45绝绝绝绝对对对对数数数数指指指指标标标标(absoluteabsolute number):是是是是统统统统计计计计分分分分组组组组汇汇汇汇总总总总后后后后小小小小计计计计或或或或总总总总计计计计的绝对数,用以反映事物在一定条件下的规模和水平。的绝对数,用以反映事物在一定条件下的规模和水平。的绝对数,用以反映事物在一定条件下的规模和水平。的绝对数,用以反映事物在一定条件下的规模和水平。一一.相对数指标的意义相对数指标的意义表表 某季度某季度甲、乙两部队的感冒发生情况甲、乙两部队的感冒发生情况部别部别总人数总人数发病人数发病人数发病率发病率(%)甲部队甲部队1834183458583.163.16乙部队乙部队1313131342423.203.20合计合计314731471001003.183.18第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/46相相相相对对对对数数数数指指指指标标标标(relative relative numbernumber):):有有有有联联联联系系系系的的的的两两两两个个个个指指指指标标标标之之之之比比比比。意意意意义义义义:便于表达事物出现的普遍程度;便于相互比较和保密。便于表达事物出现的普遍程度;便于相互比较和保密。便于表达事物出现的普遍程度;便于相互比较和保密。便于表达事物出现的普遍程度;便于相互比较和保密。69.2369.2345045065065060.0060.00180180300300丙药丙药合计合计75.0075.00150150200200乙药乙药80.0080.00120120150150甲药甲药治愈率治愈率(%)治愈人数治愈人数治疗人数治疗人数药名药名表表表表 某药物治疗效果某药物治疗效果某药物治疗效果某药物治疗效果第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/47率率率率(强强强强度度度度相相相相对对对对数数数数或或或或频频频频率率率率):它它它它是是是是一一一一定定定定时时时时期期期期或或或或一一一一定定定定范范范范围围围围内内内内某某某某现现现现象象象象的的的的实实实实际际际际发发发发生生生生数数数数与与与与可可可可能能能能发发发发生生生生该该该该现现现现象象象象的的的的总总总总数数数数之之之之比比比比,反反反反映映映映某某某某一一一一现象发生的频率或强度。现象发生的频率或强度。现象发生的频率或强度。现象发生的频率或强度。率率率率常常常常以以以以百百百百分分分分率率率率()、千千千千分分分分率率率率()、万万万万分分分分率率率率(1/1/万万万万)、十十十十万分率(万分率(万分率(万分率(1/101/10万)等比例基数表示。万)等比例基数表示。万)等比例基数表示。万)等比例基数表示。(一)(一)率率(rate)二二.几种常用的相对数几种常用的相对数第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/48某病患病率某病患病率某病患病率某病患病率该时期受检人数该时期受检人数该时期受检人数该时期受检人数检查时发现的某病现患病例数检查时发现的某病现患病例数检查时发现的某病现患病例数检查时发现的某病现患病例数比例基数比例基数比例基数比例基数 某病发病率某病发病率某病发病率某病发病率一定时期内可能发生某一定时期内可能发生某一定时期内可能发生某一定时期内可能发生某病的平均人口数病的平均人口数病的平均人口数病的平均人口数该时期新发生的某病病例数该时期新发生的某病病例数该时期新发生的某病病例数该时期新发生的某病病例数比例基数比例基数比例基数比例基数 例如:甲型例如:甲型例如:甲型例如:甲型H1N1H1N1第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/49某病治愈率某病治愈率某病治愈率某病治愈率该病受治病人数该病受治病人数该病受治病人数该病受治病人数治愈某病病人数治愈某病病人数治愈某病病人数治愈某病病人数比例基数比例基数比例基数比例基数 某病病死率某病病死率某病病死率某病病死率同期某病病人数同期某病病人数同期某病病人数同期某病病人数观察期间某病死亡人数观察期间某病死亡人数观察期间某病死亡人数观察期间某病死亡人数比例基数比例基数比例基数比例基数 某病感染率某病感染率某病感染率某病感染率受检人口数受检人口数受检人口数受检人口数感染某病病原体的人数感染某病病原体的人数感染某病病原体的人数感染某病病原体的人数比例基数比例基数比例基数比例基数 第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/410构构构构成成成成比比比比(结结结结构构构构相相相相对对对对数数数数、百百百百分分分分比比比比):某某某某现现现现象象象象内内内内部部部部各各各各个个个个构构构构成部分所占的比重或分布。成部分所占的比重或分布。成部分所占的比重或分布。成部分所占的比重或分布。构成比常以构成比常以构成比常以构成比常以100100为基数,各构成部分构成比之和必须为基数,各构成部分构成比之和必须为基数,各构成部分构成比之和必须为基数,各构成部分构成比之和必须为为为为100%100%。(二)构成比(二)构成比(percentage)第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/411例例2-22-2 某某年年某某地地区区共共发发生生各各种种疟疟疾疾9797例例,其其中中恶恶性性疟疟6868例例,间间日日疟疟1212例例,三三日日疟疟1717例例,则则三三种种疟疟疾疾的的构构成成情况如下:情况如下:恶性疟恶性疟:间日疟间日疟:三日疟三日疟:第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/412比比(比比值值):两两个个相相关关指指标标之之比比,说说明明两两个个指指标标的的对比关系。对比关系。(三)比(三)比(Ratio)第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/413例例2-32-3 某某地地19911991年年至至19951995年年肺肺癌癌患患者者中中男男性性478478例例,女性女性136136例,试求当地肺癌患者的性别比值。例,试求当地肺癌患者的性别比值。即男性患者为女性患者的即男性患者为女性患者的3.53.5倍,或男倍,或男:女女3.5:13.5:1性别比性别比第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/414n计计算算观观察察单单位位数数不不等等的的几几个个率率的的平平均均率率时时不不能能将将几几个个率直接相加求平均率。率直接相加求平均率。三三.应用相对数的注意事项应用相对数的注意事项 n分分母母应应当当够够大大:如如果果分分母母太太小小,宜宜用用绝绝对对数数表表示示,如如“例全部治愈例全部治愈”,“3例中死亡例例中死亡例”等。等。第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/415n正正确确选选择择分分母母:计计算算率率(强强度度相相对对数数)时时,分分母母中中的的每一观察单位应当都有可能成为分子。每一观察单位应当都有可能成为分子。表表表表2-3 2-3 各种各种各种各种职业职业职业职业砂眼患者就砂眼患者就砂眼患者就砂眼患者就诊诊诊诊情况情况情况情况 100.0100.0 10.210.27.67.621.821.817.917.942.542.5发发发发病率病率病率病率(%)(%)42184218 432432 320320 920920 754754 17921792人数人数人数人数合合合合计计计计其他其他其他其他干部干部干部干部学生学生学生学生农农农农民民民民工人工人工人工人职业职业职业职业第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/416计数资料的统计推断计数资料的统计推断Statistical Inference第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/417 检验检验Chi-square test第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/418 列联表(列联表(contingency table)是将每个观察个体按是将每个观察个体按两个或两个以上的属性(分类变量)交叉分类时形成的两个或两个以上的属性(分类变量)交叉分类时形成的频数表。频数表。第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/419o是一种用途较广的假设检验方法,它是利用是一种用途较广的假设检验方法,它是利用2分分布布(Chi-square distribution)的原理进行的原理进行统计检验;统计检验;o用于计数资料;用于计数资料;o用于两个或两个以上样本率(或构成比)之间的用于两个或两个以上样本率(或构成比)之间的比较,两因素间的相关分析等;比较,两因素间的相关分析等;第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/420四格表资料的四格表资料的2 2检验检验第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/421一、两样本率比较一、两样本率比较实例实例1:某医师用两种方法治疗慢性乙型肝炎的疗某医师用两种方法治疗慢性乙型肝炎的疗效见表,问两组疗效间有无显著差别?(能否效见表,问两组疗效间有无显著差别?(能否直接从数字下结论?风险?)直接从数字下结论?风险?)表表1 两种方法治疗慢性乙型肝炎的疗效比较两种方法治疗慢性乙型肝炎的疗效比较 第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/422运用四格表的条件运用四格表的条件1、当、当N40 且且T5,运用专用公式,即,运用专用公式,即Pearson Chi-Square;2、有一理论频数为、有一理论频数为1T40时需用校正公式时需用校正公式计算计算2值,即值,即Continuity Correlation;3、当、当T1或或N40时,需用确切概率计算法,即时,需用确切概率计算法,即Fishers Exact Test。第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU四格表实际频数与理论频数显示四格表实际频数与理论频数显示理论频数理论频数实际频数实际频数第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 检验结果检验结果单侧确切概率值单侧确切概率值双侧确切概率值双侧确切概率值P值值自由度自由度卡方值卡方值第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/425穿新旧两种防护服工人的皮肤炎患病率比较穿新旧两种防护服工人的皮肤炎患病率比较 实例实例2第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/426实实例例3 3 两两种种药药物物治治疗疗某某病病结结果果见见下下表表,试试比比较较其其差差别别有有无显著性。无显著性。表表 两种药物治疗某病结果比较两种药物治疗某病结果比较 第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 检验结果检验结果实例实例1第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU四格表实际频数与理论频数显示四格表实际频数与理论频数显示理论频数理论频数实际频数实际频数实例实例2第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 检验结果检验结果连续校正卡连续校正卡方方第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 检验结果检验结果Fisher确切概率确切概率实例实例3第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/431二、配对四格表资料的二、配对四格表资料的2检验检验设计类型设计类型 对一组观察对象,同时按照两个二项对一组观察对象,同时按照两个二项分类的特征进行交叉分类,分别观察其两种分类分类的特征进行交叉分类,分别观察其两种分类变量的表现,这种资料从实验设计上属配对设计,变量的表现,这种资料从实验设计上属配对设计,称为称为22交叉分类资料。交叉分类资料。计数资料的配对设计常用于:两种检验方法、计数资料的配对设计常用于:两种检验方法、培养方法、诊断方法、治疗方法的比较。培养方法、诊断方法、治疗方法的比较。第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/432实例实例 有有260份血清样品,每份样品一分为二,份血清样品,每份样品一分为二,用二种不同的免疫学检测方法检验类风湿因子。用二种不同的免疫学检测方法检验类风湿因子。(配对实验)(配对实验)两种血清免疫学检测结果两种血清免疫学检测结果 第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU配对四格表配对四格表McNemar检验结果检验结果P值值第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/434行行 列列 表资料的表资料的22检验检验第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/435某药不同剂量的镇痛效果某药不同剂量的镇痛效果某药不同剂量的镇痛效果某药不同剂量的镇痛效果 剂量剂量镇痛效果镇痛效果合计合计有效率(有效率(%)有效有效无效无效1.0mg3121520.002.5mg1192055.005.0mg1261866.67合计合计26275349.06应用实例应用实例 (选自卫生部规划教材方积乾主编(选自卫生部规划教材方积乾主编卫生统计学卫生统计学P115)第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU例例 SPSS SPSS操作结果操作结果实际频数与理论频数显示实际频数与理论频数显示第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU 检验结果检验结果检验统计量检验统计量 =7.584=7.584,P=0.0230.05P=0.0230.0250.01671.0mgV5.0mg7.1870.050.0167注:表中注:表中“”表示差别无统计学意义,表示差别无统计学意义,“*”表示差别有统计学意义。表示差别有统计学意义。第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/447行行列表的列表的x2检验的注意事项检验的注意事项第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/4481、有、有1/5以上格子的理论频数小于以上格子的理论频数小于5;2、一个理论频数小于、一个理论频数小于1;3、总样本例数小于、总样本例数小于40当有以上三种情况或之一存在时,均不适宜进行当有以上三种情况或之一存在时,均不适宜进行x2检验,检验,有三种处理方法:有三种处理方法:1、增加样本含量、增加样本含量2、根据专业知识,删除理论频数过小的行或列,或将理、根据专业知识,删除理论频数过小的行或列,或将理论频数过小的行或列与性质相近的行或列合并(不推荐,论频数过小的行或列与性质相近的行或列合并(不推荐,应慎重)应慎重)3、Fisher确切概率法确切概率法(可用可用SAS软件实现软件实现)第三军医大学卫生统计学教研室 Department of Health Statistics,TMMU2022/12/449