分类资料统计推断.ppt
《分类资料统计推断.ppt》由会员分享,可在线阅读,更多相关《分类资料统计推断.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、分类资料的统计推断分类资料的统计推断一、率的抽样误差与标准误一、率的抽样误差与标准误抽抽样样研研究究所所得得的的率率同同样样存存在在抽抽样样误误差差,描描述述其其大大小小的的指指标标是是率率的的标标准准误误(standard error of proportion),其计算公式如下:,其计算公式如下:二、总体率的估计和率的二、总体率的估计和率的u检验检验1、总体率的估计:、总体率的估计:总体率的估计有两种方法,一是正态分布法,二是查表法。正态分布法适用于样本较大,且p和/或1-p都不太小,如np和n(1-p)都大于5时。计算公式为:查表法适用于小样本。利用样本含量n和阳性数x查“百分率的可信区
2、间”表获得。例例1 检查居民检查居民800人粪便中蛔虫阳性人粪便中蛔虫阳性200人,阳性率为人,阳性率为25%,试求,试求当地居民粪便蛔虫阳性率的当地居民粪便蛔虫阳性率的95%可信区间和可信区间和99%可信区间。可信区间。公式:公式:其中,其中,即:即:阳性率的阳性率的95%可信区间为:可信区间为:(0.22 ,0.28)或 (22%,28%)同理可得阳性率的99%可信区间。2、率的率的u检验检验(1)样本率与总体率比较)样本率与总体率比较 样本率与总体率(一般为理论值、标准值或经大量观察所得的稳样本率与总体率(一般为理论值、标准值或经大量观察所得的稳定值等)比较的定值等)比较的目的,是推断样
3、本所代表的未知总体率目的,是推断样本所代表的未知总体率与已知总体率与已知总体率0是否相等。是否相等。可选方法有可选方法有直接计算概率法直接计算概率法(用于(用于偏离偏离 0.5 较远,且阳性数较远,且阳性数 X 较小作单侧检验时)和正态近似法。这里较小作单侧检验时)和正态近似法。这里着重介绍正态近似法着重介绍正态近似法。当当或或 1不太小,而不太小,而n 足够大时,如足够大时,如n和和n(1)大于)大于 5 时时,即可按正态近似法做假设检验。检验统计量为,即可按正态近似法做假设检验。检验统计量为 u 值,计算公式如值,计算公式如下:下:式中式中 n 为样本例数,为样本例数,X 为样本阳性数,样
4、本率为样本阳性数,样本率 p=X/n;0 为总体率;为总体率;0.5 为连续性校正数,当为连续性校正数,当 n 较大时可以省去,而较大时可以省去,而X n 0.5 时不时不宜采用校正数。宜采用校正数。例例2 2 以往经验脑梗塞患者治疗三周的生活能力改善率为以往经验脑梗塞患者治疗三周的生活能力改善率为30%30%,某,某医院用新疗法治疗医院用新疗法治疗3838例的三周生活能力改善率为例的三周生活能力改善率为50%50%,能否认为新疗,能否认为新疗法的改善率与以往不同?法的改善率与以往不同?此为样本率与总体率比较:且np和n(1-p)都大于5,故用u检验。设设=0.05计算统计量计算统计量u值值:
5、本例Xn0.5,因此不宜用校正系数,故=2.69确定确定P值,作结论值,作结论:查t界值表中,=时,u0.01=2.5758,u0.005=2.8070,因而0.01P0.005,则P,拒绝H0,接受H1,可以认为新疗法的改善率与以往不同,新疗法的改善率高于以往。(2 2)两个样本率比较)两个样本率比较式中P0为合并阳性率,P0=(X1+X2)/(n1+n2)检检 验验 统统 计计 量量 计计 算算 公公 式式 如如 下下 :例例3 某中药研究所试用某种草药预防流感,观察用药某中药研究所试用某种草药预防流感,观察用药组和对照组组和对照组(未用药组未用药组)的流感发病率,结果如下表,问两的流感发
6、病率,结果如下表,问两组的流感发病率是否不同?组的流感发病率是否不同?表1用药组和对照组的流感发病率此为两大样本率的比较,可用此为两大样本率的比较,可用u检验。检验。假设检验过程:假设检验过程:设设 =0.05 计算统计量计算统计量u值:值:=2.031 确定确定P值,作结论:值,作结论:查t界值表中,=时,u0.05=1.96,u0.01=2.5758,因而0.05P0.01,则P,拒绝H0,接受H1,可以认为两组发病率不同,用药组发病率低于对照组,说明该草药有预防流感的作用三、三、2 2 检验检验2检验(Chi-squaretest)用途极广,这里仅介绍它在分类变量资料中用于推断两个或两个
7、以上总体率(或构成比)之间有无差别或有无关联的分析方法。1、2检验的基本思想检验的基本思想例4:某医生用国产呋喃硝胺治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别?表2.两种药物治疗十二指肠球部溃疡的效果 设设=0.05计算统计量计算统计量2值值:2值的基本公式基本公式为:式中A为实际频数,即所获资料中的基本数据;T为理论频数,是根据检验假设H0推算得到的,其中,nR为同行合计,nC为同列合计,n为总例数。2检验的基基本本思思想想体现在2值的基本公式中,即当H0成立时,实际频数A就与理论频数T很接近,此时2值不会太大;反之,如若A与T相差较大,就会计算得到一个
8、较大的2值,当其超出一定范围时,就有理由认为H0不成立。因此,实际上2值值反反映映了了实实际际频频数数与与理理论论频频数数的的吻吻合合程度。程度。2、四格表资料的、四格表资料的2检验检验四四格格表表资资料料即即基基本本数数据据只只有有四四个个,为为两两行行两两列列,如如两个率的比较。两个率的比较。检验统计量专用计算公式为:检验统计量专用计算公式为:,=(R-1)()(C-1)式中式中a,b,c,d 分别代表四个实际频数,分别代表四个实际频数,n 为总例数;为总例数;为自由度,为自由度,R为行数,为行数,C为列数。为列数。(1)四个表资料)四个表资料2检验实例检验实例:例4:某医生用国产呋喃硝胺
9、治疗十二指肠球部溃疡,以甲氰咪胍作对照组,结果如表5,问两种方法治疗效果有无差别?表2.两种药物治疗十二指肠球部溃疡的效果假设检验过程:假设检验过程:设设=0.05计算统计量计算统计量2值值:确定确定P值,作结论值,作结论:查2界值表中,=1时,20.05,1=3.84,20.01,1=6.63,因而0.05P0.01,即P,因而拒绝H0,接受H1,可以认为两组溃疡愈合率差别显著,呋喃硝胺的愈合率高于甲氰咪胍。(2)四格表资料四格表资料2检验检验应用注意应用注意:当n40,且任意T5时,可四格表专用公式。当n40,且任意1T5时,应,其计算公式为:例5.某医生欲比较胞磷胆碱与脑益嗪治疗脑动脉硬
10、化的疗效,观察结果如表3,问两种药物的疗效有无差别?表3.两种药物治疗脑动脉硬化的疗效表3显示有一个理论频数T5,因此应用校正2检验。当n40或任意T1时,应改用改用确切概率法。直接使用直接使用计算校正计算校正2值值(3)四格表资料)四格表资料2检验与检验与 u 检验的关系检验的关系例例6 以例以例3资料作资料作2检验,整理如表检验,整理如表4:表4用药组和对照组的流感发病率的比较即两大样本率比较的即两大样本率比较的2检验与检验与 u 检验是等价的检验是等价的。=4.125=u2(2.031)2例例7 某某市市对对医医院院空空气气消消毒毒监监测测,市市级级医医院院65个个抽抽样样点点中中52个
11、个合合格格,合合格格率率80.00%,乡乡镇镇医医院院53个个抽抽样样点点中中22个个合合格格,合格率合格率41.51%。问城乡医院空气消毒合格率是否不同?。问城乡医院空气消毒合格率是否不同?表5城乡医院空气消毒合格率的比较采用2检验=18.50例例8 某某医医生生用用两两种种疗疗法法治治疗疗某某病病,结结果果如如表表6,问问可可否认为新疗法优于传统疗法?否认为新疗法优于传统疗法?表6两种疗法治疗某病治愈率比较=7.473、行、行列表列表(RC表表)资料的资料的2检验检验行列表资料即基本数据在四个以上,如多个率的比较,其基本数据为R行2列;两组构成比的比较,其基本数据为2行C列;多组构成比的比
12、较,其基本数据为R行C列。检验统计量计算公式为:,=(R-1)()(C-1)其应应用用条条件件是是 T 5 的的格格子子数数不不超超过过 1/5 和和没没有有任任意意格格的的 T1。如果出现上述情况应作如下处理:根本办法是增加观察例数,使各格基本数据增大;将T较小的行或列与性质相近的行或列作合理的合并。例例9 某地在流行性脑脊髓膜炎流行期间进行了带菌某地在流行性脑脊髓膜炎流行期间进行了带菌调查,结果如表调查,结果如表7,问不同人群带菌率是否不同?,问不同人群带菌率是否不同?表7某地流行性脑脊髓膜炎流行期不同人群带菌率 采用采用RC表资料表资料2检验。检验。设设 H0:四个人群带菌率相同,即H1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分类 资料 统计 推断
限制150内