定性资料的统计分析讲稿.ppt
《定性资料的统计分析讲稿.ppt》由会员分享,可在线阅读,更多相关《定性资料的统计分析讲稿.ppt(59页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 关于定性资料的统计分析第一页,讲稿共五十九页哦第七节 四格表资料的2检验第二页,讲稿共五十九页哦n2检验(chi-square test)是英国统计学家Pearson于1900年提出的一种应用范围很广的统计方法。q常用来推断两个及两个以上总体率或构成比是否有差异。n根据设计类型的不同,四格表资料的2检验可分为:q完全随机设计的两样本率比较的2检验q配对设计的2检验。第三页,讲稿共五十九页哦一、2检验的基本思想 nu检验与t检验的思路相同,是用标准误作为尺度,去衡量统计量与总体参数差别的大小。n2检验(chi-square test)的思路则与u检验、t检验不同,却有着异曲同工之妙。第四页,讲
2、稿共五十九页哦n例、某医院肿瘤科3年来共治疗乳腺癌患者n=131例,每例观察5年,其中单纯手术治疗组观察n1=84例,存活x1=57例,联合治疗组观察n2=47例,存活x2=39例。将资料整理成以下形式的分类频数表。组别存活数死亡数合计阳性率(%)联合治疗39(a)8(b)47(a+b)83.0单纯手术57(c)27(d)84(c+d)67.9合计96(a+c)35(b+d)131(n)73.3第五页,讲稿共五十九页哦1、四格表的概念 na、b、c、d这四个格子的频数是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,通常将这种资料称为四格表资料(22表资料)。n四格表资料多用来比较两
3、种处理的不同效果,而每种处理只产生两种相互对立的结果。q如生存与死亡、有效与无效、患病与未患病、阳性与阴性、检出与未检出等。第六页,讲稿共五十九页哦2、建立检验假设 n当两个样本率不等时,可能有两种原因:q差别仅由抽样误差所致;q两种处理的效果确有不同,而导致了样本率的不同。n为区别这两种情况,分别建立检验假设:H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。=0.05。第七页,讲稿共五十九页哦3、H0条件下的理论频数 nH0假设认为,两个样本来自同一总体,即“单纯组”与“联合组”的存活率相同,差别仅由抽样误差所致,则可用合计存活率 73.3(即96/131)作为总体率的点估
4、计。nH0条件下,单纯组理论存活数应为47(96/131)=34.44例,联合组理论存活数应为84(96/131)=61.56例;同理,两组理论死亡数为12.56例和22.44例。这四个根据H0假设求得的数据称为理论频数T。第八页,讲稿共五十九页哦n理论频数T可用公式计算:n式中 TRC表示第R行、第C列的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数。第九页,讲稿共五十九页哦4、2检验的思路 n如果H0假设成立,则实际频数A与理论频数T应该比较接近。n如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等。第十页,讲稿共
5、五十九页哦n实际频数Ai与理论频数Ti之间的抽样误差,可以用2统计量表示:n2统计量服从2分布,反映了实际频数A与理论频数T吻合的程度。A与T相差越大,则2值就会越大。第十一页,讲稿共五十九页哦n如果H0假设成立,则实际频数与理论频数之差异纯系抽样误差所致,故2值不会很大。即在H0假设的前提下,一次随机试验中,出现较大2值的概率P是很小的。n如果手头样本求得很小的P,且P,根据小概率原理,就有理由怀疑H0的真实性,故拒绝之;若P,则没有理由拒绝H0。n2值与P值的对应关系可查附表3的2界值表。第十二页,讲稿共五十九页哦n根据计算公式,2值的大小除了和实际频数与理论频数的差值|AT|有关还与格子
6、数有关,严格的讲是和自由度有关。n行列表的自由度,是指在表中周边合计数不变的前提下,基本数据可以自由变动的格子数。q四格表中有四个基本数据,其中任何一个数据发生变化,其余三个数据由于受周边合计数的限制,只能随之相应变动,故其自由度为1。n=(行数-1)(列数-1)第十三页,讲稿共五十九页哦二、完全随机设计的两样本率的比较 n完全随机设计的两个样本率比较的目的是推断两个样本率各自所代表的总体率是否相等。检验方法可用u检验或2检验。n例1、某医院肿瘤科3年来治疗乳腺癌患者n=131例,其中单纯手术组观察n1=84例,存活x1=57例,联合治疗组观察n2=47例,存活x2=39例,问两组存活率有无差
7、别?第十四页,讲稿共五十九页哦首先将资料整理成四格表形式:第十五页,讲稿共五十九页哦第十六页,讲稿共五十九页哦n例2、在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分成两组,A药组90人,有效人数为68人。B药组88人,有效人数为58人。第十七页,讲稿共五十九页哦第十八页,讲稿共五十九页哦三、四格表资料专用公式n理论频数由四格表中实际频数计算得来。n对于四格表资料,可直接用专用公式计算2值,以简化计算过程。n式中a、b、c、d分别为四格表的四个实际频数即四格表的基本数据,总例数n=abcd。第十九页,讲稿共五十九页哦n分别将前面的两个例子中的基本数据代入公式可以得到相同的2值。
8、39 8 57 27 68 22 58 30第二十页,讲稿共五十九页哦四、四格表2统计量的连续性校正 n2分布是一种连续性分布,附表3中2界值是根据此连续性分布的理论公式计算得到。n而两个或多个率比较的原始数据却属离散型分布资料,是不连续的。n因此,2检验公式是一个近似计算公式。英国统计学家Yates F认为,应将实际频数与理论频数之差的绝对值减去0.5作连续性校正。第二十一页,讲稿共五十九页哦n实际上,2值公式在四格表的基础数据均不太小时,近似程度相当高。n但是,只要四格表中的有一个基础数据出现较小值,此时求得的2值往往偏大,相应的P值偏小,从而扩大了I型误差。n为校正这种偏差,可采用校正2
9、,用C2表示。其计算公式为:第二十二页,讲稿共五十九页哦n对四格表专用公式的校正为:n两者是等价的,这种校正称为连续性校正,即Yates校正。第二十三页,讲稿共五十九页哦分析四格表资料时,不同公式的选择条件 在分析四格表资料时,需根据具体情况作出不同处理,一般认为:n1、当n40,且T5时,用基本公式计算2值;n2、当n40,且1T5时,则用2检验的连续性校正公式;n3、当n40,或有T1时,不能用2检验,应当用四格表的确切概率法。n4、当2检验所得P值接近检验水准 时,最好使用四格表确切概率法。第二十四页,讲稿共五十九页哦n例1、下表资料是单用甘磷酰芥(单纯化疗组)与复合使用争光霉素、环磷酰
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定性 资料 统计分析 讲稿
限制150内