《医学统计学11卡方检验.ppt》由会员分享,可在线阅读,更多相关《医学统计学11卡方检验.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、定性资料的统计分析Statistical Analysis of Categorical Data主要内容n样本率与总体率的比较 直接概率计算 u检验n两样本率的比较 u检验 卡方检验n多个率的比较n构成比的比较n配对设计两样本的比较n正确应用21.样本率与总体率的比较n率的抽样分布规律:np5且n(1-p)5时,率的抽样分布近似正态分布样本率与总体率的比较样本率与总体率的比较np5且n(1-p)5?近似正态法近似正态法直接计算法直接计算法YN31.1 直接计算概率法例 据以往经验,新生儿染色体异常率一般为1%,某 医院观察了当地400名新生儿,只有1例异常,问该地新生儿染色体异常率是否低于一
2、般?H0:=0.01 H1:0.05 不拒绝H0 尚不能认为该地异常率低于一般。思想:若该地异常率不低于一般(等于一般),则以假设的异常率得到手头样本的异常率及更低的异常率的概率不会太小!不会太小!41.2 近似正态法5近似正态法n据临床经验,一般的胃溃疡病患者有20会出现胃出血症状。某医院观察了304例65岁的胃溃疡病患者,其中有96例发生胃出血,占31.58,问老年患者是否较一般患者易出血?H0:=0,老年胃溃疡病患者的胃出血率等于20;H1:0,老年胃溃疡病患者的胃出血率大于20。单侧=0.05 得P0.05,故按0.05水准,不拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合
3、疗法对乳腺癌患者治疗效果有差别。9两样本率比较的卡方检验n卡方检验的原理q一种对理论频数和实际频数吻合程度的考察。nA investigation of the degree of agreement of theoretical frequency and actual frequency.q一个正常的骰子,抛出后得到六个面的概率均为1/6。因此,要判定一个骰子是否合格,可以通过抛骰子的方法来进行;10四格表(fourfold table)处 理存活数死亡数合计生存率(%)联合治疗3984783.0单纯治疗57278467.9合计963513173.3例7.2 131例乳癌患者两种治疗方法治
4、疗后生存率比较11理论数的计算n如果两组率相等,则理论上生存率为73.3%。n理论与实际相吻合!n则观察47人,有470.73334.44人有效,47-34.44=12.56人无效。n观察84人,有840.733=61.56人有效,84-61.56=22.44人无效。12理论频数的计算3985727实际数 理论数34.4412.5661.5622.4413衡量理论数与实际数的差别14Karl Pearson 18571936n英国统计学家n1901年10月与Weldon、Galton一起创办Biometrika15自由度为1 的2分布0.00.10.20.30.40.516自由度为2 的2分布
5、0.00.10.20.30.40.5172分布0.00.10.20.30.40.518自由度为1的2分布界值0.00.10.20.30.40.53.840.05192检验的步骤n(1)H0:1=2;n H1:12,=0.05n(2)2=3.52n(3)P0.05n(4)按0.05水准,不拒绝H0,尚不能认为两种方法的治疗效果有差别。20四格表2检验的专用公式a b cd398572721与正态分布的关系3.840.050.0250.0251.96-1.9622四格表2检验的应用条件:nn40,T5,用2;nn40,但1T5,用校正2。nn 40,或T1,用确切概率。23四格表的校正卡方检验例
6、穿新旧两种防护服工人的皮肤炎患病率比较 组别阳性阴性合计患病率(%)新114156.7旧10182835.7合计11324325.624H0:两组工人的皮肤炎患病率无差别,即1=2;H1:两组工人的皮肤炎患病率有差别,即12;检验水准=0.05。求得最小的理论频数T11=1511/43=3.84,1T1140,所以宜用 2检验的校正公式25查附表8的2界值表得0.05 P 0.10,按=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为穿不同防护服的皮肤炎患病率有差别。26多个率比较的2检验三种药物虫卵阴转率的比较药物阴转例数未阴转例数合计阴转率(%)复方敌百虫片2893775.7纯敌百虫
7、片18203847.4灭虫灵10243429.4合计565310951.4 三种药物驱钩虫的疗效,服药7天得粪检钩虫卵阴转率(%),三种药物疗效是否相同?27n如果各方法阴转率相等(H0成立),那么阴转率应当均为51.40%。由此可以计算出每格的理论频数。根据实际频数与理论频数之差所得出的卡方值越大,说明假设的总体中得到现有偏差及更大偏差的样本的概率越小!nP,拒绝H0。28理论数的计算19.0217.9819.5318.4717.4816.52实际数A 理论数T28937182038102434 56(51.40%)53(48.60%)109292值的计算19.0217.9819.5318.
8、4717.4816.52 实际数A 理论数T28918201024302值的计算2893718203810243456531093132自由度为2的2分布界值0.00.10.20.30.40.55.99 0.05333个率比较的2检验的过程nH0:12 3nH1:三种方法阴转率不等或者不全相等 0.05=212P0.05;按照0.05的检验水准拒绝H0,接受H1,差别有统计学意义,可认为三种方法阴转率不同或不全相等。34多重比较n计算两率之差的可信区间35单个样本的假设检验可信区间包含H0假设的总体,假设检验的结论:不拒绝H0;可信区间不包含H0假设的总体,假设检验的结论:拒绝H0;假设检验的
9、结论拒绝H0,可信区间必然不包含H0假设的总体;假设检验的结论不拒绝H0,可信区间包含H0假设的总体。36构成比的比较美国、中国、挪威三种不同国籍者的ABO血型分布国籍OABAB合计美国450(45.0)410(41.0)100(10.0)40(4.0)1000挪威190(38.0)250(50.0)40(8.0)20(4.0)500中国300(30.0)250(25.0)350(35.0)100(10.0)1000合计940(37.6)910(36.4)490(19.6)160(6.4)2500372值的计算450410100 40190250 40 20300250350100376364
10、19664158182 983237636419664实际数A 理论数T382值的计算450410100 401000190250 40 20 5003002503501001000940910490160 2500393个构成比比较的2检验步骤1H0:三种国籍国民的血型构成相同;H1:三种国籍国民的血型构成不同或不全相同。0.05。2计算统计量:2332.9668,v=6。3P=0.00004按0.05水准,拒绝H0,接受H1。认为三种国籍国民的血型构成不同或不全相同。403 配对四格表资料的2检验两种血清学检验结果比较可能的结果甲法乙法频数1a2b3c4d41配对四格表资料的2检验两种血清
11、学检验结果比较甲法乙法合计45(a)22(b)67 6(c)20(d)26合计51429342配对四格表资料的实际数与理论数22(b)6(c)14 1443连续性校正b+c40时:44配对四格表资料的2检验步骤1H0:两法检出阳性率相同,总体BC;H1:两法检出阳性率不同,总体BC。0.05。2计算统计量:C28.04。3P=0.00464按0.05水准,拒绝H0,接受H1。可以认为甲乙两法血清学检出阳性率不同。甲法阳性率高。458 2检验的应用条件(1)n四格表的分析方法选择条件:qn40,T5,用2;qn40,但1T5,用校正2。qn 40,或T1,用确切概率。n配对四格表的分析方法选择条件:qb+c40,用2;q20b+c40,用校正2;qb+c20,用确切概率。462检验的应用条件(2)nRC表的分析方法选择条件:q理论数不能小于1;q理论数大于1小于5的格子数不超过总格子数的1/5。q否则用Fisher确切概率或似然比检验(likelihood ratio test);q增加样本含量;删去;合并47定性资料假设检验的正确应用n多个率或构成比的比较拒绝H0的含义;n等级资料(有序分类资料)的比较应该考虑使用秩和检验484949
限制150内