11卡方检验.ppt
2检验Chi-square test主要内容n2分布n两个率的比较n四格表的确切概率n多个率的比较n构成比的比较nRC列联表的分析n配对设计两个率的比较n2分布的应用条件2两样本率比较的卡方检验n卡方检验的原理q一种对理论频数和实际频数吻合程度的考察。nA investigation of the degree of agreement of theoretical frequency and actual frequency.q一个正常的骰子,抛出后得到六个面的概率均为1/6。因此,要判定一个骰子是否合格,可以通过抛骰子的方法来进行;3四格表(fourfold table)组别有效无效合计有效率(%)试验组43105381.13对照组40165671.43合计832610976.15例6.5 109例患者治疗后有效率比较4理论数的计算n如果两组率相等,则理论上有效率为76.15%。n理论与实际相吻合!n则观察53人,有530.761540.36人有效,53-40.36=12.64人无效。n观察56人,有560.7615=42.64人有效,56-42.64=13.36人无效。5理论频数的计算43104016实际数 理论数40.3612.6442.6413.366衡量理论数与实际数的差别7Karl Pearson 18571936n英国统计学家n1901年10月与Weldon、Galton一起创办Biometrika8自由度为1 的2分布0.00.10.20.30.40.59自由度为2 的2分布0.00.10.20.30.40.5102分布0.00.10.20.30.40.511自由度为1的2分布界值0.00.10.20.30.40.53.840.05122检验的步骤n(1)H0:1=2;n H1:12,n=0.05n(2)2=1.41n(3)P0.05n(4)按0.05水准,不拒绝H0,差异没有统计学意义。尚不能认为两种方法的治疗效果不同。13四格表2检验的专用公式a b cd4310401614与正态分布的关系3.840.050.0250.0251.96-1.9615四格表2检验的应用条件:nn40,T5,用2;nn40,但1T5,用校正2。nn 40,或T1,用确切概率。16四格表的校正卡方检验例 穿新旧两种防护服工人的皮肤炎患病率比较 组别阳性阴性合计患病率(%)新114156.7旧10182835.7合计11324325.617H0:两组工人的皮肤炎患病率无差别,即1=2;H1:两组工人的皮肤炎患病率有差别,即12;检验水准=0.05。求得最小的理论频数T11=1511/43=3.84,1T1140,所以宜用 2检验的校正公式18查附表8的2界值表得0.05 P 0.10,按=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为穿不同防护服的皮肤炎患病率有差别。19多个率比较的2检验三种药物虫卵阴转率的比较药物阴转例数未阴转例数合计阴转率(%)复方敌百虫片2893775.7纯敌百虫片18203847.4灭虫灵10243429.4合计565310951.4 三种药物驱钩虫的疗效,服药7天得粪检钩虫卵阴转率(%),三种药物疗效是否相同?20n如果各方法阴转率相等(H0成立),那么阴转率应当均为51.40%。由此可以计算出每格的理论频数。根据实际频数与理论频数之差所得出的卡方值越大,说明假设的总体中得到现有偏差及更大偏差的样本的概率越小!nP,拒绝H0。21理论数的计算19.0217.9819.5318.4717.4816.52实际数A 理论数T28937182038102434 56(51.40%)53(48.60%)109222值的计算19.0217.9819.5318.4717.4816.52 实际数A 理论数T28918201024232值的计算2893718203810243456531092425自由度为2的2分布界值0.00.10.20.30.40.55.99 0.05263个率比较的2检验的过程nH0:12 3nH1:三种方法阴转率不等或者不全相等 0.05=212P0.05按0.05水准,不拒绝H0,差异没有统计学意义。尚不能认为两组血型构成比不同。33构成比的比较美国、中国、挪威三种不同国籍者的ABO血型分布国籍OABAB合计美国450(45.0)410(41.0)100(10.0)40(4.0)1000挪威190(38.0)250(50.0)40(8.0)20(4.0)500中国300(30.0)250(25.0)350(35.0)100(10.0)1000合计940(37.6)910(36.4)490(19.6)160(6.4)2500342值的计算450410100 40190250 40 2030025035010037636419664158182 983237636419664实际数A 理论数T352值的计算450410100 401000190250 40 20 5003002503501001000940910490160 2500363个构成比比较的2检验步骤1、H0:三种国籍国民的血型构成相同;H1:三种国籍国民的血型构成不同或不全相同。2、0.05。3、计算统计量:2332.9668,v=6。4、P=0.00005、按0.05水准,拒绝H0,接受H1,差异有统计学意义。认为三种国籍国民的血型构成不同或不全相同。37配对四格表资料的2检验两种检验结果比较可能的结果甲法乙法频数1a2b3c4d38配对四格表资料的2检验两种检验方法结果比较乙甲合计160(a)26(b)1865(c)48(d)53合计1657423939配对四格表资料的实际数与理论数26(b)5(c)15.515.5b+c20时:4041连续性校正b+c40时:42配对四格表资料的2检验步骤1、H0:两种检验方法的结果相同,总体BC;H1:两种检验方法的结果不同,总体BC。2、0.05。3、计算统计量:212.90。4、P0.055、按0.05水准,不拒绝H0。认为两种检验结果不同,荧光抗体法阳性结果高于常规培养法。438 2检验的应用条件(1)n四格表的分析方法选择条件:qn40,T5,用2;qn40,但1T5,用校正2。qn 40,或T1,用确切概率法。n配对四格表的分析方法选择条件:qb+c40,用2;q20b+c40,用校正2;qb+c20,用确切概率法。442检验的应用条件(2)nRC表的分析方法选择条件:q理论数不能小于1;q理论数大于1小于5的格子数不超过总格子数的1/5。q否则用Fisher确切概率或似然比检验(likelihood ratio test);q增加样本含量;删去;合并45 四格表的确切概率(Fishers exact probability in 22 table)大脑左半球与右半球的恶性肿瘤作占比例组别良性恶性合计恶性肿瘤所占比例率(%)左 半 球1331618.75右 半 球761346.15合计2092946确切概率的基本思想n基本思想:q周边合计应当是不变的q在假定H0成立时,四格表频数的各种组合都有可能得到,但得到的概率大小不同;q假定零假设成立,计算此时出现现有样本及更极端样本的概率。n所谓极端,这里指不同组合下两样本率差别更大的情形;q若零假设成立,此概率应当不会太小!47四格表周边合计不变xa+b-xa+ba+c-xd-a+xc+da+cb+dnx=0,1,min(a+c,a+d)48四格表(周边合计不变时)所有可能的排列(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.03453.03452.03451.03450.0345(6)(7)(8)(9)(10)124133142151160 85 76 67 58 49|A-T|:0.96551.96552.96553.96554.965549每一种组合的概率aba+bcdc+da+cb+dn超几何分布(hypergeometric distribution)50四格表所有可能排列的概率(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.03453.03452.03451.03450.0345Pi0.0011420.0167060.0890980.2286860.311844(6)(7)(8)(9)(10)124133142151160 85 76 67 58 49|A-T|:0.96551.96552.96553.96554.9655Pi 0.2338830.0959520.0205610.0020560.00007151P 值的计算(1)(2)(3)(4)(5)79 88 97106116130121112103 94|A-T|:4.03453.03452.03451.03450.0345Pi0.0011420.0167060.089098(6)(7)(8)(9)(10)124133142151160 85 76 67 58 49|A-T|:0.96551.96552.96553.96554.9655Pi 0.0959520.0205610.0020560.000071P=0.22558652超几何分布的概率分布ProbabilityA-T-4.03454.96550.05.10.15.20.25.30.3553nH0:大脑两半球恶性肿瘤所占比例相等;nH1:大脑两半球恶性肿瘤所占比例不等。n0.05。nP=Pi=0.2256n按=0.05水准,拒绝H0,差异无统计学意义。故尚不能认为大脑两半球恶性肿瘤所占比例有差别。54定性资料假设检验的正确应用n多个率或构成比的比较拒绝H0的含义;n等级资料(有序分类资料)的比较应该考虑使用秩和检验55本章重点:n2检验用于哪些资料的分析?q理论数与实际数的比较n2检验的应用条件是什么?nFishers 确切概率。565757