《第五章 检验优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第五章 检验优秀PPT.ppt(95页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章 检验第一页,本课件共有95页连续型资料连续型资料资资 料料离散型资料离散型资料小样本小样本大样本大样本第二页,本课件共有95页二、二、2检验与连续型资料假设检验的区别检验与连续型资料假设检验的区别一、一、2检验的定义检验的定义三、三、2检验的用途检验的用途概概 述述第三页,本课件共有95页2 检验检验(Chi-square test)对对样本样本的的频数分布频数分布所来自的所来自的总体分总体分布布是否服从是否服从某种理论分布或某种假设分某种理论分布或某种假设分布布所作的假设检验,即根据所作的假设检验,即根据样本样本的频数的频数分布来推断分布来推断总体总体的分布。的分布。一、一、2检验的
2、定义检验的定义第四页,本课件共有95页2检验与测量数据假设检验的区别检验与测量数据假设检验的区别(1)测量数据的假设检验,其数据属测量数据的假设检验,其数据属于于连续型变量连续型变量,而,而2 2检验的数据属检验的数据属于点数而来的于点数而来的离散型变量离散型变量。第五页,本课件共有95页 测量数据所来自的总体要求呈测量数据所来自的总体要求呈正态正态分布分布,而,而2 2检验的数据所来自的总体分检验的数据所来自的总体分布是布是未知未知的。的。2检验与测量数据假设检验的区别检验与测量数据假设检验的区别(2)第六页,本课件共有95页 测量数据的假设检验是对测量数据的假设检验是对总体总体参数或几个总
3、体参数之差参数或几个总体参数之差所进行的所进行的假设检验,而假设检验,而2 2 检验在多数情况检验在多数情况下不是对总体参数的检验,而是对下不是对总体参数的检验,而是对总体分布总体分布的假设检验。的假设检验。2检验与测量数据假设检验的区别检验与测量数据假设检验的区别(3)第七页,本课件共有95页二、二、2检验与连续型资料假设检验的区别检验与连续型资料假设检验的区别对总体参数或几个总体对总体参数或几个总体参数之差参数之差不是对总体参数的检不是对总体参数的检验,而是对总体分布验,而是对总体分布的假设检验的假设检验正态分布正态分布总体分布是未知的总体分布是未知的连续连续型型资料资料离散型资料离散型资
4、料检验对象检验对象总体总体数据资料数据资料连续型资料假设检验连续型资料假设检验2 2 检验检验第八页,本课件共有95页三、三、2检验的用途检验的用途适合性检验适合性检验独立性检验独立性检验同质性检验同质性检验第九页,本课件共有95页适合性检验(吻合度检验)适合性检验(吻合度检验)是指对样本的理论数先通过一定的理是指对样本的理论数先通过一定的理论分布推算出来,然后用论分布推算出来,然后用实际观测值实际观测值与与理论理论数数相比较,从而得出实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。因此又叫吻合度检验。之间是否吻合。因此又叫吻合度检验。第十页,本课件共有95页是指研究是指研究
5、两个或两个以上两个或两个以上的的计数资料计数资料或属性资料或属性资料之间是相互独立的或者是相互联之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是间没有关联,然后证明这种无关联的假设是否成立。否成立。独立性检验独立性检验第十一页,本课件共有95页在连续型资料的假设检验中,对在连续型资料的假设检验中,对一个一个样样本本方差方差的同质性检验,也需进行的同质性检验,也需进行2 2 检验。检验。同质性检验同质性检验第十二页,本课件共有95页第一节:2检验的原理与方法2检验的基本原理2检验统计量的基本形式2值的特
6、点2检验的基本步骤2检验的注意事项第十三页,本课件共有95页2 2检验检验就是统计样本的就是统计样本的实际观测值实际观测值实际观测值实际观测值与与理论推理论推算值算值之间的偏离程度。之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决实际观测值与理论推算值之间的偏离程度就决定其定其2 2值的大小。理论值与实际值之间偏差越大,值的大小。理论值与实际值之间偏差越大,2 2值就越大,越不符合;偏差越小,值就越大,越不符合;偏差越小,2 2值就越小,越值就越小,越趋于符合;若两值完全相等时,趋于符合;若两值完全相等时,2 2值就为值就为0 0,表明理论,表明理论值完全符合。值完全符合。原理原理第十
7、四页,本课件共有95页理论值理论值观测值观测值第十五页,本课件共有95页2检验统计量的基本形式检验统计量的基本形式2(OiEi)2 EiO实际观察的频数实际观察的频数(observational frequency)E无效假设下的期望频数无效假设下的期望频数(expectation frequency)第十六页,本课件共有95页玉米花粉粒碘反应观察值与理论值玉米花粉粒碘反应观察值与理论值碘反应碘反应观察值(观察值(O)理论值理论值(E)蓝色蓝色非蓝色非蓝色3437 34823459.5 3459.5 合计合计6919 6919 第十七页,本课件共有95页 要回答这个问题,首先需要确定一个统计量
8、,将其要回答这个问题,首先需要确定一个统计量,将其用来表示用来表示实际观测值实际观测值实际观测值实际观测值与与理论值理论值理论值理论值偏离的程度;然后判断偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。这一偏离程度是否属于抽样误差,即进行显著性检验。判断实际观测值与理论值偏离的程度,最简判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的单的办法是求出实际观测值与理论值的差数差数差数差数。第十八页,本课件共有95页碘反应碘反应观察值(观察值(O)理论值理论值(E)O-E蓝色蓝色非蓝色非蓝色3437 34823459.5 3459.5 22.5 22.5
9、合计合计6919 6919 玉米花粉粒碘反应观察值与理论值玉米花粉粒碘反应观察值与理论值 由于差数之和正负相消,并不能反映实际由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。观测值与理论值相差的大小。0 第十九页,本课件共有95页为了避免正、负相抵消的问题,可将实际观测值为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算:与理论值的差数平方后再相加,也就是计算:(O OE E)2 2O实际观察的频数实际观察的频数E无效假设下的期望频数无效假设下的期望频数第二十页,本课件共有95页玉米花粉粒碘反应观察值与理论值玉米花粉粒碘反应观察值与理论值碘反应碘反应
10、观察次数(观察次数(O O)理论次数(理论次数(E E)O OE E(O OE E)2 2蓝色蓝色343734373459.53459.522.522.5506.25506.25非蓝色非蓝色348234823459.53459.522.522.5506.25506.25总数总数69196919691969190 01012.51012.5 值越大,观测值与理论值相差也就越值越大,观测值与理论值相差也就越大,反之越小。大,反之越小。第二十一页,本课件共有95页200200元元0 0元元奖学金奖学金一等一等三等三等10元元10元元实际得到实际得到190190元元实际得到实际得到6060元元5 51
11、414第二十二页,本课件共有95页两组差数虽然相同,但其差数占理论值的两组差数虽然相同,但其差数占理论值的比重比重不同。不同。等级等级观测值(观测值(O)理论(理论(E)O-E(OE)2一等一等三等三等1906020070-10-10100100第二十三页,本课件共有95页 为了弥补这一不足,可先将实际观测值与理论值的为了弥补这一不足,可先将实际观测值与理论值的差数差数平方平方平方平方,即(,即(O OE E)2 2,再用差数的平方除以相应的,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(理论值,将之化为相对数,从而来反映(O OE E)2 2 的比的比重,最后将各组求和,这个总
12、和就是重,最后将各组求和,这个总和就是2 2 。2(OiEi)2 Ei第二十四页,本课件共有95页回顾:总体与样本方差公式第二十五页,本课件共有95页2(OiEi)2 Ei2值就等于各组观测值就等于各组观测值和理论值差的平方与理值和理论值差的平方与理论值之比,再求其和。论值之比,再求其和。玉米花粉粒碘反应观察值与理论值玉米花粉粒碘反应观察值与理论值碘反应碘反应观察次数(观察次数(O O)理论次数(理论次数(E E)O OE E(O OE E)2 2/E/E蓝色蓝色343734373459.53459.522.522.50.14630.1463非蓝色非蓝色348234823459.53459.5
13、22.522.50.14630.1463总数总数69196919691969190 00.29260.2926第二十六页,本课件共有95页2值的特点值的特点2(OiEi)2 Ei第二十七页,本课件共有95页2 2值与概率值与概率P P成反比,成反比,2 2值越小,值越小,P P值越大,值越大,说明实际值与理论值之差越小,样本分布与假设的说明实际值与理论值之差越小,样本分布与假设的理论分布越相一致理论分布越相一致;2 2越大,越大,P P值越小,说明两者之差越大,样本值越小,说明两者之差越大,样本分布与假设理论分布越不一致。分布与假设理论分布越不一致。第二十八页,本课件共有95页观测值与理论值的
14、差异由抽样误差引起,即观测观测值与理论值的差异由抽样误差引起,即观测值理论值。同时给出相就的备择假设值理论值。同时给出相就的备择假设H HA A :观测值与:观测值与理论值的差值不等于理论值的差值不等于0 0,即观测值,即观测值理论值理论值一般确定为一般确定为0.050.05或或0.010.011.1.提出无效假设提出无效假设H H0 0基本步骤2.2.确定显著水平确定显著水平第二十九页,本课件共有95页3.3.计算样本的计算样本的2 2值值4.4.进行统计推断进行统计推断2 2 P 2 2 2 2P P 2 2P P P 2 2 2 2第五十九页,本课件共有95页给药方式给药方式有效有效无效
15、无效总数总数有效率有效率口服口服注射注射585864644040313198(98(R R1 1)95(95(R R2 2)59.259.267.467.4总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)给药方式与给药效果的给药方式与给药效果的2222列联表列联表1.H1.H0 0 :给药方式与给药效果相互独立。:给药方式与给药效果相互独立。H HA A :给药方式与给药效果有关联。:给药方式与给药效果有关联。2.2.给出显著水平给出显著水平0.050.05第六十页,本课件共有95页3.3.根据根据H H0 0,运用概率乘法法则:事件,运用概率乘法法则:
16、事件A A与事件与事件B B同时同时出现的概率为:出现的概率为:P(AB)=P(A)P(B)P(AB)=P(A)P(B)口服与有效同时出现的理论频率口服频率口服与有效同时出现的理论频率口服频率有有效频率,即效频率,即P(AB)=P(A)P(B)P(AB)=P(A)P(B)98/193 122/19398/193 122/193理论频数理论频数EiEi理论频率理论频率总数总数(98/193 122/193)193(98/193 122/193)193(98 12298 122)/193=61.95/193=61.95即即E EijijR Ri iCCj j/T=/T=行总数行总数列总数列总数/总
17、数总数第六十一页,本课件共有95页E E1111=R=R1 1 C C1 1/T=61.95 E/T=61.95 E1212=R=R1 1 C C2 2/T=36.05/T=36.05E E2121=R=R2 2 C C1 1/T=60.05 E/T=60.05 E2222=R=R2 2 C C2 2/T=34.95/T=34.95给药方式给药方式有效有效无效无效总数总数口服口服注射注射58(58(61.9561.95)64(64(60.0560.05)40(40(36.0536.05)31(31(34.9534.95)98(98(R R1 1)95(95(R R2 2)总数总数122(122
18、(C C1 1)71(71(C C2 2)193(193(T T)给药方式与给药效果的给药方式与给药效果的2222列联表列联表第六十二页,本课件共有95页计算计算2 2值值:由于:由于df=(r-1)(c-1)=(2-1)(2-1)=1df=(r-1)(c-1)=(2-1)(2-1)=1,故所计算的,故所计算的2 2值需进行连续性矫正:值需进行连续性矫正:给药方式给药方式有效有效无效无效总数总数口服口服注射注射58(58(61.9561.95)64(64(60.0560.05)40(40(36.0536.05)31(31(34.9534.95)98(98(R R1 1)95(95(R R2 2
19、)总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)第六十三页,本课件共有95页4.4.查查2 2表,当表,当df=1df=1时,时,2 20.050.05 3.8413.841,而,而2 2c c =0.863=0.863 2 20.050.05 ,P P0.050.05,应接受,应接受H H0 0 ,拒绝,拒绝H HA A ,说明给药方式与给药效果相互独立,说明给药方式与给药效果相互独立.第六十四页,本课件共有95页2 22 2列联列联表的表的2 2检验可利用以下简式而不必计算检验可利用以下简式而不必计算理论次数:理论次数:T/2T/2为矫正数为矫正数
20、第六十五页,本课件共有95页给药方式给药方式有效有效无效无效总数总数口服口服注射注射585864644040313198(98(R R1 1)95(95(R R2 2)总数总数122(122(C C1 1)71(71(C C2 2)193(193(T T)第六十六页,本课件共有95页P86 例5.4 的SPSS处理第六十七页,本课件共有95页第六十八页,本课件共有95页第六十九页,本课件共有95页第七十页,本课件共有95页第七十一页,本课件共有95页(二)(二)2c2c列联表的独立性检验列联表的独立性检验 列列(j)(j)行行(i)(i)1 1 2 2 C C合计合计1 12 2O O1111
21、O O2121O O1212O O2222O O1c1cO O2c2cR R1 1R R2 2合计合计C C1 1C C2 2C Cc cT T2c2c列联表的一般形式列联表的一般形式由于由于df=(2-1)(c-1)2df=(2-1)(c-1)2,故计算值时不需作连续性矫正,故计算值时不需作连续性矫正第七十二页,本课件共有95页检测甲、乙、丙三种农药对烟蚜的毒杀效果,检测甲、乙、丙三种农药对烟蚜的毒杀效果,结果如下,使分析这三种农药对烟蚜的毒杀效结果如下,使分析这三种农药对烟蚜的毒杀效果是否一致?果是否一致?甲甲乙乙丙丙合计合计死亡数死亡数未死亡数未死亡数373715015049491001
22、0023235757109109307307合计合计1871871491498080416416三种农药毒杀烟蚜的死亡情况三种农药毒杀烟蚜的死亡情况例子例子第七十三页,本课件共有95页1.1.H H0 0 :对烟蚜毒杀效果与农药无关,农药类型间:对烟蚜毒杀效果与农药无关,农药类型间互相独立;互相独立;H HA A :二者有关:二者有关2.2.取显著水平取显著水平0.050.053.3.统计数的计算统计数的计算第七十四页,本课件共有95页第七十五页,本课件共有95页理论值的计算:理论值的计算:甲甲乙乙丙丙合计合计死亡数死亡数未死亡数未死亡数3737(49.00)(49.00)150150(138
23、.00)(138.00)4949(39.04)(39.04)100100(109.96)(109.96)2323(20.96)(20.96)5757(59.04)(59.04)109109307307合计合计18718714914980804164162 2值的计算:值的计算:第七十六页,本课件共有95页(4 4)查)查2 2值表,进行推断值表,进行推断查查2 2表,当表,当df=(2-1)(3-1)=2df=(2-1)(3-1)=2时,时,2 20.05 0.05 5.995.99,现实得,现实得2 27.6947.6942 20.05 0.05,则拒绝,则拒绝H H0 0 ,接受,接受H
24、HA A ,说明三种农药对烟蚜的毒杀效果不一,说明三种农药对烟蚜的毒杀效果不一致。致。第七十七页,本课件共有95页简便计算公式简便计算公式甲甲乙乙丙丙合计合计死亡数死亡数未死亡数未死亡数3737(49.00)(49.00)150150(138.00)(138.00)4949(39.04)(39.04)100100(109.96)(109.96)2323(20.96)(20.96)5757(59.04)(59.04)109109307307合计合计1871871491498080416416第七十八页,本课件共有95页第七十九页,本课件共有95页课堂练习课堂练习P87 例例5.5如何在如何在SP
25、SS中录入数据?中录入数据?运算方法同运算方法同2X2第八十页,本课件共有95页(三)(三)rcrc列联表的独立性检验列联表的独立性检验 列列(j)(j)行行(i)(i)1 12 2C C合计合计1 12 2r rO O1111O O2121O Or1r1O O1212O O2222O Or2r2O O1c1cO O2c2cO OrcrcR R1 1R R2 2R Rc c合计合计C C1 1C C2 2C Cc cT T rc列联表是指列联表是指r3、c 3的计数资料,上表是的计数资料,上表是rc列联表的一般形式。列联表的一般形式。df=(r-1)(c-1)1,故不需进行连,故不需进行连续性
26、矫正。续性矫正。第八十一页,本课件共有95页rcrc列联表的计算公式:列联表的计算公式:i=1,2,r j=1,2,c第八十二页,本课件共有95页例例某医院用碘及治疗地方性甲状腺肿,不某医院用碘及治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年同年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异?龄的治疗效果有无差异?年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效合计合计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949合计合计10910943435353141
27、4219219不同年龄用碘剂治疗甲状腺肿效果比较不同年龄用碘剂治疗甲状腺肿效果比较第八十三页,本课件共有95页1.H0:治疗效果与年龄无关;:治疗效果与年龄无关;HA:治疗效果与年龄:治疗效果与年龄有关,即不同年龄治疗效果不同;有关,即不同年龄治疗效果不同;2.给出显著水平给出显著水平0.010.01第八十四页,本课件共有95页3.3.计算统计数计算统计数2:年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效 合计合计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949合计合计1091
28、09434353531414219219第八十五页,本课件共有95页4.查查2表,当表,当df=(3-1)(4-1)6时,时,20.0116.81,所以,所以246.98820.01,P0.01,应拒绝应拒绝H0,接受,接受HA,说明治疗效果与年龄有,说明治疗效果与年龄有关。关。第八十六页,本课件共有95页 在治疗效果与年龄有关的基础上,可以将下面的在治疗效果与年龄有关的基础上,可以将下面的34列联表做成列联表做成3个24列联表,测验列联表,测验2个年龄段疗效的差个年龄段疗效的差异:异:11113030岁岁与与31315050岁岁两个年龄段疗效的比较两个年龄段疗效的比较11113030岁岁与与
29、5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较31315050岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较第八十七页,本课件共有95页(1)(1)11113030岁岁与与31315050岁岁两个年龄段疗效的比较两个年龄段疗效的比较年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效合计合计1111303031315050676732329 92323101020205 54 491917979合计合计9999323230309 9170170第八十八页,本课件共有95页(2)(2)11113030岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗
30、效的比较年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效合计合计111130305050以上以上676710109 91111101023235 55 591914949合计合计7777202033331010140140第八十九页,本课件共有95页(3)(3)31315050岁岁与与5050岁岁以上两个年龄段疗效的比较以上两个年龄段疗效的比较年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效合计合计313150505050以上以上3232101023231111202023234 45 579794949合计合计4242343443439 9128128第九十页,本课件共有95页111
31、13030岁岁与与31315050岁岁两个年龄段疗效的比较两个年龄段疗效的比较 2 2 21.20221.202(极显著极显著)11113030岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较2 2 38.3738.37(极显著极显著)31315050岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较2 2 9.5749.574(显著显著)df=(2-1)(4-1)=3 df=(2-1)(4-1)=3 2 20.050.05=7.81 =7.81 2 20.010.01=11.34=11.34 第九十一页,本课件共有95页课堂练习课堂练习P88 例例5.6如何在如何在SPSS中录入数据?中录入数据?运算方法同运算方法同2X2第九十二页,本课件共有95页小结小结适合性检验适合性检验2检验检验独立性检验独立性检验22列联表列联表2c列联表列联表rc列联表列联表第九十三页,本课件共有95页22列联表列联表2c列联表列联表rc列联表列联表第九十四页,本课件共有95页本章结束本章结束作业题:作业题:P89 5.3 至至5.7题共题共5题题第九十五页,本课件共有95页
限制150内