第7章 卡方检验PPT讲稿.ppt
《第7章 卡方检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第7章 卡方检验PPT讲稿.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第7章 卡方检验第1页,共48页,编辑于2022年,星期一第一节第一节 率的抽样误差与区间估计率的抽样误差与区间估计 第2页,共48页,编辑于2022年,星期一一、率的标准误一、率的标准误(standad error of proportion)与前面讨论过的样本均数与总体均与前面讨论过的样本均数与总体均数存在着抽样误差一样,样本率与总数存在着抽样误差一样,样本率与总体率同样存在着抽样误差。体率同样存在着抽样误差。表示率的抽样误差大小用表示率的抽样误差大小用率的标准误。率的标准误。第3页,共48页,编辑于2022年,星期一 率的标准误率的标准误 用用“p p”表示。表示。由于实际工作中,总体率
2、由于实际工作中,总体率往往未知,往往未知,常常用样本率常常用样本率P P来近似代替总体率来近似代替总体率,则:,则:为总体率;为总体率;为总体率;为总体率;n n n n为样本含量为样本含量为样本含量为样本含量SpSpSpSp为样本率的标准误;为样本率的标准误;为样本率的标准误;为样本率的标准误;P P P P 为样本率;为样本率;为样本率;为样本率;n n n n 为样本含量为样本含量为样本含量为样本含量第4页,共48页,编辑于2022年,星期一例如:例如:抽取居民抽取居民300300人的粪便,检出蛔虫人的粪便,检出蛔虫阳性阳性6060人,求其抽样误差的大小。人,求其抽样误差的大小。=0.0
3、231=2.31%=0.0231=2.31%第5页,共48页,编辑于2022年,星期一率的标准误的应用率的标准误的应用n n 表示样本率的抽样误差大小。表示样本率的抽样误差大小。n n 估计总体率的可信区间。估计总体率的可信区间。n n 进行率的差别的假设检验进行率的差别的假设检验。第6页,共48页,编辑于2022年,星期一二、总体率的置信区间估计二、总体率的置信区间估计n n正态近似法正态近似法 当当n 足够大,且足够大,且np和和n(1p)均大于均大于5时时,P 的分布接近正态分布,可用:的分布接近正态分布,可用:(Pu Sp,Pu Sp)u为概率为为概率为的的u界限值界限值u u0.05
4、0.051.961.96u u0.010.012.582.58第7页,共48页,编辑于2022年,星期一n n 查表法查表法 当当n 较小时(较小时(n 50),需查附需查附表(百分率的可信区间表),得到总表(百分率的可信区间表),得到总体率的可信区间。体率的可信区间。第8页,共48页,编辑于2022年,星期一第二节第二节 率的率的u u检验检验一、样本率与总体率的比较一、样本率与总体率的比较 P324/P324/例例10-710-7 u第9页,共48页,编辑于2022年,星期一 二、两个样本率的比较二、两个样本率的比较 设设:两两样样本本率率分分别别为为p p1 1和和p p2 2,当当n
5、n1 1与与n n2 2均均较较大大,且且p p1 1、1-1-p p1 1及及p p2 2、1-1-p p2 2均均 不不 太太 小小,如如n n1 1p p1 1、n n1 1(1-(1-p p1 1)及及n n2 2p p2 2、n n2 2(1-(1-p p2 2)均均大大于于5 5时时,可可采采用用正态近似法对两总体率作统计推断。正态近似法对两总体率作统计推断。P325/P325/例例10-810-8u第10页,共48页,编辑于2022年,星期一u两个率之差的合并标准误两个率之差的合并标准误两个率之差的合并标准误两个率之差的合并标准误S Sp1p1p1p1p2p2p2p2合并发生率合
6、并发生率合并发生率合并发生率P P P PC C C C 第11页,共48页,编辑于2022年,星期一 X X X X 2 2 2 2检验是现代统计学的创始人之一,英国人检验是现代统计学的创始人之一,英国人检验是现代统计学的创始人之一,英国人检验是现代统计学的创始人之一,英国人K.K.K.K.PearsonPearsonPearsonPearson(1857-19361857-19361857-19361857-1936)于)于)于)于1900190019001900年提出的一种具有广泛年提出的一种具有广泛年提出的一种具有广泛年提出的一种具有广泛用途的统计方法。可用于两个或多个率或构成比间的用
7、途的统计方法。可用于两个或多个率或构成比间的用途的统计方法。可用于两个或多个率或构成比间的用途的统计方法。可用于两个或多个率或构成比间的比较、配对计数资料及两种属性或特征之间是否有关比较、配对计数资料及两种属性或特征之间是否有关比较、配对计数资料及两种属性或特征之间是否有关比较、配对计数资料及两种属性或特征之间是否有关系等等。系等等。系等等。系等等。第三节第三节 卡方检验卡方检验 (chi-square test)第12页,共48页,编辑于2022年,星期一卡方检验卡方检验n n 四格表资料的卡方检验四格表资料的卡方检验n n 配对资料的卡方检验配对资料的卡方检验n n 行行列表卡方检验列表卡
8、方检验第13页,共48页,编辑于2022年,星期一一、四格表资料的一、四格表资料的X X2 2检验检验 适用于适用于两个样本率的比较两个样本率的比较两个样本率的比较两个样本率的比较 两个样本率的比较既可以选用两个样本率的比较既可以选用两个样本率的比较既可以选用两个样本率的比较既可以选用u u 检验,也可用检验,也可用检验,也可用检验,也可用四格表的四格表的四格表的四格表的X X X X2 2 2 2检验。检验。检验。检验。基本公式法基本公式法基本公式法基本公式法 专用公式法专用公式法专用公式法专用公式法 连续性校正公式连续性校正公式连续性校正公式连续性校正公式 确切概率法(直接概率法)确切概率
9、法(直接概率法)确切概率法(直接概率法)确切概率法(直接概率法)第14页,共48页,编辑于2022年,星期一第15页,共48页,编辑于2022年,星期一2 2分布分布(chi-square distribution)7.813.8412.59P P0.050.05的临界值的临界值第16页,共48页,编辑于2022年,星期一 例:用某种中草药预防流感,得资料如下:例:用某种中草药预防流感,得资料如下:用药组和对照组流感发病情况用药组和对照组流感发病情况 组别组别 观察人数观察人数 发病人数发病人数 发病率(发病率(%)用药组用药组 100 14 14 对照组对照组 120 30 25 (一)基本
10、公式法(一)基本公式法第17页,共48页,编辑于2022年,星期一列卡方计算表列卡方计算表 用药组和对照组流感发病率比较用药组和对照组流感发病率比较 组别组别组别组别 发病人数发病人数发病人数发病人数 未发病人数未发病人数未发病人数未发病人数 合计合计合计合计 发病率发病率发病率发病率(%)用药组用药组用药组用药组 1414(2020)8686(8080)100 14 100 14对照组对照组对照组对照组 3030(2424)9090(9696)120 25 120 25 合合合合 计计计计 44 176 220 44 176 220 第18页,共48页,编辑于2022年,星期一表中:表中:表
11、中:表中:14 8614 8614 8614 86 30 90 30 90 30 90 30 90 是整个表的基本数字。是整个表的基本数字。是整个表的基本数字。是整个表的基本数字。19 19 19 19世纪末世纪末世纪末世纪末Pearson Pearson Pearson Pearson 提出卡方检验统计量提出卡方检验统计量提出卡方检验统计量提出卡方检验统计量X X X X2 2 2 2值值值值的基本公式(也称为的基本公式(也称为的基本公式(也称为的基本公式(也称为Pearson Pearson Pearson Pearson X X X X2 2 2 2值)值)值)值)A A A A为实际数
12、为实际数为实际数为实际数 T T T T为理论数为理论数为理论数为理论数 X X X X2 2 2 2值是一个反映假设的理论数值是一个反映假设的理论数值是一个反映假设的理论数值是一个反映假设的理论数(T T T T)和观察和观察和观察和观察的实际数的实际数的实际数的实际数(A A A A)符合程度的指标。符合程度的指标。符合程度的指标。符合程度的指标。第19页,共48页,编辑于2022年,星期一卡方检验的基本原理卡方检验的基本原理 若若检检验验假假设设H H0 0:1 1=2 2成成立立,四四个个格格子子的的实实际际频频数数A A 与与理理论论频频数数T T 相相差差不不应应该该很很大大,即即
13、统统计量计量 X X2 2 不应该很大。不应该很大。如如果果A A和和T T差差距距大大,X X2 2值值就就会会很很大大,即即相相对对应应的的P P 值值很很小小,若若 ,则则反反过过来来推推断断A A与与T T差差距距,超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑 H H0 0 的的正正确确性性,继继而而拒拒绝绝 H H0 0,接接受受其其对对立假设立假设H H1 1,即即1 12 2。第20页,共48页,编辑于2022年,星期一 在一定条件下,在一定条件下,在一定条件下,在一定条件下,X X X X2 2 2 2值分布是有规律的,值分布是有规律的,值分布是有规律的,
14、值分布是有规律的,X X X X2 2 2 2值的变化是值的变化是值的变化是值的变化是随着自由度的变化而变化。随着自由度的变化而变化。随着自由度的变化而变化。随着自由度的变化而变化。=(行数(行数(行数(行数1 1)(列数)(列数)(列数)(列数1 1)第21页,共48页,编辑于2022年,星期一四格表卡方检验基本步骤四格表卡方检验基本步骤n n 建立检验假设:建立检验假设:H H0 0 ,H H1 1n n 确定显著性水准:确定显著性水准:=0.05=0.05n n 计算各格子的理论数计算各格子的理论数 T Tn n 计算统计量计算统计量(X X2 2 值值)n n 确定概率确定概率 P P
15、n n 统计推断结论统计推断结论第22页,共48页,编辑于2022年,星期一式中:式中:式中:式中:T T T TRCRCRCRCR R R R行行行行C C C C列格子的理论数列格子的理论数列格子的理论数列格子的理论数n n n nR R R R和和和和n n n nC C C C表示第表示第表示第表示第R R R R行的合计数和行的合计数和行的合计数和行的合计数和C C C C列的合计数列的合计数列的合计数列的合计数n n n n 为总例数为总例数为总例数为总例数第23页,共48页,编辑于2022年,星期一 判断标准:判断标准:n n X X X X2 2 2 2 X X X X2 2
16、2 20.05(v)0.05(v)0.05(v)0.05(v),P P P P0.050.050.050.05n n X X X X2 2 2 20.01(v)0.01(v)0.01(v)0.01(v)X X X X2 2 2 2 X X X X2 2 2 20.05(v)0.05(v)0.05(v)0.05(v),0.010.010.010.01 P P P P0.050.050.050.05n n X X X X2 2 2 2 X X X X2 2 2 20.01(v)0.01(v)0.01(v)0.01(v),P P P P0.010.010.010.01第24页,共48页,编辑于202
17、2年,星期一基本公式法:基本公式法:式中,式中,A A为实际频数(为实际频数(actual frequencyactual frequency)T T为理论频数(为理论频数(theoretical frequencytheoretical frequency)第25页,共48页,编辑于2022年,星期一 用药组和对照组流感发病率比较用药组和对照组流感发病率比较 组别组别组别组别 发病人数发病人数发病人数发病人数 未发病人数未发病人数未发病人数未发病人数 合计合计合计合计 发病率发病率发病率发病率(%)用药组用药组用药组用药组 1414(2020)8686(8080)100 14 100 14对
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第7章 卡方检验PPT讲稿 检验 PPT 讲稿
限制150内