第九章 卡方检验PPT讲稿.ppt
《第九章 卡方检验PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第九章 卡方检验PPT讲稿.ppt(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章卡方检验第1页,共54页,编辑于2022年,星期二 目的目的:推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率比较的分割多个样本率比较的分割 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。检验统计量检验统计量:应用应用:计数资料:计数资料第2页,共54页,编辑于2022年,星期二 (1)分布是一种连续型分布:按分布的密度函数可给出自由分布是一种连续型分布:按分布的密度函数可给出自由度度=1,2,3,的一簇分布曲线的一簇分布曲线(图(图6-1
2、0)。)。(2)分布的一个基本性质是可加性:分布的一个基本性质是可加性:如果两个独立的随机变量如果两个独立的随机变量X1和和X2分别服从自由度分别服从自由度1和和2的分布,即的分布,即 ,那么它们,那么它们的和(的和(X1+X2)服从自由度()服从自由度(1+2)的)的 分布,即分布,即 。第3页,共54页,编辑于2022年,星期二第4页,共54页,编辑于2022年,星期二附表8给出了自由度取不同值时,分布单侧尾部面积的界值,它满足条件根据的定义,当自由度时,分布的界值为标准正态分布界值的平方。第5页,共54页,编辑于2022年,星期二第一节第一节 2 2表表 检验检验第6页,共54页,编辑于
3、2022年,星期二目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料第7页,共54页,编辑于2022年,星期二一一、两独立样本率检验两独立样本率检验(一)(一)两独立样本率资料的四格表形式 例例9-1 为为研研究究肿肿瘤瘤标标志志物物癌癌胚胚抗抗原原(CEA)对对肺肺癌癌的的诊诊断断价价值值,随随机机抽抽取取72例例确确诊诊为为肺肺癌癌的的患患者者为为肺肺癌癌组组,114例例接接受受健健康康体体检检的的非非肺肺癌癌患患者者为为对对照照组组。用
4、用CEA对对其其进进行行检检测测,结结果果呈呈阳阳性性反反应应者者病病例例组组中中33例例,对对照照组组中中10例。问两组人群的例。问两组人群的CEA阳性率有无差异?阳性率有无差异?第8页,共54页,编辑于2022年,星期二表表9-1 CEA对两组人群的诊断结果对两组人群的诊断结果*括号内为理论频数。第9页,共54页,编辑于2022年,星期二 本例资料经整理成表本例资料经整理成表9-1形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有33、39、10、104 四个基本数据,其余数据均由此四个四个基
5、本数据,其余数据均由此四个数据推算出来的,故称四格表资料。数据推算出来的,故称四格表资料。(二)(二)检验的基本思想检验的基本思想第10页,共54页,编辑于2022年,星期二 表表9-2 四格表资料的基本形式四格表资料的基本形式第11页,共54页,编辑于2022年,星期二基本思想:可通过基本思想:可通过 检验的基本公式来检验的基本公式来理解。理解。式中,式中,A为实际频数(为实际频数(actual frequency),),T为理论频数(为理论频数(theoretical frequency)。)。第12页,共54页,编辑于2022年,星期二 理论频数理论频数 是根据检验设是根据检验设 ,且,
6、且用合并率用合并率 来估计而定的。来估计而定的。第13页,共54页,编辑于2022年,星期二第14页,共54页,编辑于2022年,星期二理论频数由下式求得:理论频数由下式求得:式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相应的行合计 nC 为相应的列合计为相应的列合计第15页,共54页,编辑于2022年,星期二 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论频数的吻合程度。论频数的吻合程度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频频数数T 相相差差不不应应该该很很大大,即即统统
7、计计量量 不不应应该该很很大大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑H0的的正正确确性性,继继而而拒拒绝绝H0,接接受受其其对对立立假设假设H1,即,即12。第16页,共54页,编辑于2022年,星期二 由公式(由公式(9-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以
8、以只只有有考考虑虑了了自自由由度度的的影响,影响,值才能正确地反映实际频数值才能正确地反映实际频数A和理论频数和理论频数T 的吻合程度。的吻合程度。检检验验的的自自由由度度取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资料料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。第17页,共54页,编辑于2022年,星期二(1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2H1:12=0.05。(三)
9、(三)假设检验假设检验第18页,共54页,编辑于2022年,星期二(2)求检验统计量值)求检验统计量值第19页,共54页,编辑于2022年,星期二第20页,共54页,编辑于2022年,星期二四格表资料检验的专用公式四格表资料检验的专用公式第21页,共54页,编辑于2022年,星期二(四四)四格表资料检验的校正公式四格表资料检验的校正公式 第22页,共54页,编辑于2022年,星期二 分分布布是是一一连连续续型型分分布布,而而四四格格表表资资料料属属离离散散型型分分布布,由由此此计计算算得得的的 统统计计量量的的抽抽样样分分布布亦亦呈呈离离散散性性质质。为为改改善善 统统计计量量分分布布的的连连
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 卡方检验PPT讲稿 第九 检验 PPT 讲稿
限制150内