第九章 卡方检验ppt精选文档.ppt
《第九章 卡方检验ppt精选文档.ppt》由会员分享,可在线阅读,更多相关《第九章 卡方检验ppt精选文档.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章卡方检验ppt本讲稿第一页,共五十五页 目的目的:推断两个总体率或构成比之间有无差别推断两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别多个总体率或构成比之间有无差别 多个样本率比较的分割多个样本率比较的分割 两个分类变量之间有无关联性两个分类变量之间有无关联性 频数分布拟合优度的检验。频数分布拟合优度的检验。检验统计量检验统计量:应用应用:计数资料:计数资料本讲稿第二页,共五十五页 分布曲线 设 为标准正态总体 的一个随机样本,它们的平方和服从自由度为 的 分布,记作 本讲稿第三页,共五十五页 (1)分布是一种连续型分布:按分布的密度函数可给出自由度分布是一种连续型分布:
2、按分布的密度函数可给出自由度=1,2,3,的一簇分布曲线的一簇分布曲线(图(图6-10)。)。(2)分布的一个基本性质是可加性:分布的一个基本性质是可加性:如果两个独立的随机变量如果两个独立的随机变量X1和和X2分别服从自由度分别服从自由度1和和2的分布,即的分布,即 ,那么,那么它们的和(它们的和(X1+X2)服从自由度()服从自由度(1+2)的)的 分布,即分布,即 。本讲稿第四页,共五十五页本讲稿第五页,共五十五页附表8给出了自由度取不同值时,分布单侧尾部面积的界值,它满足条件根据的定义,当自由度时,分布的界值为标准正态分布界值的平方。本讲稿第六页,共五十五页第一节第一节 2 2表表 检
3、验检验本讲稿第七页,共五十五页目的:目的:推断两个总体率(构成比)是推断两个总体率(构成比)是 否有差别否有差别 (和(和u u检验等价)检验等价)要求:要求:两样本的两分类个体数排列成四两样本的两分类个体数排列成四 格表资料格表资料本讲稿第八页,共五十五页一一、两独立样本率检验两独立样本率检验(一)(一)两独立样本率资料的四格表形式 例例9-1 为为研研究究肿肿瘤瘤标标志志物物癌癌胚胚抗抗原原(CEA)对对肺肺癌癌的的诊诊断断价价值值,随随机机抽抽取取72例例确确诊诊为为肺肺癌癌的的患患者者为为肺肺癌癌组组,114例例接接受受健健康康体体检检的的非非肺肺癌癌患患者者为为对对照照组组。用用CE
4、A对对其其进进行行检检测测,结结果果呈呈阳阳性性反反应应者者病病例例组组中中33例例,对对照照组组中中10例例。问问两两组组人人群群的的CEA阳阳性性率率有有无无差差异?异?本讲稿第九页,共五十五页表表9-1 CEA对两组人群的诊断结果对两组人群的诊断结果*括号内为理论频数。本讲稿第十页,共五十五页 本例资料经整理成表本例资料经整理成表9-1形式,即有两形式,即有两个处理组,每个处理组的例数由发生数和个处理组,每个处理组的例数由发生数和未发生数两部分组成。表内有未发生数两部分组成。表内有33、39、10、104 四个基本数据,其余数据均由此四个四个基本数据,其余数据均由此四个数据推算出来的,故
5、称四格表资料。数据推算出来的,故称四格表资料。(二)(二)检验的基本思想检验的基本思想本讲稿第十一页,共五十五页 表表9-2 四格表资料的基本形式四格表资料的基本形式本讲稿第十二页,共五十五页基本思想:可通过基本思想:可通过 检验的基本公式来理检验的基本公式来理解。解。式中,式中,A为实际频数(为实际频数(actual frequency),),T为理论频数(为理论频数(theoretical frequency)。)。本讲稿第十三页,共五十五页 理论频数理论频数 是根据检验设是根据检验设 ,且,且用合并率用合并率 来估计而定的。来估计而定的。本讲稿第十四页,共五十五页本讲稿第十五页,共五十五
6、页理论频数由下式求得:理论频数由下式求得:式中,式中,TRC 为第为第R 行行C 列的理论频数列的理论频数 nR 为相应的行合计为相应的行合计 nC 为相应的列合计为相应的列合计本讲稿第十六页,共五十五页 检检验验统统计计量量 值值反反映映了了实实际际频频数数与与理理论频数的吻合程度。论频数的吻合程度。若若检检验验假假设设H0:1=2成成立立,四四个个格格子子的的实实际际频频数数A 与与理理论论频频数数T 相相差差不不应应该该很很大大,即即统统计计量量 不不应应该该很很大大。如如果果 值值很很大大,即即相相对对应应的的P 值值很很小小,若若 ,则则反反过过来来推推断断A与与T相相差差太太大大,
7、超超出出了了抽抽样样误误差差允允许许的的范范围围,从从而而怀怀疑疑H0的的正正确确性性,继继而而拒拒绝绝H0,接接受受其其对对立立假假设设H1,即,即12。本讲稿第十七页,共五十五页 由公式(由公式(9-1)还可以看出:)还可以看出:值的大小还取决于值的大小还取决于 个数的多少(严格地说是自由度个数的多少(严格地说是自由度的大小)。由于各的大小)。由于各 皆皆是是正正值值,故故自自由由度度愈愈大大,值值也也会会愈愈大大;所所以以只只有有考考虑虑了了自自由由度度的的影影响响,值值才才能能正正确确地地反反映映实实际际频频数数A和和理理论论频频数数T 的的吻吻合合程度。程度。检检验验的的自自由由度度
8、取取决决于于可可以以自自由由取取值值的的格格子子数数目目,而而不不是是样样本本含含量量n n。四四格格表表资资料料只只有有两两行行两两列列,=1=1,即即在在周周边边合合计计数数固固定定的的情情况况下下,4 4个个基基本本数数据据当当中中只只有有一一个个可可以以自自由由取值。取值。本讲稿第十八页,共五十五页(1)建立检验假设,确定检验水平。建立检验假设,确定检验水平。H0:1=2H1:12=0.05。(三)(三)假设检验假设检验本讲稿第十九页,共五十五页(2)求检验统计量值)求检验统计量值本讲稿第二十页,共五十五页本讲稿第二十一页,共五十五页四格表资料检验的专用公式四格表资料检验的专用公式本讲
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九章 卡方检验ppt精选文档 第九 检验 ppt 精选 文档
限制150内