欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    生物统计学—卡方检验学习教案.pptx

    • 资源ID:17795065       资源大小:276.39KB        全文页数:31页
    • 资源格式: PPTX        下载积分:9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物统计学—卡方检验学习教案.pptx

    会计学1生物生物(shngw)统计学统计学卡方检验卡方检验第一页,共31页。将将2(n 1)称为称为(chn wi)自由度为自由度为(n-1)的卡方分布的卡方分布 主要适用于对拟合优度检验和独立性检主要适用于对拟合优度检验和独立性检验,以及对总体方差的估计和检验等验,以及对总体方差的估计和检验等第1页/共31页第二页,共31页。 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2 = (n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布总体总体卡方 (c2) 分布(fnb)第2页/共31页第三页,共31页。卡方 (c2) 分布(fnb)的特点不同不同(b tn)容量样本的抽样分布容量样本的抽样分布1 1、 2分布是一个以自由度分布是一个以自由度n为参数为参数的的分布族分布族,自由度,自由度n决定了分布决定了分布的形状,对于不同的的形状,对于不同的n有不同的有不同的卡方分布卡方分布2 2、卡方分布于区间、卡方分布于区间0, )0, ),是一种,是一种非对称分布。一般为非对称分布。一般为正偏分布正偏分布3 3、卡方分布、卡方分布(fnb)(fnb)的偏斜度随自由度降低而增大,当自由度的偏斜度随自由度降低而增大,当自由度为为1 1时,曲线以纵轴为渐近线;当自由度增大的时,分布时,曲线以纵轴为渐近线;当自由度增大的时,分布(fnb)(fnb)曲线渐趋近左右对称,当自由度大于等于曲线渐趋近左右对称,当自由度大于等于3030的时的时候,卡方分布候,卡方分布(fnb)(fnb)接近正态分布接近正态分布(fnb)(fnb)4、卡方分布具有卡方分布具有“可加性可加性” X、Y 独立,独立, X 2(n1) ,Y 2(n2) 则则 X + Y 2(n1+ n2) 第3页/共31页第四页,共31页。卡方 (c2) 分布(fnb)的函数CHIDIST:自由度为:自由度为n的卡方分布的卡方分布(fnb)在在x点处的单尾概率点处的单尾概率CHIINV: 返回自由度为返回自由度为n的卡方分布的卡方分布(fnb)的单尾概率函数的逆的单尾概率函数的逆函数函数xP2CHIDISTX 需要计算分布的数字需要计算分布的数字 (X0)Degrees_freedom 自由度自由度 CHIINV Probability 卡方卡方分布的分布的单尾单尾概率概率Degrees_freedom 自由度自由度 第4页/共31页第五页,共31页。卡方检验卡方检验(jinyn)基础基础第5页/共31页第六页,共31页。22()AEE由英国由英国(yn u)统计学家统计学家Karl Pearson首次首次提出,故被称为提出,故被称为Pearson 2 。卡方检验卡方检验(jinyn)基础基础第6页/共31页第七页,共31页。 检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等 检验某个分类变量各类的出现概率是否等于指定概率检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关(yugun) 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关(yugun) 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致结果是否一致卡方检验基础卡方检验基础(jch)用途用途第7页/共31页第八页,共31页。卡方检验卡方检验(jinyn)的用途的用途一个样本方差和一个样本方差和总体方差是否总体方差是否(sh (sh fu)fu)相同相同同质性检验同质性检验(jinyn)适合性检验适合性检验独立性检验独立性检验观察值和理论观察值和理论值是否符合值是否符合两个或两个以上两个或两个以上因素之间是否相因素之间是否相关关计数计数资料资料和和属性属性资料资料第8页/共31页第九页,共31页。其其2服从服从(fcng)自由度为自由度为(k-1)的卡方的卡方分布分布22221xx当用样本平均数估计总体平均数时,有:当用样本平均数估计总体平均数时,有:2221xx将样本方差代入,则:将样本方差代入,则:222) 1(sk 第9页/共31页第十页,共31页。卡方函数卡方函数(hnsh)的使用的使用假设假设(jish)(jish)假设假设(jish)(jish)222020,:,其否定区为:适用右尾检验H2122020,:,其否定区为:适用左尾检验H假设假设22222122020,:和其否定区为:,适用双尾检验H第10页/共31页第十一页,共31页。例:已知某农田受到重金属污染,经抽样测定例:已知某农田受到重金属污染,经抽样测定(cdng)(cdng)铅浓度铅浓度分别为分别为: :4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为方差为0.150, 0.150, 试检验受试检验受到污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差到污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差(0.0650.065)相同)相同分析:分析:1 1)一个样本方差同质性检验)一个样本方差同质性检验 2 2)事先不知道受污染)事先不知道受污染(wrn)(wrn)的农田与正常农田的铅浓度的农田与正常农田的铅浓度 方差的大小,故双尾检验方差的大小,故双尾检验 (2 2)选取显著水平)选取显著水平05. 0解:(解:(1 1)假设)假设 即受到污染的农田铅浓度的方差即受到污染的农田铅浓度的方差(fn (fn ch)ch)与正常农田铅浓度的方差与正常农田铅浓度的方差(fn ch)(fn ch)相同,对相同,对065. 0:20H065. 0:2AH (3 3)检验计算)检验计算15.16065. 0150. 018) 1(222sk (4 4)推断:)推断:当当df8-18-17 7,由,由CHIINV(0.025,7)16.01,即,即 2025. 02 否定否定H H0 0,接受,接受H HA A,即样本方差与总体方差试不,即样本方差与总体方差试不同质的,认为受到污染的农田铅浓度的方差与正常农田的方差同质的,认为受到污染的农田铅浓度的方差与正常农田的方差有显著差异有显著差异第11页/共31页第十二页,共31页。卡方检验的原理卡方检验的原理(yunl)和方法和方法Pearson定理定理(dngl):当(:当(P1,P2,,Pk)是总体的真实)是总体的真实概率分布时,统计量概率分布时,统计量 kiiiinpnpn122随着随着n的增加渐近于自由度的增加渐近于自由度df=k-1的卡方分布。其中的卡方分布。其中P1,P2,,Pk为为k种不同属性出现的频率,种不同属性出现的频率,n为样为样本容量,本容量,ni为样本中第为样本中第i种属性出现的次数,是观种属性出现的次数,是观测测(gunc)值,记为值,记为Oi,pi为第为第i种属性出现的概率种属性出现的概率,npi则可以看成理论上该样本第则可以看成理论上该样本第i种属性出现的次种属性出现的次数,理论值记为:数,理论值记为:Ei,即,即) 1( ,122kdfEEOkiiii第12页/共31页第十三页,共31页。卡方检验卡方检验(jinyn)的原理和方法的原理和方法Pearson定理的基本含义:定理的基本含义: 如果样本确实是抽自由(如果样本确实是抽自由(P1,P2,,Pk)代)代表的总体,表的总体,Oi和和Ei之间的差异就只是随机误差,之间的差异就只是随机误差,则则Pearson统计量可视为服从卡方分布统计量可视为服从卡方分布 反之,如果样本不是反之,如果样本不是(b shi)抽自由(抽自由(P1,P2,,Pk)代表的总体,)代表的总体,Oi和和Ei之间的差异就不只之间的差异就不只是是随机误差,从而使计算出的统计量有偏大的是是随机误差,从而使计算出的统计量有偏大的趋势趋势 因此,对因此,对Pearson统计量进行单尾检验(即右统计量进行单尾检验(即右尾检验)可用于判断离散型资料的观测值与理论尾检验)可用于判断离散型资料的观测值与理论值是不是值是不是(b shi)吻合吻合第13页/共31页第十四页,共31页。卡方检验卡方检验(jinyn)的原理和方法的原理和方法统计统计(tngj)假设:假设: H0:观测值与理论值的差异是由随机误差引起:观测值与理论值的差异是由随机误差引起 HA:观测值与理论值之间有真实差异:观测值与理论值之间有真实差异 所以卡方值是度量实际观测值与理论值偏南程所以卡方值是度量实际观测值与理论值偏南程度的一个统计度的一个统计(tngj)量量 卡方值越小,表明观测值与理论值越接近卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大卡方值越大,表明观测值与理论值相差越大 卡方值为卡方值为0,表明,表明H0严格成立,且它不会有下侧严格成立,且它不会有下侧否定区,只能进行右尾检验否定区,只能进行右尾检验第14页/共31页第十五页,共31页。卡方检验的原理卡方检验的原理(yunl)和方法和方法 由于离散型资料的卡方检验只是近似地服从连续型由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离散型资料进行卡方检验变量的卡方分布,所以在对离散型资料进行卡方检验计算的时,结果常常偏低,特别是当自由度计算的时,结果常常偏低,特别是当自由度df=1df=1时,时,有较大偏差,为此需要进行矫正:有较大偏差,为此需要进行矫正: 当自由度当自由度df1df1时,与连续型随机变量卡方分相近似时,与连续型随机变量卡方分相近似,这时可以不做连续性矫正,这时可以不做连续性矫正 注意:要求各个组内的理论次数不小于注意:要求各个组内的理论次数不小于5 5,如某组理,如某组理论次数小于论次数小于5 5,则应把它与其相邻的一组或几组合并,则应把它与其相邻的一组或几组合并,知道,知道(zh do)(zh do)理论次数大于理论次数大于5 5为止为止kiiiicEEO1225 . 0第15页/共31页第十六页,共31页。适合适合(shh)性检验性检验 适合性检验(吻合性检验或拟合优度检验)适合性检验(吻合性检验或拟合优度检验)步骤:步骤: 1. 1. 提出无效假设,即认为观测提出无效假设,即认为观测(gunc)(gunc)值和理论值之间值和理论值之间没有差异没有差异 2. 2. 规定显著性水平规定显著性水平 3. 3. 计算样本卡方值计算样本卡方值 4. 4. 根据规定的显著水平和自由度计算出卡方值,再和实根据规定的显著水平和自由度计算出卡方值,再和实际计算的卡方值进行比较际计算的卡方值进行比较第16页/共31页第十七页,共31页。例:有一鲤鱼遗传试验,以荷包鲤鱼(红色,隐性)与湘江野鲤(青例:有一鲤鱼遗传试验,以荷包鲤鱼(红色,隐性)与湘江野鲤(青灰色,显性)杂交,其灰色,显性)杂交,其F2F2获得下表的所列的体色分离尾数,问这一资获得下表的所列的体色分离尾数,问这一资料的实际观测值是否符合孟德尔一对等位基因的遗传规律料的实际观测值是否符合孟德尔一对等位基因的遗传规律(gul)(gul)? 鲤鱼遗传试验鲤鱼遗传试验F2F2观测结果观测结果分析:分析:1 1)适合性检验问题)适合性检验问题 2 2) 自由度为自由度为(2-1)=1(2-1)=1,需要,需要(xyo)(xyo)连续性矫正连续性矫正 (2 2)选取显著水平)选取显著水平05. 0解:(解:(1 1)假设)假设(jish) (jish) 鲤鱼体色鲤鱼体色F2F2性状分离符合性状分离符合3:1 3:1 对对 鲤鱼体色鲤鱼体色F2F2性状分离不符合性状分离不符合3:1 3:1 :0H:AH体色体色青灰色青灰色红色红色总数总数F2F2观测观测尾数尾数15031503999916021602第17页/共31页第十八页,共31页。(3 3)检验)检验(jinyn)(jinyn)计算:计算: 计算鲤鱼体色的理论值计算鲤鱼体色的理论值63.3015 . 0122kiiiicEEO体色体色青灰色青灰色红色红色总数总数F2F2理论理论尾数尾数1201.51201.5400.5400.516021602(4 4)推断:由)推断:由CHIDIST(301.63, 1)=1.45E-67,CHIDIST(301.63, 1)=1.45E-67,即即 故应否定故应否定H0H0,接受,接受(jishu)HA(jishu)HA,认为鲤鱼体色,认为鲤鱼体色F2F2性状比不符合性状比不符合3:13:1比率比率 01. 063.3012P(4 4)推断:由)推断:由CHIINV(0.025, 1)=5.02, CHIINV(0.025, 1)=5.02, 即即 故应否定故应否定H0H0,接受,接受HAHA,认为,认为(rnwi)(rnwi)鲤鱼体色鲤鱼体色F2F2性状比不符合性状比不符合3:13:1比率比率 05. 0,2)1 (05. 02Pc即第18页/共31页第十九页,共31页。独立性检验独立性检验(jinyn)步骤:步骤: 1. 1. 提出无效假设,即认为所观测的各属性之间没提出无效假设,即认为所观测的各属性之间没有关联有关联 2. 2. 规定显著性水平规定显著性水平 3. 3. 根据无效假设计算出理论数根据无效假设计算出理论数 4. 4. 根据规定的显著水平和自由度计算出卡方值,根据规定的显著水平和自由度计算出卡方值,再和计算的卡方值进行比较。再和计算的卡方值进行比较。 如果接受假设,则说明因子如果接受假设,则说明因子(ynz)(ynz)之间无相关联之间无相关联,是相互独立的,是相互独立的 如果拒绝假设,则说明因子如果拒绝假设,则说明因子(ynz)(ynz)之间的关联是之间的关联是显著的,不独立显著的,不独立第19页/共31页第二十页,共31页。一、一、2X2列联表的独立性检验列联表的独立性检验(jinyn)设设A A、B B是一个随机试验中的两个事件,其中是一个随机试验中的两个事件,其中A A可能出现可能出现r1r1、r2r2个结果,个结果,B B可能出现可能出现c1c1、c2c2个结果,两因子相互作用形个结果,两因子相互作用形成成4 4个数,分别个数,分别(fnbi)(fnbi)以以O11O11、O12O12、O21O21、O22O22表示,表示,即即 2X2 2X2列联表的一般形式列联表的一般形式c1c2总和r1r2O11O21O12O22R1O11O12R2O21O22总和C1O11O21C2O12O22T第20页/共31页第二十一页,共31页。一、一、2X2列联表的独立性检验列联表的独立性检验(jinyn)2X22X2列联表的卡方检验列联表的卡方检验(jinyn)(jinyn)步骤:步骤:1 1、提出无效假设、提出无效假设H0H0:事件:事件A A和和B B无关,即事件无关,即事件A A和和B B相互相互独立,同时给出独立,同时给出HAHA:事件:事件A A和和B B有关联关系有关联关系2 2、给出显著水平、给出显著水平3 3、依据、依据(yj)H0(yj)H0,可以推算出理论值,计算卡方值,可以推算出理论值,计算卡方值4 4、进行推断、进行推断第21页/共31页第二十二页,共31页。例:现随机抽样对吸烟人群和不吸烟人群是否患有气管炎病进例:现随机抽样对吸烟人群和不吸烟人群是否患有气管炎病进行了调查,其调查结果如下行了调查,其调查结果如下(rxi)(rxi)表,试检验吸烟与患气管炎表,试检验吸烟与患气管炎病有无关联?病有无关联? 不同人群患气管炎病调查不同人群患气管炎病调查分析:分析:1 1)独立性检验问题)独立性检验问题 2 2) 自由度为自由度为df=(2-1)df=(2-1)* *(2-1)=1(2-1)=1,需要,需要(xyo)(xyo)连续性矫正连续性矫正 (2 2)选取显著水平)选取显著水平05. 0解:解:(1 1)假设)假设 吸烟与患气管炎无关吸烟与患气管炎无关 对对 吸烟与患气管炎有关联吸烟与患气管炎有关联 :0H:AH不同人群患病不患病总和Ri吸烟人群50250300不吸烟人群5195200总和Cj55445T500第22页/共31页第二十三页,共31页。(3 3)检验计算:)检验计算: 计算联表中的各项的理论计算联表中的各项的理论(lln)(lln)次数次数174.235 . 0122kiiiicEEO不同人群患病不患病总和Ri吸烟人群3333267267300不吸烟人群2222178178200总和Cj55445T500(4 4)推断:)推断:由由CHIDIST(23.174, 1)=1.48E-6,CHIDIST(23.174, 1)=1.48E-6,即即 故应否定故应否定H0,接受,接受HA,认为吸烟与患气管病,认为吸烟与患气管病极显著极显著相关相关 01. 0174.232P(4 4)推断:)推断:由由CHIINV(0.025, 1)=6.63, CHIINV(0.025, 1)=6.63, 即即 故应否定故应否定H0,接受,接受HA,认为吸烟与患气管炎病密切相关,认为吸烟与患气管炎病密切相关 05. 0,2)1 (05. 02Pc即第23页/共31页第二十四页,共31页。二、二、rXc列联表的独立性检验列联表的独立性检验(jinyn)rXc列联表是指列联表是指r2, c2的计数资料,一般形式的计数资料,一般形式(xngsh)如下如下 rXc列联表的一般形式列联表的一般形式(xngsh)12c总和12rO11O21Or1O12O22Or2O1cO2cOrcR1R2总和C1C2CcT第24页/共31页第二十五页,共31页。二、二、rXc列联表的独立性检验列联表的独立性检验(jinyn) rXc列联表中各项理论列联表中各项理论(lln)频率的计算方法如频率的计算方法如2X2列联表,即:列联表,即:Eij=(RiCj/T),由于自由度,由于自由度df(r-1)( c-1),由于由于r2, c2,故自由度,故自由度df1,因而不需要进因而不需要进行连续性矫正,其计算公式如下:行连续性矫正,其计算公式如下: 122jiijCROT第25页/共31页第二十六页,共31页。例:某医院例:某医院(yyun)(yyun)用碘剂治疗地方性甲状腺肿,不同年龄的治疗用碘剂治疗地方性甲状腺肿,不同年龄的治疗效果如下表,试检验不同年龄的治疗效果有无差异?效果如下表,试检验不同年龄的治疗效果有无差异? 不同年龄用碘剂治疗甲状腺肿效果比较不同年龄用碘剂治疗甲状腺肿效果比较分析:分析:1 1)独立性检验)独立性检验(jinyn)(jinyn)问题问题 2 2) 自由度为自由度为df=(4-1)df=(4-1)* *(3-1)=6(3-1)=6,不需要连续性矫正,不需要连续性矫正 (2 2)选取显著水平)选取显著水平05. 0解:解:(1 1)假设)假设 治疗效果与年龄无关治疗效果与年龄无关 对对 治疗效果与年龄有关治疗效果与年龄有关 :0H:AH年龄年龄治愈治愈显效显效好转好转无效无效总和总和1111303067910591313150503223204795050岁以上岁以上101123549总和总和109435314219第26页/共31页第二十七页,共31页。(3 3)检验)检验(jinyn)(jinyn)计算:计算: 计算联表中的各项的理论次数计算联表中的各项的理论次数年龄年龄治愈治愈显效显效好转好转无效无效总和总和1111303045.2917.8720.025.82913131505039.3215.5119.125.05795050岁以上岁以上24.399.6211.863.1349总和总和109435314219988.46122jiijCROT(4 4)推断:)推断:由由CHIDIST(46.988, 6)=1.88E-8,CHIDIST(46.988, 6)=1.88E-8,即即 故应否定故应否定H0,接受,接受HA,认为治疗效果与年龄,认为治疗效果与年龄极显著极显著相关相关 01. 0174.232P第27页/共31页第二十八页,共31页。卡方 (c2) 检验(jinyn)的函数CHITEST:相关性检验函数,得到:相关性检验函数,得到(d do)相关性的概率值相关性的概率值CHITESTActual_range 观察值的数据区域观察值的数据区域 Expected_range 行列汇总的乘积与总计值之比率的行列汇总的乘积与总计值之比率的数据区域数据区域 第28页/共31页第二十九页,共31页。不同不同(b tn)(b tn)年龄用碘剂治疗甲状腺肿效果比较年龄用碘剂治疗甲状腺肿效果比较年龄年龄治愈治愈显效显效好转好转无效无效总和总和1111303067910591313150503223204795050岁以上岁以上101123549总和总和109435314219计算计算(j sun)(j sun)联表中的各项的理论次数联表中的各项的理论次数年龄年龄治愈治愈显效显效好转好转无效无效总和总和1111303045.2917.8720.025.82913131505039.3215.5119.125.05795050岁以上岁以上24.399.6211.863.1349总和总和109435314219Actual_rangeExpected_range CHITEST=3.81E-8=3.81E-8第29页/共31页第三十页,共31页。课 后 作 业书上书上8484页:页:习题习题(xt) 5.5(xt) 5.5 5.8 5.8第30页/共31页第三十一页,共31页。

    注意事项

    本文(生物统计学—卡方检验学习教案.pptx)为本站会员(知****量)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开