生物统计学—卡方检验学习教案.pptx
《生物统计学—卡方检验学习教案.pptx》由会员分享,可在线阅读,更多相关《生物统计学—卡方检验学习教案.pptx(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1生物生物(shngw)统计学统计学卡方检验卡方检验第一页,共31页。将将2(n 1)称为称为(chn wi)自由度为自由度为(n-1)的卡方分布的卡方分布 主要适用于对拟合优度检验和独立性检主要适用于对拟合优度检验和独立性检验,以及对总体方差的估计和检验等验,以及对总体方差的估计和检验等第1页/共31页第二页,共31页。 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2 = (n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布总体总体卡方 (c2) 分布(fnb)第2页/共31页第三页,共
2、31页。卡方 (c2) 分布(fnb)的特点不同不同(b tn)容量样本的抽样分布容量样本的抽样分布1 1、 2分布是一个以自由度分布是一个以自由度n为参数为参数的的分布族分布族,自由度,自由度n决定了分布决定了分布的形状,对于不同的的形状,对于不同的n有不同的有不同的卡方分布卡方分布2 2、卡方分布于区间、卡方分布于区间0, )0, ),是一种,是一种非对称分布。一般为非对称分布。一般为正偏分布正偏分布3 3、卡方分布、卡方分布(fnb)(fnb)的偏斜度随自由度降低而增大,当自由度的偏斜度随自由度降低而增大,当自由度为为1 1时,曲线以纵轴为渐近线;当自由度增大的时,分布时,曲线以纵轴为渐
3、近线;当自由度增大的时,分布(fnb)(fnb)曲线渐趋近左右对称,当自由度大于等于曲线渐趋近左右对称,当自由度大于等于3030的时的时候,卡方分布候,卡方分布(fnb)(fnb)接近正态分布接近正态分布(fnb)(fnb)4、卡方分布具有卡方分布具有“可加性可加性” X、Y 独立,独立, X 2(n1) ,Y 2(n2) 则则 X + Y 2(n1+ n2) 第3页/共31页第四页,共31页。卡方 (c2) 分布(fnb)的函数CHIDIST:自由度为:自由度为n的卡方分布的卡方分布(fnb)在在x点处的单尾概率点处的单尾概率CHIINV: 返回自由度为返回自由度为n的卡方分布的卡方分布(f
4、nb)的单尾概率函数的逆的单尾概率函数的逆函数函数xP2CHIDISTX 需要计算分布的数字需要计算分布的数字 (X0)Degrees_freedom 自由度自由度 CHIINV Probability 卡方卡方分布的分布的单尾单尾概率概率Degrees_freedom 自由度自由度 第4页/共31页第五页,共31页。卡方检验卡方检验(jinyn)基础基础第5页/共31页第六页,共31页。22()AEE由英国由英国(yn u)统计学家统计学家Karl Pearson首次首次提出,故被称为提出,故被称为Pearson 2 。卡方检验卡方检验(jinyn)基础基础第6页/共31页第七页,共31页。
5、 检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布等 检验某个分类变量各类的出现概率是否等于指定概率检验某个分类变量各类的出现概率是否等于指定概率 检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关(yugun) 检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关(yu
6、gun) 检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致结果是否一致卡方检验基础卡方检验基础(jch)用途用途第7页/共31页第八页,共31页。卡方检验卡方检验(jinyn)的用途的用途一个样本方差和一个样本方差和总体方差是否总体方差是否(sh (sh fu)fu)相同相同同质性检验同质性检验(jinyn)适合性检验适合性检验独立性检验独立性检验观察值和理论观察值和理论值是否符合值是否符合两个或两个以上两个或两个以上因素之间是否相因素之间是否相关关计数计数资料资料和和属性属性资料资料第8页/共
7、31页第九页,共31页。其其2服从服从(fcng)自由度为自由度为(k-1)的卡方的卡方分布分布22221xx当用样本平均数估计总体平均数时,有:当用样本平均数估计总体平均数时,有:2221xx将样本方差代入,则:将样本方差代入,则:222) 1(sk 第9页/共31页第十页,共31页。卡方函数卡方函数(hnsh)的使用的使用假设假设(jish)(jish)假设假设(jish)(jish)222020,:,其否定区为:适用右尾检验H2122020,:,其否定区为:适用左尾检验H假设假设22222122020,:和其否定区为:,适用双尾检验H第10页/共31页第十一页,共31页。例:已知某农田受
8、到重金属污染,经抽样测定例:已知某农田受到重金属污染,经抽样测定(cdng)(cdng)铅浓度铅浓度分别为分别为: :4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),4.2, 4.5, 3.6, 4.7, 4.0, 3.8, 3.7, 4.2 (ug/g),方差为方差为0.150, 0.150, 试检验受试检验受到污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差到污染的农田铅浓度的方差是不是和正常浓度铅浓度的方差(0.0650.065)相同)相同分析:分析:1 1)一个样本方差同质性检验)一个样本方差同质性检验 2 2)事先不知道受污染)事先不知道
9、受污染(wrn)(wrn)的农田与正常农田的铅浓度的农田与正常农田的铅浓度 方差的大小,故双尾检验方差的大小,故双尾检验 (2 2)选取显著水平)选取显著水平05. 0解:(解:(1 1)假设)假设 即受到污染的农田铅浓度的方差即受到污染的农田铅浓度的方差(fn (fn ch)ch)与正常农田铅浓度的方差与正常农田铅浓度的方差(fn ch)(fn ch)相同,对相同,对065. 0:20H065. 0:2AH (3 3)检验计算)检验计算15.16065. 0150. 018) 1(222sk (4 4)推断:)推断:当当df8-18-17 7,由,由CHIINV(0.025,7)16.01,
10、即,即 2025. 02 否定否定H H0 0,接受,接受H HA A,即样本方差与总体方差试不,即样本方差与总体方差试不同质的,认为受到污染的农田铅浓度的方差与正常农田的方差同质的,认为受到污染的农田铅浓度的方差与正常农田的方差有显著差异有显著差异第11页/共31页第十二页,共31页。卡方检验的原理卡方检验的原理(yunl)和方法和方法Pearson定理定理(dngl):当(:当(P1,P2,,Pk)是总体的真实)是总体的真实概率分布时,统计量概率分布时,统计量 kiiiinpnpn122随着随着n的增加渐近于自由度的增加渐近于自由度df=k-1的卡方分布。其中的卡方分布。其中P1,P2,,
11、Pk为为k种不同属性出现的频率,种不同属性出现的频率,n为样为样本容量,本容量,ni为样本中第为样本中第i种属性出现的次数,是观种属性出现的次数,是观测测(gunc)值,记为值,记为Oi,pi为第为第i种属性出现的概率种属性出现的概率,npi则可以看成理论上该样本第则可以看成理论上该样本第i种属性出现的次种属性出现的次数,理论值记为:数,理论值记为:Ei,即,即) 1( ,122kdfEEOkiiii第12页/共31页第十三页,共31页。卡方检验卡方检验(jinyn)的原理和方法的原理和方法Pearson定理的基本含义:定理的基本含义: 如果样本确实是抽自由(如果样本确实是抽自由(P1,P2,
12、,Pk)代)代表的总体,表的总体,Oi和和Ei之间的差异就只是随机误差,之间的差异就只是随机误差,则则Pearson统计量可视为服从卡方分布统计量可视为服从卡方分布 反之,如果样本不是反之,如果样本不是(b shi)抽自由(抽自由(P1,P2,,Pk)代表的总体,)代表的总体,Oi和和Ei之间的差异就不只之间的差异就不只是是随机误差,从而使计算出的统计量有偏大的是是随机误差,从而使计算出的统计量有偏大的趋势趋势 因此,对因此,对Pearson统计量进行单尾检验(即右统计量进行单尾检验(即右尾检验)可用于判断离散型资料的观测值与理论尾检验)可用于判断离散型资料的观测值与理论值是不是值是不是(b
13、shi)吻合吻合第13页/共31页第十四页,共31页。卡方检验卡方检验(jinyn)的原理和方法的原理和方法统计统计(tngj)假设:假设: H0:观测值与理论值的差异是由随机误差引起:观测值与理论值的差异是由随机误差引起 HA:观测值与理论值之间有真实差异:观测值与理论值之间有真实差异 所以卡方值是度量实际观测值与理论值偏南程所以卡方值是度量实际观测值与理论值偏南程度的一个统计度的一个统计(tngj)量量 卡方值越小,表明观测值与理论值越接近卡方值越小,表明观测值与理论值越接近 卡方值越大,表明观测值与理论值相差越大卡方值越大,表明观测值与理论值相差越大 卡方值为卡方值为0,表明,表明H0严
14、格成立,且它不会有下侧严格成立,且它不会有下侧否定区,只能进行右尾检验否定区,只能进行右尾检验第14页/共31页第十五页,共31页。卡方检验的原理卡方检验的原理(yunl)和方法和方法 由于离散型资料的卡方检验只是近似地服从连续型由于离散型资料的卡方检验只是近似地服从连续型变量的卡方分布,所以在对离散型资料进行卡方检验变量的卡方分布,所以在对离散型资料进行卡方检验计算的时,结果常常偏低,特别是当自由度计算的时,结果常常偏低,特别是当自由度df=1df=1时,时,有较大偏差,为此需要进行矫正:有较大偏差,为此需要进行矫正: 当自由度当自由度df1df1时,与连续型随机变量卡方分相近似时,与连续型
15、随机变量卡方分相近似,这时可以不做连续性矫正,这时可以不做连续性矫正 注意:要求各个组内的理论次数不小于注意:要求各个组内的理论次数不小于5 5,如某组理,如某组理论次数小于论次数小于5 5,则应把它与其相邻的一组或几组合并,则应把它与其相邻的一组或几组合并,知道,知道(zh do)(zh do)理论次数大于理论次数大于5 5为止为止kiiiicEEO1225 . 0第15页/共31页第十六页,共31页。适合适合(shh)性检验性检验 适合性检验(吻合性检验或拟合优度检验)适合性检验(吻合性检验或拟合优度检验)步骤:步骤: 1. 1. 提出无效假设,即认为观测提出无效假设,即认为观测(gunc
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 检验 学习 教案
限制150内