卡方检验 (2)精.ppt
《卡方检验 (2)精.ppt》由会员分享,可在线阅读,更多相关《卡方检验 (2)精.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、卡方检验(2)第1页,本讲稿共45页6.1 2统计量与2分布一、2统计量的意义统计量的意义2是度量实际观察次数与理论次数偏离程度的一个统计量,2越小,表明实际观察次数与理论次数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。第2页,本讲稿共45页现结现结合一合一实实例例说说明明 2(读读作卡方作卡方)统计统计量量的意的意义义。根据遗传学理论,动物的性别比例是1:1。统计某羊场一年所产的876只羔羊中,有公羔428只,母羔448只。按1:1的性别比例计算,公、母羔均应为438只。以O表示实际观察次数,E表示理论次数,可将上述情况列成表6-1。表6-1 羔羊性别实际观察次数与理论次数性
2、别实际观察次数O理论次数EO-E(O-E)2/E公428(O1)438(E1)-100.2283母448(O2)438(E2)100.2283合计87687600.4566 第3页,本讲稿共45页从表6-1看到,实际观察次数与理论次数存在一定的差异,这里公、母各相差10只。这个差异是属于抽样误差(把对该羊场一年所生羔羊的性别统计当作是一次抽样调查)、还是羔羊性别比例发生了实质性的变化?要回答这个问题,首先需要确定一个统计量用以表示实际观察次数与理论次数偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。第4页,本讲稿共45页为了度量实际观察次数与理论次数偏离的程度,最简单的办法
3、是求出实际观察次数与理论次数的差数。为了避免正、负抵消,可将两个差数O1-E1、O2-E2平方后再相加,即计算(O-E)2,其值越大,实际观察次数与理论次数相差亦越大,反之则越小。但利用(O-E)2表示实际观察次数与理论次数的偏离程度尚有不足。未考虑观察次数(与理论次数)的大小对偏离程度的影响。为了弥补这一不足,可先将各差数平方除以相应的理论次数后再相加(转化为相对比(转化为相对比值)值)并记之为,即第5页,本讲稿共45页二、2分布 设有一平均数为、方差为 的正态总体。现从此总体中独立随机抽取n个随机变量:x1、x2、xn,并求出其标准正态离差:,记这n个相互独立的标准正态离差的平方和为:2
4、它服从自由度为n的2分布,记为 2(n);第6页,本讲稿共45页 若用样本平均数代替总体平均数,则随机变量 2=服从自由度为n-1的分布,记为 2分布是由正态总体随机抽样得来的一种连续型随机变量的分布。显然,0,即的取值范围是0,+;分布密度曲线是随自由度不同而改变的一组曲线。随自由度的增大,曲线由偏斜渐趋于对称 第7页,本讲稿共45页三、2的连续性矫正 由公式计算的2只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大。Yates(1934)提出了一个矫正公式,矫正后的2值记为 c2 第8页,本讲稿共45页当自由
5、度大于1时,分布与连续型随机变量分布相近似,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。第9页,本讲稿共45页6.2 适合性检验 一、适合性检验的意义判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验称为适合性检验。第10页,本讲稿共45页在适合性检验中,无效假设为H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设为HA:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。并在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类别的理论次数。适
6、合性检验的自由度等于属性类别分类数减1。若属性类别分类数为k,则适合性检验的自由度为k-1。第11页,本讲稿共45页计算出2或2c。将所计算得的2或2c值与根据自由度k-1查2值表所得的临界2值:20.05、20.01比较:若2(或2c)20.05,P0.05,表明实际观察次数与理论次数差异不显著,可以认为实际观察的属性类别分配符合已知属性类别分配的理论或学说;若20.052(或2c)20.01,0.01P0.05,表明实际观察次数与理论次数差异显著,实际观察的属性类别分配不符合已知属性类别分配的理论或学说;第12页,本讲稿共45页二、适合性检验的方法下面结合实例说明。【例】在进行山羊群体遗传
7、检测时,观察了260只白色羊与黑色羊杂交的子二代毛色,其中181只为白色,79只为黑色,问此毛色的比率是否符合孟德尔遗传分离定律的31比例?第13页,本讲稿共45页检验步骤如下:(一)提出无效假设与备择假设H0:子二代分离现象符合31的理论比例。HA:子二代分离现象不符合31的理论比例。(二)选择计算公式 由于本例是涉及到两组毛色(白色与黑色),属性类别分类数k=2,自由度df=k-1=2-1=1,须使用连续性校正公式来计算。第14页,本讲稿共45页(三)计算理论次数 根据理论比率31求理论次数:白色理论次数:E1=2603/4=195黑色理论次数:E2=2601/4=65第15页,本讲稿共4
8、5页(四)计算表62 2c计算表性 状实际观察次数(O)理论次数(E)O-E白 色181195-140.935黑 色7965+142.804总 和26026003.739 2c第16页,本讲稿共45页(五)查临界2值,作出统计推断 当自由度df=1时,查得20.05(1)=3.84,计算的2c0.05,不能否定H0,表明实际观察次数与理论次数差异不显著,可以认为白色羊与黑色羊的比率符合孟德尔遗传分离定律31的理论比例。第17页,本讲稿共45页【例】在研究牛的毛色和角的有无两对相对性状分离现象时,用黑色无角牛和红色有角牛杂交,子二代出现黑色无角牛192头,黑色有角牛78头,红色无角牛72头,红色
9、有角牛18头,共360头。试问这两对性状是否符合孟德尔遗传规律中9331的遗传比例?第18页,本讲稿共45页检验步骤:(一)提出无效假设与备择假设 H0:实际观察次数之比符合9331的理论比例。HA:实际观察次数之比不符合9331的分离理论比例。(二)选择计算公式 由于本例的属性类别分类数k=4:自由度df=k-1=4-1=31,计算2。第19页,本讲稿共45页(三)计算理论次数 依据各理论比率9:3:3:1计算理论次数:黑色无角牛的理论次数E1:3609/16=202.5;黑色有角牛的理论次数E2:3603/16=67.5;红色无角牛的理论次数E3:3603/16=67.5;红色有角牛的理论
10、次数E4:3601/16=22.5。第20页,本讲稿共45页(四)列表计算 2表63 计算表类 型实际观察次数O理论次数EO-E(O-E)2/E黑色无角牛192(O1)202.5(E1)-10.50.5444黑色有角牛78(O2)67.5(E2)+10.51.6333红色无角牛72(O3)67.5(E3)+4.51.6333红色有角牛18(O4)22.5(E4)-4.50.9000总 计36036004.711第21页,本讲稿共45页(五)查临界值,作出统计推断 当df=3时,20.05(3)=7.815,因2 0.05,不能否定H0,表明实际观察次数与理论次数差异不显著,可以认为毛色与角的有
11、无两对性状杂交二代的分离现象符合孟德尔遗传规律中9331的遗传比例。第22页,本讲稿共45页6.3 独立性检验一、独立性检验的意义 对次数资料,除进行适合性检验外,有时需要分析两类因子是相互独立还是彼此相关。这种根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。独立性检验实际上是基于次数资料独立性检验实际上是基于次数资料对子因子间相关性的研究对子因子间相关性的研究。第23页,本讲稿共45页如研究两类药物对家畜某种疾病治疗效果的好坏,先将病畜分为两组,一组用第一种药物治疗,另一组用第二种药物治疗,然后统计每种药物的治愈头数和未治愈头数。这时需要分析药物种类与疗效是否相关,若两者
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 卡方检验 2精 检验
限制150内