年生物统计学(第4章).ppt





《年生物统计学(第4章).ppt》由会员分享,可在线阅读,更多相关《年生物统计学(第4章).ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章:统计推断第一节 抽样误差一、均数的抽样误差与标准误在第一章、第四节、五、中我们学习了总体与样本、抽样的概念。抽样研究的目的就是要样本的资料来推断总体的水平,这叫统计推断(Statistical inference)。是抽样研究,就存在抽样误差,抽样误差是由于样本中每个观察值的不同和差别所致,是抽样研究中不可避免的。关键是在统计推断中如何计算抽样误差,并如何在统计推断的结果中表达抽样误差的影响。怎样计算抽样的误差呢?由于存在抽样误差,样本均数一般不会正好等于总体的均数,而且所得的各个样本均数之间也不会正好相等。总体总体2从样本到总体方向从样本到总体方向从总体到样本方向从总体到样本方向随机
2、样本2随机样本3随机样本4随机样本n随机样本122222如果将对各个样本的均数(可看成新的观察值!)求标准差(称为标准误,以便与个体观察值的标准差相区别),则这个新的统计量-标准误,就可以衡量抽样误差的大小:标准误越大,反映抽样误差越大;反之亦然。标准误的定义如下:总体平均数的标准误(参数)为:式中:为总体标准差,N为均数 的个数,n为某抽样样本的含量。样本平均数的标准误(统计数)为:后者是计算标准误的实用公式标准误(抽样误差)的大小与总体的标准差成正比;与样本含量的平方根成反比。进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的
3、方差等于总体方差除以样本容量,即:(3.31)(3.32)如果从正态总体N(,2)进行抽样,其样样样样本本本本均均均均数数数数的总体也服从正态分布,但是构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30),其均数的分布就服从正态分布。这一条被称为“中心极限定理中心极限定理中心极限定理中心极限定理”。(43434343页)页)页)页)进一步研究样本平均数的分布还可以有新的发现:(见43页)数学上可以证明:样本均数的均数等于总体均数,即:样本均数的方差等于总体方差除以样本容量,即:(3.31)(3.32)如
4、果从正态总体N(,2)进行抽样,其样样样样本本本本均均均均数数数数的总体也服从正态分布,但是构成这个新正态总体的参数为:不论被抽样的总体为何种分布(例如:二项分布、几何级数分布、偏态分布),但只要能计算出均数和方差,且为大样本(n30),其均数的分布就服从正态分布。这一条被称为“中心极限定理中心极限定理中心极限定理中心极限定理”。(43434343页)页)页)页)第三节 假设检验的原理和方法一、假设检验(Hypothesis test)的概念假设检验又称为显著性检验(Significance test),其意义可用下例来说明。54页例题4.1:某渔场按常规方法所育鲢鱼苗一月龄的平均体长为7.2
5、5 cm,标准差为1.58 cm,为了提高鱼苗的质量,现采用一种新方法进行育苗,一月龄时随机抽取100尾进行测量,测得其平均体长为7.65 cm,试问新的育苗方法有无显著差异?显然,这两个均数的不等有两种可能:由于抽样误差所致;由于新方法的效应所致。如何作出判断,统计学上是通过假设检验来进行的。假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理小概率原理指的是:如果统计推断的结果表明“事件(无效假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”
6、;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。假设检验的理论依据有两方面:事件的概率分布;小概率原理。小概率原理小概率原理指的是:如果统计推断的结果表明“事件(无效假说)”发生概率p很小,例如 p0.05,则我们将这种事件称为“小概率事件”,并可以近似认为:“在这次实验中该事件不会发生”,从而否定“无效假说”,进而认为处理与效应之间“存在因果联系”;反之,如果“事件(无效假说)”发生概率超过p0.05(我们将这种事件称为“非小概率事件”),则近似认为:“
7、在这次实验中该事件还有可能发生”,进而认为处理与效应之间“因果联系”的依据不足。人为的,主观的,约定成俗的,大家共同遵守的原则。(犯错误机会较小)“小概率原理”另外的说法可以想象如果一个事件(例如“无效假说”)的发生概率很小,那么在只进行一次实验情况下,我们可以说这个事件(无效假说)是“不会发生的”。从一般常识就可以知道,这句话在大多数情况下是正确的,但是它一一一一定定定定有犯错误的时候,因为发生的概率再小也是有可能发生的,如同彩票中奖一样,这就是小概率原理。假设检验首先要对样本所代表的总体提出假设,有两种统计假设:一种是“检验假设”(Hypothesis under test),或称“无效假
8、设”(Null hypothesis),符号为H0。如本例,假设:新育苗方法与常规方法所育鱼苗一月龄体长相同(即,假设所比较的均数来自同一总体,两个均数的差异仅仅是由于抽样误差所致),无效假设是直接用于检验的假设,是对样本总体来源提出的假设,通常要加上文字进行表达。表达的格式为:假假假假设设设设HH0 0:=0 0 0 0,即即即即新新新新育育育育苗苗苗苗方方方方法法法法与与与与常常常常规规规规方方方方法法法法所所所所育育育育鱼鱼鱼鱼苗苗苗苗一一一一月月月月龄龄龄龄体体体体长长长长相同相同相同相同。另一种是“备择假设”(Alternative hypothesis)符号为HA。如本例,假设:新
9、育苗方法与常规方法所育鱼苗一月龄体长不相同(即,假设所比较的均数不是来自同一总体,两者均数的差异不是由于抽样误差所致,而是由于“效应”所致),表达格式为:对对对对HHA A:0 0 0 0二、假设检验的一般步骤 提出假设在进行了无效假设和备择假设之后,要确定一个否定H0的概率标准,这个概率标准称为“显著水平”,记作,是人为规定的小概率界限(根据“小概率事件原理”)。生物统计学中常:取显著水平取显著水平取显著水平取显著水平=0.05=0.05=0.05=0.05 和和和和/或或或或 取显著水平取显著水平取显著水平取显著水平=0.01=0.01=0.01=0.01。选择和计算统计量(检验计算)根据
10、资料性质的不同和不同的分析目的,应当选用不同的统计量,如u、t、F、2等等。例如本例:为大样本(n30)、计量资料,目的在于判断样本均数(7.65 cm)与总体均数(7.25 cm)的差别来源,可选择u值为统计量,并采用相应的u检验的方法计算统计量。根据55/37页公式(3.34):检验计算:检验计算:检验计算:检验计算:二、假设检验的一般步骤 确定概率的显著水平(取显著水平)算出统计量之后,通常须查找相应的工具表来确定P值。有关的工具表都是按照各种统计量的特殊分布规律编制出来的。如本例查316页附表2 正态离差(u)值表来确定P值。推断:根据推断:根据推断:根据推断:根据3163163163
11、16页附表页附表页附表页附表2 2 2 2,=0.05=0.05=0.05=0.05时,时,时,时,u u u u0.050.050.050.05=1.96=1.96=1.96=1.96,2.5321.962.5321.962.5321.962.5321.96,p0.05p0.05p0.05p0.05差异无显著性(NS)小概率事件:P0.05差异有显著性(*)非常小概率事件:P0.01差异有高度显著性(*)确定概率范围并推断是否接受假设(推断)第四节 计量资料样本平均数的假设检验一、大样本(n30)平均数的假设检验 u 检验均数的标准正态分布图形0.00.3989xx方法提要根据根据 u 值表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学

限制150内