第2章 理论分布与抽样分布.pptx
第一节第一节 理论分布理论分布一、正态分布的定义一、正态分布的定义 正态分布或称高斯(正态分布或称高斯(Gauss)分布分布,是一种常见的连续型随机变量的概是一种常见的连续型随机变量的概率分布。率分布。食品科学中所涉及的许多变量都是服从或接近正食品科学中所涉及的许多变量都是服从或接近正态分布的。态分布的。正态分布概率密度函数:222)(21)(xexf x : 所研究的变数所研究的变数; :x的的函数值函数值,称为概率密度函数称为概率密度函数; :总体平均数总体平均数; :总体标准差总体标准差)(xf其中其中, 2 2是两个常数是两个常数,正态分布记为正态分布记为N( , ) , 2表示具有平均数为表示具有平均数为,方差为方差为 的正态分布。的正态分布。22、f(x)在在 处处达到最大值,且达到最大值,且3、 f(x)是非负函数,以横轴为渐进线,分布是非负函数,以横轴为渐进线,分布从从- 到到+ ,且曲线在,且曲线在 处处各有一个拐点。各有一个拐点。二、正态分布曲线的特征二、正态分布曲线的特征:1、正态分布曲线是以平均数正态分布曲线是以平均数为中心左右对称为中心左右对称分布的单峰悬钟形曲线,在平均数的左右两侧,分布的单峰悬钟形曲线,在平均数的左右两侧,只要(只要(x-)的绝对值相等,的绝对值相等,f(x)值就相等。值就相等。21)(f4、正态分布曲线是以参数、正态分布曲线是以参数 和和2的不同而的不同而表现的一系列曲线,所以正态分布曲线是一表现的一系列曲线,所以正态分布曲线是一个曲线族,不是一条曲线。个曲线族,不是一条曲线。5、正态分布的次数多数集中于算术平均正态分布的次数多数集中于算术平均数数的附近,离平均数愈远,相应的次数的附近,离平均数愈远,相应的次数愈少愈少,在在 - 33 以外次数极少以外次数极少。6、曲线、曲线 f(x)与与横轴之间所围成的面横轴之间所围成的面积等于积等于1 ,即,即121)(222)(dxexPxdxexFxx22221)(由于正态分布是依赖于参数和2 的一簇分布,正态曲线的位置由于上述参数的变化而不同。因此,在研究具体的正态分布时,需要将一般的正态分布标准化,转换成为0,2 1的正态分布,我们称0,2 1的正态分布为标准正态分布(standard normal distribution),记作: N(0,1)。 标准正态分布标准正态分布的概率分布函数的概率分布函数记为记为 (u u): 2221ueu dueuuu2221按标准正态分布的分布函数公式计算,对不同的按标准正态分布的分布函数公式计算,对不同的u值编成函数表,称为标准正态分布表(附表值编成函数表,称为标准正态分布表(附表1),),从中可以查到任意一个区间内曲线下的面积概从中可以查到任意一个区间内曲线下的面积概率值。率值。xul 根据正态分布的性质,变量在两个定根据正态分布的性质,变量在两个定值间取值的概率等于曲线与其值间取值的概率等于曲线与其x轴在该区轴在该区间围成的面积。间围成的面积。l 因此概率的计算即正态分布概率密度因此概率的计算即正态分布概率密度函数的定积分计算。函数的定积分计算。l 是一个曲线系统。为了一般化是一个曲线系统。为了一般化的应用,需将正态分布标准化。的应用,需将正态分布标准化。),(2N设u服从标准正态分布,则u1,u2)内取值的概率为:)()(212121)(12222211222212uudueduedueuuuPuuuuuuu由上述公式及正态分布的对称性可推出下列关系式,再借助附表1便能方便地计算有关概率:5 . 0)()0(11uuuP)()(11uuuP)(2)(11uuuP)(21)(11uuuP)()()(1221uuuuuP利用公式,查附表1得:P(u-1.64)0.5050P(u2.58)= (-2.58)=0.004940P(u2.56)=2 (-2.56)=20.005234=0.010468P(0.34 u1.53 ) = (1.53)- (0.34)=0.93699-0.6331=0.30389P(-1 u1)=0.6826P(-2 u2)=0.9545P(-3 u3)=0.9973P(-1.96 u1.96)=0.95P(-2.58 u2.58)=0.99P(u u1)=1-P(-1u1)=1-0.6826=0.31741)=1-P(-1u1)=1-0.6826=0.3174P(P(u u2)=1-P(-2u2)=1-0.9545=0.04552)=1-P(-2u2)=1-0.9545=0.0455P(P(u u3)=1- P(-3u3)=1-0.9973=0.00273)=1- P(-3u3)=1-0.9973=0.0027P(P(u u1.96)=1- P(-1.96u1.96)1.96)=1- P(-1.96u1.96)=1-0.95=0.05=1-0.95=0.05P(P(u u2.58)= 1- P(-2.58u2.58)2.58)= 1- P(-2.58u2.58)=1-0.99=0.01=1-0.99=0.01正态分布曲线和横轴围成的区域面积为正态分布曲线和横轴围成的区域面积为1,表明了随机变量表明了随机变量x在(在(- ,+ )之间取)之间取值,是一个必然事件,其概率为值,是一个必然事件,其概率为1。若随机变量若随机变量x服从正态分布服从正态分布N(,),),则则x的取值落在任意区间的取值落在任意区间x1,x2)的概的概率,率,记作记作P(x1xxxx2)。)。对上式作对上式作变换变换u(x-)/ ,得得dx=du,故有:dxexxxPxxx22212)(2121)(dueduedxexxxPuuuxxuxxx21221222212/ )(/ )(22)(21212121)(由上述证明,服从正态分布的变量x落在x1,x2)内的概率,等于服从正态分布随机变量u落在 (x1 )/ , (x2- )/ )即u1,u2)的概率。故,计算一般的正态分布的概率时,只要将区间的上、下限标准化,就可用查标准正态分布表的方法求概率值。由上述证明方法可得:P(100 x102)=P(100-100)/2(x-100)/2(102-100)/2 =P(0 u1)= (1)- (0)=0.8413-0.5000=0.3413P(- x +)=0.6826P(-2 x+2)=0.9545P(-3 x+3)=0.9973P(-1.96 x+1.96)=0.95P(-2.58 x30时,则接近于正态分布曲线,当时,则接近于正态分布曲线,当趋近于无穷大时,与正态分布曲线重合。趋近于无穷大时,与正态分布曲线重合。当df15时,查附表3得两尾概率等于0.05的临界t值为t0.05(15)2.131,其意义是:P(- t-2.131)=P(2.13t+ )=0.025P(- t-2.131)+P(2.131t+ ) =0.05一、样本单位二、样本容量:样本中含有多少个取样单位。根据t-分布:nsxt/222xstn例如:某果汁糖度标准差为0.392,要求样本平均数相差小于0.2,推断结果的可信度达95%,那么最小样本容量为是多少?392. 0,96. 1, 2 . 0,05. 0stx1576.142 . 0392. 096. 1222222xstn那么,最小样本容量为:由此可见,样本容量数量的确定是需要经过统计运算的。2657.252 . 0392. 058. 2222222xstn1.顺序抽样顺序抽样2.简单随机取样法简单随机取样法3.典型抽样典型抽样4.划区取样法划区取样法5.带状取样法带状取样法