第三章-概率与概率分布ppt课件.ppt
第一节:概率基础知识一、概率的概念一、概率的概念二、概率的计算二、概率的计算三、概率的分布三、概率的分布一、概率基本概念(一)事件(一)事件定义:在一定条件下,某种事物出现与否定义:在一定条件下,某种事物出现与否就称为是事件。就称为是事件。 自然界和社会生活上发生的现象是各自然界和社会生活上发生的现象是各种各样的,常见的有两类。种各样的,常见的有两类。在一定条件下必然出现某种结果或必然不出现某种结果。在一定条件下必然出现某种结果或必然不出现某种结果。确定性事件确定性事件必然事件(必然事件(U)(certain event)不可能事件(不可能事件(V)(impossible event)在一定条件下可能发生也可能不发生。在一定条件下可能发生也可能不发生。随机事件随机事件(random event)不确定事件不确定事件(indefinite event) 为了研究随机现象,需要进行大量重复的调查、实验、为了研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。测试等,这些统称为试验。(二)频率(二)频率(frequency)若在相同的条件下,进行了若在相同的条件下,进行了n次试验,在这次试验,在这n次试验中,事件次试验中,事件A出现的次数出现的次数m称为事件称为事件A出现的出现的频数频数,比值,比值m/n称为事件称为事件A出现的出现的频率频率(frequency),记为记为W(A)=m/n。 表表3-1 玉米种子发芽试验结果玉米种子发芽试验结果种子总数种子总数(n) 10 20 50 100 200 500 1000发芽种子数发芽种子数(m) 9 19 47 91 186 458 920种子发芽率种子发芽率(m/n) 0.900 0.950 0.940 0.910 0.930 0.918 0.920种子发芽与否是不能事先确定的,但从表中可以看出,种子发芽与否是不能事先确定的,但从表中可以看出,试验随着试验随着n值的不同,种子发芽率也不相同,当值的不同,种子发芽率也不相同,当n充分大充分大时,发芽率在时,发芽率在0.92附近摆动。附近摆动。例:例:频率表明了事件频繁出现的程度,因而其稳定性说频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。客观属性,提示了隐藏在随机现象中的规律性。概概 率率(三)概率(三)概率(probability,P)概率的统计定义概率的统计定义:设在相同的条件下,进行大量重复试验,:设在相同的条件下,进行大量重复试验,若事件若事件A的频率稳定地在某一确定值的频率稳定地在某一确定值p的附近摆动,则称的附近摆动,则称p为事件为事件A出现的概率。出现的概率。 P(A) = p 抛掷一枚硬币发生正面朝上的试验记录抛掷一枚硬币发生正面朝上的试验记录实验者实验者 投掷次数投掷次数 发生正面朝上的次数发生正面朝上的次数 频率频率(m/n) 蒲丰蒲丰 4040 2048 0.5069K 皮尔逊皮尔逊 12000 6019 0.5016K 皮尔逊皮尔逊 24000 12012 0.5005 随着实验次数的增多,正面朝上这个事件发生的频随着实验次数的增多,正面朝上这个事件发生的频率稳定接近率稳定接近0.5,我们称,我们称0.5作为这个事件的概率。作为这个事件的概率。 P(A) = p=lim 在一般情况下,随机事件的概率在一般情况下,随机事件的概率P是不可能准是不可能准确得到的。通常以试验次数确得到的。通常以试验次数n充分大时,随机充分大时,随机事件事件A的频率作为该随机事件概率的的频率作为该随机事件概率的近似值近似值。mnmnn 0P(A)10P(A)1 任何事件任何事件P(U)=1P(U)=1 必然事件必然事件P(V)P(V)0 0 不可能事件不可能事件0P(A)10P(A)1 随机事件随机事件概率的计算概率的计算第二部分二、概率的计算二、概率的计算(一)事件的相互关系(一)事件的相互关系和事件和事件积事件积事件互斥事件互斥事件对立事件对立事件独立事件独立事件完全事件系完全事件系1 和事件和事件事件事件A和事件和事件B中至少有一个发生而构成的新中至少有一个发生而构成的新事件称为事件事件称为事件A和事件和事件B的和事件,记作的和事件,记作A+B。n个事件的和,可表示为个事件的和,可表示为A1+A2+An如:随机抽取一样品的出粉率为如:随机抽取一样品的出粉率为81%以下,称事件以下,称事件A,另,另一一 81-85%为为B,现取一新样品出粉率,现取一新样品出粉率85以下,则其为以下,则其为A和和B的和事件的和事件2 积事件积事件事件事件A和事件和事件B中同时发生而构成的新事件称中同时发生而构成的新事件称为事件为事件A和事件和事件B的积事件,记作的积事件,记作AB。n个事件的积,可表示为个事件的积,可表示为A1 A2 An如调查田间病害发生情况,棉铃虫发生为事件A,黄萎病发生为B,则棉铃虫与黄萎病同时发生的新事件为A和B的积事件3 互斥事件(互不相容事件)互斥事件(互不相容事件)事件事件A和事件和事件B不能同时发生,则称这两个事不能同时发生,则称这两个事件件A和和B互不相容或互斥。互不相容或互斥。n个事件两两互不相容,则称这个事件两两互不相容,则称这n个事件互斥。个事件互斥。豌豆开红花、白花事件4 对立事件对立事件事件事件A和事件和事件B必有一个发生,但二者不能同必有一个发生,但二者不能同时发生,且时发生,且A和和B的和事件组成整个样本空间。的和事件组成整个样本空间。即即A+B=U,AB=V。我们称事件。我们称事件B为事件为事件A的的对立事件。对立事件。B= A生男孩、女孩5 独立事件独立事件事件事件A和事件和事件B的发生无关,事件的发生无关,事件B的发生与的发生与事件事件A的发生无关,则事件的发生无关,则事件A和事件和事件B为独立为独立事件。事件。如果多个事件如果多个事件A1、A2、A3、An 彼此独立,彼此独立,则称之为独立事件群。则称之为独立事件群。如播种两粒玉米,它们的发芽6完全事件系完全事件系如果多个事件如果多个事件A1、A2、A3、An两两互斥,两两互斥,且每次试验结果必然发生其一,则称事件且每次试验结果必然发生其一,则称事件A1、A2、A3、An为完全事件系。为完全事件系。完全事件系的和事件概率为,任何一个事完全事件系的和事件概率为,任何一个事件发生的概率为件发生的概率为1/n。即:。即:P(A1A2An)如,抽取一位阿拉伯数字,抽取数字为0、1、2.8、9构成了完全事件系例:玉米田中,一穗株(A)占67.2%,双穗株(B)占30.7%,空 穗株(C)占2.1%,试计算一穗株和双穗株的概率。P(A+B)=P(A)+P(B)=0.672+0.307=0.979因为P(A)+P(B)+P (C) =1 P(A+B)=1-P(C)=1-0.021=0.979(二)概率的计算法则(二)概率的计算法则1 互斥事件加法定理互斥事件加法定理定理定理: 若事件若事件A与与B互斥,则互斥,则 P(A+B)=P(A)+P(B)推理推理1 P(A1+A2+An)=P(A1)+P(A2)+P(An)推理推理2 P(A)=1-P(A)推理推理3 完全事件系的和事件的概率为完全事件系的和事件的概率为1。2 独立事件乘法定理独立事件乘法定理例例:播种玉米,种子的发芽率为播种玉米,种子的发芽率为90%,每穴两粒,则:,每穴两粒,则:A:第一粒种子发芽,第一粒种子发芽,P (A) = 0.9, P(A) = 0.1B:第二粒种子发芽,第二粒种子发芽,P (B) = 0.9, P( B ) = 0.1C:两粒种子均发芽,两粒种子均发芽,D:一粒种子发芽:一粒种子发芽:D= AB + AB,P(D)0.9*0.1+ 0.1*0.9=0.18E:两粒种子均不发芽:两粒种子均不发芽:E= A B,P(E)P(A)P(B)=0.1*0.1=0.01求:求: C:两粒种子均发芽两粒种子均发芽 D:一粒种子发芽一粒种子发芽 E:两粒种子均不发芽两粒种子均不发芽C = AB,P(C) = P(A) P(B) = 0.812 独立事件乘法定理独立事件乘法定理定理定理: 事件事件A和事件和事件B为独立事件,则事件为独立事件,则事件A与事与事件件B同时发生的概率为各自概率的乘积。同时发生的概率为各自概率的乘积。 P(AB)=P(A)P(B)推理:推理:A1、A2、An彼此独立,则彼此独立,则 P(A1A2A3An)=P(A1)P(A2)P(A3)P(An)三、概率分布三、概率分布(一)离散型变量的概率分布(一)离散型变量的概率分布要了解离散型随机变量要了解离散型随机变量x的统计规律,必须知道的统计规律,必须知道它的一切可能值它的一切可能值xi及取每种可能值的概率及取每种可能值的概率pi。对离散型变量对离散型变量x的一切可能值的一切可能值xi(i=1,2,3),及其对应的概率及其对应的概率piP (x=xi) = pi, i=1,2,3例:例: 表3-2某鱼群的年龄组成年龄(x) 1 2 3 4 5 6 7频率(W) 0.4597 0.3335 0.1254 0.0507 0.0215 0.0080 0.0012此表给出了该鱼群年龄构成的全部,我们称之为该鱼群年龄的概率分布。 表 婴儿的性别情况表性别(x) 0(男) 1(女)概率(P) 0.517 0.483此表列出了性别变量的取值及相应值的概率,揭示了观此表列出了性别变量的取值及相应值的概率,揭示了观察婴儿性别试验的统计规律。察婴儿性别试验的统计规律。用随机变量的可能取值及取相应值的概率来表示随机用随机变量的可能取值及取相应值的概率来表示随机试验的规律称为随机变量的分布律或概率函数。试验的规律称为随机变量的分布律或概率函数。例:例: 表3-3 离散型变量的概率分布变量(x) x1 x2 x3 x4 . xn概率(P) p1 p2 p3 p4 . pnP (x=xi) = pi, i=1,2,3设离散型变量x的所有一切可能值xi(i=1,2,3),取相应值的概率为pi,则P (x=xi)称为离散型随机变量x的概率函数。离散型变量的概率分布的特点离散型变量的概率分布的特点1 Pi 0 (i=1,2,)1iPi= 1(二)连续型变量的概率分布(二)连续型变量的概率分布当试验资料为连续型变量,一般通过分组当试验资料为连续型变量,一般通过分组整理成频率分布表。如果从总体中抽取样本的整理成频率分布表。如果从总体中抽取样本的容量容量n相当大,则频率分布就趋于稳定,我们将相当大,则频率分布就趋于稳定,我们将它近似地看成总体概率分布。它近似地看成总体概率分布。图3.1 鲢鱼体长的频率分布图35 40 45 50 55 60 65 70 75 80 85 90直方图中同一组内的频率是相等的。直方图中同一组内的频率是相等的。0.05一0.10一0.15一0.20一0.25一频率密度直方图中每一矩形的面积就表示该组的频率。直方图中每一矩形的面积就表示该组的频率。当当n无限大时,频率转化为概率,频率密度也转化为概率无限大时,频率转化为概率,频率密度也转化为概率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率密度,阶梯形曲线也就转化为一条光滑的连续曲线,这时频率分布也就转化为概率分布了,此曲线为总体的概率密度曲线,分布也就转化为概率分布了,此曲线为总体的概率密度曲线,曲线函数曲线函数f(x)称为概率密度函数。称为概率密度函数。对于一个连续型随机变量对于一个连续型随机变量x,取值于区间,取值于区间a,b内的概内的概率为函数率为函数f(x)从从a到到b的积分,即:的积分,即:badxxfbxaP)()(连续型随机变量的概率由概率分布密度函数所确定。连续型随机变量的概率由概率分布密度函数所确定。ab1)()(dxxfxP概率密度函数概率密度函数f(x)曲线与曲线与x轴所围成的面积为轴所围成的面积为1。三、大数定律三、大数定律几种常见的理论分布几种常见的理论分布随机变量的概率分布 (probability distribution) 离散型变量 () 连续型变量二项分布泊松分布正态分布变量第二节:几种常见的理论分布一、二一、二 项项 分分 布布离散型随机变量的分布哺乳动物种子穗子生物个体雄性雌性发芽不发芽有芒无芒成活死亡对立事件一、二项分布的概率函数一、二项分布的概率函数 二项总体: 这种“非此即彼”的事件构成的整体 二项分布: 二项总体的概率分布一、二项分布设有一随机试验设有一随机试验, ,,这两种结果是互不相容的,这两种结果是互不相容的,AA4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA24C 又由于以上各种方式中,任何二种方式又由于以上各种方式中,任何二种方式都是互不相容的,按都是互不相容的,按概率的加法法则概率的加法法则,在,在4 粒粒种子中正好有种子中正好有2粒种子发芽的概率为:粒种子发芽的概率为: P4(2) = P( ) + P( ) + + P( )= 4321AAAA4321AAAA4321AAAA24224qpC 一般,在一般,在n重贝努利试验中,事件重贝努利试验中,事件A恰好发生恰好发生x(0 xn)次的概率为次的概率为 x=0,1,2,nknkkknqpCkP)(x 1qpqpCqpCniniinxnxxn 公式公式 称作称作二项分布概率函数二项分布概率函数 ,其中其中 , ,x是一个离散型随机变量,取值为是一个离散型随机变量,取值为0,1,2,n。p(x) Cnxpxqn-xCnxn!x!(n-x)!n=试验次数(或样本含量) n=4x=在n次试验中事件A出现的次数 x=2p=事件A发生的概率(每次试验是恒定的) p=0.91-p=事件A不发生的概率 1-p=0.1p(x)=X的概率函数=P(X=x) P(2)则则4粒种子有两粒发芽的概率为:粒种子有两粒发芽的概率为: P(x)= p2 q4-2=60.920.12=0.048624C 例:例: 现已求出某事件发生的概率,若试验现已求出某事件发生的概率,若试验N次,次,则该事件发生的理论次数为:则该事件发生的理论次数为: 理论次数理论次数NP(x) 二项分布的概率累积函数为:二项分布的概率累积函数为: F (x) =P(x)=1二项总体试验只有两个对立结果,记为A和A,出现概率分别为p和q=1-p。重复性:每次试验条件不变时,事件A出 现为恒定概率p;独立性:任何一次试验中事件A的出现与其余各次试验结果无关。二项分布的两个条件:二项分布的两个条件:3:1若每次观察4株,共观察100次,问红花为0、1、2、3、4株的概率各为多少?(二)二项分布的计算(二)二项分布的计算例:豌豆例:豌豆F1为红花和白花,杂交后为红花和白花,杂交后F2红花:白花红花:白花3:1F1F2概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C40p0q4 0.0039 0.0039 0.39 P(1) C41p1q3 0.0469 0.0508 4.69 P(2) C42p2q2 0.2109 0.2617 21.09 P(3) C43p3q1 0.4219 0.6836 42.19 P(4) C44p4q0 0.3164 1.000 31.64 合计 1.000 100 表 观察4株出现红花的概率分布表 (p=0.75 q=1-p=0.25)概率函数 Cnxpxqn-x P(x) F(x) NP(x) P(0) C50p0q5 0.00001 0.00001 0.01 P(1) C51p1q4 0.00045 0.00046 0.45 P(2) C52p2q3 0.0081 0.00856 8.1 P(3) C53p3q2 0.0729 0.08046 72.9 P(4) C54p4q1 0.32805 0.40951 328.05 P(5) C55p5q0 0.59049 1.0000 590.49 孵化小鸡的概率分布表(p= 0.90 q=0.10)例例2:鸡蛋孵化率为:鸡蛋孵化率为0.9,每次选,每次选5个进行孵化,试求孵出小鸡的个进行孵化,试求孵出小鸡的各种可能概率,若做各种可能概率,若做1000次试验,其理论次数分别为多少?次试验,其理论次数分别为多少?二项分布概率函数二项分布概率函数概率的计算概率的计算样本容量的确定样本容量的确定p(x) Cnxpx(1-p)n-x例:某小麦品种在田间出现自然变异的概率为例:某小麦品种在田间出现自然变异的概率为0.0045,(1)调查调查100株,获得两株或两株以上变异植株的概率是多少?株,获得两株或两株以上变异植株的概率是多少?(2)期望有期望有0.99的概率获得的概率获得1株或株或1株以上的变异植株,至少应株以上的变异植株,至少应调查多少株?调查多少株?(1) n=100, p=0.0045P(x2)=1- P(0)- P(1)=1-0.6370-0.2879=0.07512)=1- P(0)- P(1)=1-0.6370-0.2879=0.0751 p(0) C1000p0(1-p)100=0.6370p(1) 0.2879(2) 应调查的的株数应满足应调查的的株数应满足p(0) 1-0.99=0.01p(0) Cn0p0(1-p)n(0.9955)n=0.01n=1021(株)株)二、泊二、泊 松松 分分 布布泊松分布泊松分布(Poisson distribution) 是一种可以是一种可以用来描述和分析随机地发生在单位空间或时用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布,也是一种离散间里的稀有事件的概率分布,也是一种离散型随机变量的分布。型随机变量的分布。 泊松分布是描述一定空间(长度、面积和泊松分布是描述一定空间(长度、面积和体积)或一定时间间隔内点子散布状况的理体积)或一定时间间隔内点子散布状况的理想化模型。想化模型。在二项分布中,当某事件出现的概率极小在二项分布中,当某事件出现的概率极小(p0p0),而试验次数又极多,而试验次数又极多(n n )时,二时,二项分布就趋近于泊松分布,即项分布就趋近于泊松分布,即 0,1,2,xex!p(x)x 泊松分布是二项分布的一种特殊类型。泊松分布是二项分布的一种特殊类型。为参数,为参数, = = npnp x = 0,1,2,二、泊松分布二、泊松分布泊松分布的概率函数泊松分布的概率函数 可由二项分布概率函数推导出来可由二项分布概率函数推导出来!)(xexPl l - x1)(xp为参数,为参数, = = npnp x = 0,1,2,p(x) Cnxpx(1-p)n-x=2 2 = =l二、泊松分布二、泊松分布对于小概率事件,可用泊松分布描述其概率分布。对于小概率事件,可用泊松分布描述其概率分布。二项分布当二项分布当p0.1和和np0。正态分布(正态分布(normal distribution)特点特点正态分布也称为高斯分布正态分布也称为高斯分布(Gauss distribution),是是一种连续型随机变量的概率分布。一种连续型随机变量的概率分布。n大大p与与1-p接近接近大大二项分布二项分布泊松分布泊松分布正态分布正态分布正态分布是生物统计学的重要基础。正态分布是生物统计学的重要基础。(一)正态分布的概率函数(一)正态分布的概率函数连续型随机变量的概率分布是用概率密度函数来描述的。连续型随机变量的概率分布是用概率密度函数来描述的。)()(21)(222xxxfe(一)正态分布的概率函数(一)正态分布的概率函数)()(21)(222xxxfef(x) 为正态分布的概率密度函数,表示某一定为正态分布的概率密度函数,表示某一定x值出现的概率值出现的概率密度函数值。密度函数值。总体平均数总体平均数总体标准差总体标准差圆周率,圆周率,3.14159e为自然对数底,为自然对数底,2.71828N (,2)(一)正态分布的概率函数)()(21)(222xxxfex=x=时,时,f(xf(x) )值最大,正态分布曲线以平均数值最大,正态分布曲线以平均数为中心的分布。为中心的分布。(二)正态分布的特征(二)正态分布的特征1)()(21)(222xxxfex-x-的绝对值相等时,的绝对值相等时,f(xf(x) )也相等,正态分布也相等,正态分布密度曲线以密度曲线以为中心向左右两侧对称。为中心向左右两侧对称。(二)正态分布的特征(二)正态分布的特征2)()(21)(222xxxfef(x)是非负函数,以是非负函数,以x轴为渐近线,轴为渐近线,x的取值区的取值区间为间为(-,+)(-,+) 。(二)正态分布的特征(二)正态分布的特征3)()(21)(222xxxfe正态分布曲线由参数正态分布曲线由参数,决定,决定, 确定正态分确定正态分布曲线在布曲线在x轴上的中心位置,轴上的中心位置,确定正态分布确定正态分布的变异度。的变异度。幻灯片幻灯片 73(二)正态分布的特征(二)正态分布的特征4正态分布曲线在正态分布曲线在x=x=处各有一个拐点,处各有一个拐点,曲线通过拐点时改变弯曲度曲线通过拐点时改变弯曲度。(二)正态分布的特征(二)正态分布的特征5分布曲线与分布曲线与x轴围成的全部面积为轴围成的全部面积为1(二)正态分布的特征(二)正态分布的特征6)()(21)(222xxxfe若一个连续型随机变量若一个连续型随机变量x取取值于区间值于区间a,b,其概率为,其概率为badxxfbxaP)()(ab(三)标准正态分布(三)标准正态分布N (,2)正态分布是依赖于参数正态分布是依赖于参数(,2 2) )的一个曲线系,正态曲的一个曲线系,正态曲线的位置及形态随线的位置及形态随(,2 2) )的不同而不同,这就给研究的不同而不同,这就给研究具体的正态分布总体带来了困难,我们现将其标准化。具体的正态分布总体带来了困难,我们现将其标准化。)()(21)(222xxxfeN(,2)N(0,1)()(21)(222xxxfexuu u表示标准正态离差(表示标准正态离差(standard normal deviate)standard normal deviate),它表示离开平均数它表示离开平均数有几个标准差有几个标准差。euuf22121)(f(u)称为标准正态分布称为标准正态分布(standard normal distribution)或或u分布方程。分布方程。 标准正态分布的概率累积函数记作标准正态分布的概率累积函数记作F(u),它是,它是变量变量u小于某一定值的概率。小于某一定值的概率。iuiiduufuuPuF)()()(ui 为了计算方便,对于不同的为了计算方便,对于不同的u值,计算出不同的值,计算出不同的F(x),编成函数表,称为正态分布表,从中可以查到编成函数表,称为正态分布表,从中可以查到u任意一个任意一个区间内取值的概率。区间内取值的概率。标准正态分标准正态分布布u落在区间落在区间a,b的概率的概率)()(212121)(222212121aFbFduedueduebuaPuaububa(四)正态分布的概率计算5 . 0)()0 (aFauP)()(1)(aFaFauP)(2)(aFauP)(21)(aFauP)()()(aFbFbuaPa b-aP( x +1.96)= 0.05P( x +2.58)= 0.01P(-1.96u1.96)=0.95P( x +1.96)=P( x +2.58) = = P(-2.58u2.58)=0.99u2.58)=0.99ux(五)正态分布的应用(五)正态分布的应用估计参考值范围估计参考值范围20株小麦株高株小麦株高(cm) 为为82,79,85,84,86,84,83,82,83,83,84,81,80,81,82,81,82,82,82,80其平均值为其平均值为82.3cm,标准差为,标准差为1.7502cm。问。问1:小麦株高:小麦株高95%的正常范围值。的正常范围值。96. 1小麦株高服从正态分布。总体平均小麦株高服从正态分布。总体平均数数和标准差和标准差未知,可以用样本未知,可以用样本平均数平均数 x 和标准差和标准差 s 来估计来估计和和 。)(7502. 1)(3 .82cmscmx96. 105. 0u 78.57, 85.73 xuux95%05.0问问2 2:x85(cm)x85(cm) 的概率?的概率?54. 17502. 13 .8285xuP(x85)x85)P(uP(u1.541.54) ) 1-F(u=1.54)1-F(u=1.54) =1-0.9382=0.0618 =1-0.9382=0.0618 第三节:样本平均数的分布 由于从总体中抽出的样本为每一个可能样本,且每个样本由于从总体中抽出的样本为每一个可能样本,且每个样本中的变量均为随机变量,所以其样本平均数也为随机变量,也中的变量均为随机变量,所以其样本平均数也为随机变量,也形成一定的理论分布,这种理论分布称为样本平均数的概率分形成一定的理论分布,这种理论分布称为样本平均数的概率分布,或称样本平均数的分布。布,或称样本平均数的分布。样本平均数的平均数:样本平均数的平均数:样本平均数的方差:样本平均数的方差:x2x对N=3(3,4,5),n=2抽样试验所得的9个样本平均数,整理成次数分布表。 x f f x f x 23.0 1 3 9.03.5 2 7 24.54.0 3 12 48.04.5 2 9 40.55.0 1 5 25.0 9 36 147.0n=2 x f f x f x 23.0 1 3 9.03.5 2 7 24.54.0 3 12 48.04.5 2 9 40.55.0 1 5 25.0 9 36 147.0n=23,4,542 2 0.66674936nxNxfnNxfxfNnnx22223333.0)(1 x f f x f x 23.00 1 3 9.003.25 4 13 42.253.50 10 35 122.503.75 16 60 225.004.00 19 76 304.004.25 16 68 289.004.50 10 45 202.504.75 4 19 90.255.00 1 5 25.00 81 324 1309.50n=4如果对这个N=3(3,4,5) 所组成的总体,再进行n=4的抽样试验,则可得81个样本平均数,将其整理成次数分布表。n=43,4,542 2 0.6667481324nxNxfnNxfxfNnnx22221667.0)(1 x f f x f x 23.00 1 3 9.003.25 4 13 42.253.50 10 35 122.503.75 16 60 225.004.00 19 76 304.004.25 16 68 289.004.50 10 45 202.504.75 4 19 90.255.00 1 5 25.00 81 324 1309.50(1)样本平均数分布的平均数总体平均数。)样本平均数分布的平均数总体平均数。x(2)样本平均数分布的方差总体方差除以样本容量。)样本平均数分布的方差总体方差除以样本容量。nx22标准误反映了样本平均数标准误反映了样本平均数 x 的抽样误差,即精确性的高低。的抽样误差,即精确性的高低。标准误大,各样本平均数间差异程度大,样本平均数的精确性低。标准误大,各样本平均数间差异程度大,样本平均数的精确性低。标准误小,各样本平均数间差异程度小,样本平均数的精确性高。标准误小,各样本平均数间差异程度小,样本平均数的精确性高。标准误的大小与原总体的标准差标准误的大小与原总体的标准差 成正比,与样本含量成正比,与样本含量n的平方根的平方根成反比。成反比。从某特定总体抽样,因为从某特定总体抽样,因为是一定值,所以只有增大样本容量,是一定值,所以只有增大样本容量,才能降低样本平均数的抽样误差。才能降低样本平均数的抽样误差。样本平均数的标准误差(标准误)样本平均数的标准误差(标准误)(standard error of mean)nxnx在实际工作中,总体标准差在实际工作中,总体标准差 往往是未知的,因而无法求得往往是未知的,因而无法求得标准误。标准误。此时,可用样本标准差此时,可用样本标准差s估计总体标准差估计总体标准差 。xsxxnss样本标准误或均数标样本标准误或均数标准误,是平均数抽样准误,是平均数抽样误差的估计值。误差的估计值。)1(/)(22nnnxxnssx若样本中各观测值为若样本中各观测值为x1,x2,x3,xn,则,则(3)如果从正态分布总体)如果从正态分布总体N(,2 2)进行进行抽样,其样本平均数抽样,其样本平均数x是一具有平均数是一具有平均数 ,方差方差2 2/n/n的的正态分布,记作正态分布,记作N(,2 2/n/n)。中心极限定理中心极限定理(central limit theorem)(4)如果被抽总体不是正态分布总体,但具有平均数)如果被抽总体不是正态分布总体,但具有平均数和方和方差差2 2 ,当随样本容量,当随样本容量n的不断增大,样本平均数的不断增大,样本平均数 x 的分布也越的分布也越来越接近正态分布,且具有平均数来越接近正态分布,且具有平均数,方差方差2 2 /n 。不论总体为何种分布,只要是大样本,就可运用中心极限不论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。均数出现的概率时,样本平均数可按下式进行标准化。nxxuxx/ 3.1 解释下列概念:互斥事件、对立事件、独解释下列概念:互斥事件、对立事件、独立事件、频率、概率立事件、频率、概率 ? 频率如何转化为概率频率如何转化为概率 ? 3.2 什么是正态分布什么是正态分布 ? 什么是标准正态分布什么是标准正态分布 ? 正态分布曲线有什么特点正态分布曲线有什么特点 ? 和和对正态分布对正态分布曲线有何影响曲线有何影响 ? 3.4 设以同性别、同月龄的小白鼠接种某种病菌,假定接种后设以同性别、同月龄的小白鼠接种某种病菌,假定接种后经过一段时间生存的概率为经过一段时间生存的概率为 0.425 ,若,若 5 只一组进行随机抽样,只一组进行随机抽样,试问其中试问其中“四生一死四生一死”的概率有多大的概率有多大 ? 3.5 有一正态分布的平均数为有一正态分布的平均数为 16 ,方差为,方差为 4 ,试计算:,试计算: (1) 落于落于 10 到到 20 之间的数据的百分数;之间的数据的百分数; (2) 小于小于 12 或大于或大于 20 的数据的百分数。的数据的百分数。 F(u=-3)=0.00135 , F(u=2)=0.97725, F(u=-2)=0.02275 3.4【答案答案】 0.094 。 3.5【答案答案】 (1)97.59% ; (2)4.55% 。