第三章概率与分布.doc
第三章 概率与分布第一节 基础概率一、什么是随机现象客观现象随机现象随机事件的概率(即发生可能性的大小)就是随机事件隐蔽着的规律。二、概率的概念在一定条件下,随机现象可能出现多种结果。随机现象的结果以及这些结果的集合就称作随机事件,简称事件。为了使随机事件发生可能性的大小能进行比较,有必要确定概率的最大值和最小值是什么。为此,我们把不可能发生的事件称为不可能事件(记作),不可能事件发生的概率定为0:在一定条件下一定会发生的事件称作必然事件(记作S),必然事件发生的概率定为l:对于一般随机事件,由于它发生的可能性介于“必然”与“不可能”之间,因此它发生的概率介于0和1之间:0l例、某班有学生50名,其中有15名女生。现从该班任抽20名学生,则“其中有10名女生”的事件为随机事件;“其中至少有5名男生”的事件为必然事件;“其中有18名女生”的事件为不可能事件。( 为什么? )三、概率的计算方法(一)频率法在相同条件下进行次试验或观察,随机事件出现的次数称作频数。频数与试验次数的比值,称作次试验或观察中事件E出现的频率,记作:=。频率具有如下性质:l、0l2、对于必然事件,频率=l; 对于不可能事件(),频率=0;3、频率具有双重性质:随机性和统计规律性。法国统计学家蒲丰(Buffon)和英国统计学家皮尔逊(K·Pearson)所做的大量投掷硬币的经典试验结果说明:当时,频率的稳定值反映了随机事件自身固有的规律性。试验者掷币次数N出现“正面”频数n频率蒲丰皮尔逊皮尔逊4040120002400020486019120120.50690.50160.5005凭借日常生活经验可知:某事件出现的可能性(概率)越大,则实际观测结果的频率也越大,反之亦然。因此,常常把事件的概率定义为观察次数趋于无穷时相应频率的稳定值。即: = 在实际中,当概率不易求出时,往往就取充分大的频率作为概率的近似值。但应注意,频率是个试验值,具有随机性,它只能近似地反映事件出现的可能性大小。概率则是个理论值,其值是惟一的,能精确地反映事件出现可能性的大小。 (二)古典法在一定条件下, 随机现象具有多种可能的结果。对随机现象的观察可近似地看做随机试验。随机试验若满足条件:(1)在相同条件下可以重复;(2)在每次试验前虽然不能预言会出现哪一种结果,但它共有多少种可能的结果是事先巳知的。我们就把随机试验中的每一种结果称作一个样本点(基本事件)。所有样本点的全体称作样本空间(S)。例、试验“投掷一颗骰子”的样本空间为:=E1、E2、E3、E4、E5、E6。 E1:出现“l”点 E2:出现“2”点 E3:出现“3”点E4:出现“4”点 E5:出现“5”点 E6:出现“6”点基本事件自身或由基本事件组成的集合就称为随机事件。它是样本空间的某个子集。若随机试验满足以下两个条件:(1)它的样本空间只有有限个样本点;(2)每个样本点出现的可能性相同。则称这种随机试验为古典型随机试验,简称古典概型。对于古典概型,如果事件包含个样本点,则事件发生的概率为:也就是说,如果随机试验的各种可能结果在事前可以一一列举出来,设这种结果共有n个,且这几种结果的出现是等可能的,而所研究的事件包含有个上述的结果,则事件发生的概率为:例、投掷一颗骰子,求事件=“出现奇数点”的概率。()例、扔掷二枚均匀的硬币,求事件= “两枚都朝上”及B= “一枚朝上、一枚朝下”的概率。 ( )例、袋中装有6个白球,3个黑球。从中任取3个球,计算取出的3个球都是白球的概率。 ( )四、概率的运算(一)事件之间的关系l、事件的包含与相等如果事件A发生必然导致事件B发生,则称事件B包含事件A。记作:AB或BA如,若用表示“优秀的公务员”,用表示“称职的公务员”,则事件A包含于事件B。如果AB,同时BA,那么,事件A与事件B相等,记作:A=B2、事件和事件A与事件B至少有一个发生所构成的事件C, 称作A与B的事件和, 记作:C=AB或C=AUB例如,若用表示“具有硕士学位”,用表示“具有博士学位”,用表示“具有本科以上学历”,则事件为事件A与事件B的事件和。3、事件积事件A与事件B同时发生所构成的事件C,称作A与B的事件积,记作:C=AB或C=AB例如,合格的领导干部必须德才兼备。若用表示“有德”, 用表示“有才”, 用表示“合格的领导干部”,则事件为事件A与B的事件积。4、互不相容事件若事件A发生必然导致事件B不发生,反之亦然,则称事件A与事件B是互不相容的或互斥的。对于互不相容事件,有:AB(不可能事件)例如,事件“考核成绩优秀”和“考试成绩中等”是互不相容事件。5、对立事件 (逆事件)若事件A与事件B为互不相容事件,且在一次试验或观察中必有其一发生,则称事件A与事件B为对立事件。对于对立事件,有:AB(不可能事件)AB(必然事件)例如,抛掷一枚硬币中的“出现正面”和“出现反面”就是对立的事件。通常把A的对立事件记作。事件之间的关系如下图所示:图3-1-1 事件的关系(二)排列与组合1、乘法原理:一般地,如果完成一件事需要个步骤,其中,做第一步有种不同的方法,做第二步有种不同的方法,做第步有种不同的方法,那么,完成这件事一共有 种不同的方法。2、加法原理:一般地,如果完成一件事有k类方法,第一类方法中有种不同做法,第二类方法中有种不同做法,第k类方法中有种不同的做法,则完成这件事共有 种不同的方法。3、排列考虑顺序(1)重复排列:从个各不相同的元素中任取一个,然后放回去,再取一个,再放回去,一共取出个。可能的取法为:例、某单位的医疗证号码为四位数,该单位最多有多少人? (2)非重复排列:从个各不相同的元素中任取个()。可能的取法为:例、一条航线上共有10个航空站,问该航线上有多少种不同的机票?10×9(3)全排列:个各不相同的元素进行排列,可能的排列数为:4、组合问题不考虑顺序从个各不相同的元素中任取个()的排列数为: 性质:例、从1,2,3,4,5,6,7,8,9中任意选出3个数,使它们的和为偶数,则共有多少种不同的选法? 44 (三)概率的运算1、概率的加法公式(1)简化式若事件A与事件B互不相容,则 推论:如果个事件互不相容,则有:例、袋中装有6个白球,4个黑球。从中任取3个球,计算取出的3个球中至少有2个是白球的概率。解:设事件表示抽到的3个球中有i个白球(i=0,1,2,3),则 显然,与互不相容,根据概率的加法公式有:(2)一般式对于任意事件A与事件B,有:推论:如果事件A、B、C为三个任意事件,则例、据统计,某校学生中父亲具有大学及以上文化程度的占35%,母亲具有大学及以上文化程度的占25%,父母双方都具有大学及以上文化程度的占15%,若从该校学生中任抽一名,问其父母亲中至少有一名具有大学及以上文化程度的概率是多少?解:设=“父亲具有大学及以上文化程度”,=“母亲具有大学及以上文化程度”,则父母亲中至少有一名具有大学及以上文化程度的概率为:35%25%15%45%2、概率的乘法公式若事件A与事件B相互独立,也就是说,如果事件A出现的概率与事件B是否出现是无关的,反之亦然。那么有: 推论:如果个事件相互独立,则有:第二节 随机变量及概率分布一、变量层次根据各种变量的取值及其数学运算特性,可将变量分为1、定类变量最低层次的变量定类变量的取值只有类别属性之分,而无大小、程度之别。性别、民族、出生地、政治面貌等都是定类变量。2、定序变量定序变量的取值除了有类别属性之分外,还有等级、秩序之别。满意度(很满意、一般、不满意)、文化程度(文盲、小学、初中、高中、大学)、社会地位(上等、中等、下等)等都是常见的定序变量。3、定距变量定距变量的取值除有类别、次序属性之外,取值之间的距离还可用标准化的距离去量度。如心理学上的智商(IQ)。4、定比变量年龄、销售额、利润额等都是定比变量。5、变量层次的比较(1)根据数学运算特性,可以对变量层次作出对比,具体见下表 数学运算特性 变量层次 , , ×,÷定类变量定序变量定距变量定比变量(2)在各种实际变量中,只满足定距要求而不满足定比要求的变量并不多。真正的定距变量大概只有心理学上的智商(IQ)。因此,在实际研究中一般不再区分定距或定比,而是把它们当作一类,统称为定距变量。(3)变量的层次并不是惟一的。事实上,高层次的变量必然可以作为低层次的变量来使用。当然,降低变量的层次一般会使资料的信息使用不完全。二、概率分布随机事件及其概率回答的是随机现象中某一局部的结果。概率分布回答的是随机现象一共有多少种可能的结果,以及每种结果所伴随的概率是多少。要确定随机变量的概率分布,就要确定随机变量有哪些可能的取值,并确定随机变量取各个可能值的概率大小。确定变量取值的基本原则是完备性与互不相容性(互斥性)。若变量的取值满足了完备性和互不相容性,那么,随机变量的各个取值和相应的概率对的集合即为随机变量的概率分布。 概率分布(理论分布) 频率分布(经验分布)随机变量根据其取值是否连续,可分为离散型随机变量和连续型随机变量。 (一)离散型随机变量的概率分布离散型随机变量的概率分布可作以下表达: i=1,2,它表示随机变量取值的概率为。至于具体是什么?等于多少?要根据随机现象的实际情况而定。但必须知道了全部值及其对应的概率值,概率分布才是确定的。可通过如下概率分布表的形式来直观地表示离散型随机变量的概率分布。 有了概率分布表,不仅可知道随机变量的所有可能取值及其对应的概率,还可计算出随机变量落在某一区间内的概率或小于某一取值的概率等。例如,随机变量的取值在和之间的概率为:概率分布的性质:l、任一取值的概率都是非负的,即 0 (非负性)2、随机变量取遍所有取值,其相应概率总和为l,即 1 (完备性)例、12个零件中有9个为合格品,3个为次品。现用它们来装配机器,若取到次品,则不放回再另取一个,直到取到合格品为止。设“取到合格品以前取出的次品数”,试求的概率分布。解:由题目可知,X的可能取值为0,1,2,3;其相应概率为: P(X=0)=0.75 P(X=1)=0.2045P(X=2)=0.041 P(X=3)=0.0045 X的概率分布为:X0123Pi0.750.20450.0410.0045思考题:1、扔掷二枚骰子,并记录其点数,求:(1)=“点数之和”的概率分布;(2)=“点数之差的绝对值”的概率分布。点数和 2 3 4 5 6 7 8 9 10 11 12 点数之差的绝对值 0 1 2 3 4 5 (二)连续型随机变量的概率分布对于连续型随机变量,有:0因此,应考虑落在某个区间的概率。连续型随机变量的分布密度或概率密度为: ()可见,若把频率看做概率的近似值,则概率密度就相当于频率密度。对于连续型随机变量,只要有了概率密度,就可以通过求解定积分来求出其落在任意两点之间的概率,即:概率密度函数具有以下性质:1、0 (非负性) 2、 (完备性) (三)分布函数除了用概率分布和概率密度来分别研究离散型变量和连续型随机变量的分布特征外,还可用一个统一的量来研究这两种不同类型的变量。这就是分布函数。分布函数定义为:P() ( 类似于向上累计频率 )它表示随机变量从到所研究的点的概率总和。对于离散型随机变量,若其概率分布是已知的,那么,按概率加法原理有:P()对于连续型随机变量,若已知它的概率密度,那么根据微积分的知识可得:P()分布函数和概率分布是一一对应的关系。第三节 数学期望和方差一、数学期望(总体均值)随机变量的集中趋势若离散型随机变量的概率分布为: 则的数学期望E()为:E() ( )若连续型随机变量的概率密度为,则的数学期望E()为:E()通过数学期望,可以对不同分布进行比较。例、有甲、乙两名选手,根据已往经验,他们夺取奖牌的概率如下表所示:甲: (名次)1 2 3P0.3 0.3 0.4乙:(名次)1 2 3P0.2 0.5 0.3 E(1)=1×0.32×0.43×0.3 =2.1 E(2)=1×0.22×0.53×0.3=2.1 两人的平均水平是一样的。数学期望的性质:(l) 常数的数学期望等于该常数本身,即E()。(2) 随机变量与常数之和的期望,等于随机变量的期望与该常数之和。E()E()(3) 常数与随机变量乘积的数学期望,等于这个常数与随机变量期望的乘积。E()E()(4) 综合以上两点有:E(b)E()b(5) 两个随机变量之和的数学期望,等于它们的数学期望之和。E()=E()十E()推广:有限个随机变量之和的数学期望,等于它们的数学期望之和。(6) 两个独立随机变量乘积的数学期望,等于它们的数学期望之积。E()=E()E()推广:有限个独立随机变量乘积的数学期望,等于它们的数学期望的乘积。E()=E(1)E(2)E(n) 二、方差与标准差随机变量的离散趋势离散型随机变量的方差D()为:D()( )连续型随机变量的方差D()为:D()根据方差和标准差的定义可知:方差和标准差永远都是正值。方差和标准差都反映了随机变量的可能值偏离数学期望的程度。方差值越小,密集的程度越高,变量的分布越集中;反之,方差值较大,则分散程度越高,变量的分布越分散。计算方差除了使用基本公式D()外,还常常使用简化的公式:方差的性质:(1)常数的方差永远为零,即D()0(2)随机变量与常数之和的方差等于随机变量的方差。D()D()(3)常数与随机变量乘积的方差等于该常数的平方与随机变量方差的乘积。 (4)两个独立随机变量之和的方差等于它们的方差和。D()=D()十D()推广:有限个独立随机变量之和的方差等于它们的方差和。D(i)=D(i)第四节 常用的离散型分布一、二项分布(一)二点分布只有两类取值的二分变量观察一次的分布为了便于处理,实际中常把二分变量的两种结果分别用代码来表示,习惯上用0和1来表示。所以二点分布又叫作01分布,但这里的0和1仅仅是个代码,数值本身并无实际意义。我们往往用表示“所研究的二分变量”,则=1 表示“其中某种结果” =0 表示“其中另一种结果”设其中某种结果出现的概率为p,另一种结果出现的概率为q,即:P(=1)=p P(=0)=q +q=1写成表格形式即得两点分布的分布律为: 0 1P(=) q P二点分布的性质:1、P(=1)0,P(=0)0 2、P(=0)P(=1)=p+q=13、二点分布的期望和方差为:E()=0×q1×p=pD()=E(2)(E)2=pp2pq4、二分变量只是一种虚拟变量,它的取值0和1只是代码,数值本身并无实际意义。(二)二项分布二分变量独立重复地观察次的结果的分布次试验相互独立,指的是试验重复进行次,而各次试验结果互不影响。例、一枚硬币连续扔掷五次,问正面出现次数的概率分布如何?一枚硬币连续扔掷五次,出现正面次数有6种可能的情况:正面出现0次,l次,2次,3次,4次,5次。设每次扔掷中出现正面的概率为,出现反面的概率为。于是有:1、正面出现0次的概率 qqqqq=2、正面出现l次的概率O pqqqqO qpqqqO qqpqq O qqqpqO qqqqp3、正面出现2次的概率OO ppqqqOO pqpqqOO pqqpqOO pqqqpO O qppqqOO qpqpq OO qpqqpOO qqppqOO qqpqpOO qqqpp4、正面出现3次的概率OOO pppqq OOO ppqpqOOO ppqqpOOO pqppqOOO pqpqpOOO pqqpp OOO qpppqOOO qppqpOOO qpqppOOO qqppp5、正面出现4次的概率OOOO ppppq OOOO pppqp OOOO ppqpp OOOO pqppp OOOO qpppp 6、正面出现5次的概率OOOOO ppppp 综合以上情况,得到 =“5次独立试验中正面出现的次数”的分布律为:0 1 2 3 4 5P 如果把独立试验次数推广到次,那么概率公式将有十l个。当很大时,可得如下形式:P()= (=0,1,2, )总结以上讨论,得出二项分布的定义为:如果在相同条件下进行次相互独立的试验,且每次试验只有两种可能的结果:出现或不出现,且在每一次试验中,事件出现的概率,事件不出现的概率。那么,次独立试验中事件出现的次数的概率分布为:P()= (=0,1,2, )二项分布可简写作,其中表示二项分布,和p是二项分布的两个参数。根据变量取值的完备性,必然有: 根据二项分布的分布律,不仅可以知道随机变量的整个概率分布的全貌,而且还可推算出变量取值在某一区间内的概率:1、事件至多出现次的概率为: P(0a)2、事件至少出现次的概率为: P(an)3、事件出现次数不少于,不大于的概率为: P(ab)例、某地区居民中,有10%是少数民族,今随机抽取15人,问:(1)其中恰有3名少数民族的概率是多少?(2)其中少数民族不超过4名的概率是多少?解:设=“所抽15人中少数民族的人数”,则服从二项分布B(15,10%)。 (1)P(=3) = = 0.129(2)P(4) = = 0.2060.3430.2670.1290.043= 0.988例、根据过去的经验,有40%的陆军少校可被提升为中校。已知某集团军有符合条件的少校36人,其中7人是某军校的毕业生,而这7人中有6人得到提升。有没有理由怀疑该军校毕业生得到了特殊的优惠?解:设“这7人中得到提升的人数”,则,于是有: P(=6) = 0.017小概率事件发生,因此,有理由怀疑该军校毕业生得到了特殊的优惠。二项分布具有如下性质:1、二项分布为离散型分布,它共有l个取值。2、和p是二项分布的两个参数。3、二项分布的图形当p=0.5时是对称的。当p0.5时是非对称的,而当愈大时非对称性愈不明显。如下图所示:图3-4-1 二项分布的图形4、二项分布的数学期望E()等于p, 方差D()等于pq。5、二项分布的概率值除了可根据公式直接进行计算外,还可查表求得。二、泊松分布二项分布的极限分布若很大,而p又极小,记p=,p= (为大于0的常数),则有: = = 以为概率值的分布是由法国数学家S.D.泊松(S.D.Poisson)首先发现的,因此称作泊松分布,泊松分布记作P()。它的分布律为: 0 1 2 P() 上述分布律可简写作:P()= =0,1,2,泊松分布是二项分布B(,p)的极限分布。它只有一个参数。泊松分布具有如下性质:1、泊松分布为离散型随机变量的分布。它的取值为零和一切正整数值。2、泊松分布的数学期望和方差都为。即 E()=D()=例、设在1000张某种卡片中共发现错字200个。问每张卡片上错字不超过2个的概率是多少?解:设 =“每张卡片上的错字数目”。根据1000张卡片的统计结果,可知每张卡片上的平均错字数为。因此,随机变量服从参数的泊松分布。根据泊松分布的分布率有:P(2)0.9989因此, 每张卡片上错字不超过2个的概率是0.9989。3、泊松分布的图形是非对称的,但随着的增加,非对称性将逐渐减少。图3-4-2 泊松分布的图形4、泊松分布P()是二项分布的极限分布。但实际表明,当p0.1时,即使n不是很大,这种近似也存在。当n10时,这种近似程度就很好了。5、在离散型分布中,泊松分布的重要性仅次于二项分布,它适合于稀少事件的研究,也就是适合p值很小的情况。例、根据以往经验,某市因闯红灯而被电子眼拍照的车次为每小时0.0625辆。则一天之内电子眼没有拍摄到任何闯红灯车辆的概率是多少?刚好拍摄到1辆、2辆、3辆闯红灯车辆的概率是多少?拍摄到3辆以上闯红灯车辆的概率又是多少?解:设 =“电子眼拍摄到的闯红灯的车辆数”。则。 P(0)0.2231 P(1)0.3347P(2)0.251 P(3)0.1255P(3)1P(0)P(1)P(2)P(3) 10.22310.33470.2510.12550.0657第五节 正态分布一、正态分布最常见、最重要的连续型分布正态分布的概率密度函数为: , x其中,3.14,e2.72。正态分布记为。可以验证:(1)0 (非负性) (2) (完备性)正态分布的概率密度曲线如图所示:正态分布具有如下特征:1、正态分布密度曲线是单峰、对称的“钟形”曲线。它在处有一个最高点,且以为对称轴。当向左、向右远离时,曲线无限逼近横轴(轴),形成以轴为渐近线的“中间高,两边低”的“钟形”曲线。2、正态分布的众值、中位值和均值三者是重叠的。3、正态分布曲线在处达到峰值,在处有拐点。这条曲线与横轴之间的面积等于1。而且,曲线下与之间的面积为0.6826,与之间的面积为0.9545,与之间的面积为0.9973。如图所示:4、正态分布由参数和完全确定。其中是正态分布的数学期望,它决定正态分布的位置,在一定的情况下,增大则图形右移,减小则图形左移。是正态分布的标准差,它反映变量分布的分散程度,决定正态分布曲线的形状,决定正态分布曲线的“高矮胖瘦”。在一定的情况下,越小则密度曲线越尖越瘦高,越大则密度曲线越平坦、越矮胖。正态分布具有如下性质:(1)若服从正态分布,则对任意常数,也服从正态分布。(2)若皆服从正态分布,且相互独立,则对任意常数(不全为0),也服从正态分布。推广:若皆服从正态分布,且相互独立,则对任意个常数(不全为0),也服从正态分布。二、标准正态分布标准正态分布的概率密度为:标准正态分布是一般正态分布的一个特殊情况。标准正态分布的曲线是惟一的。对于一般的正态随机变量,经过标准分转变,都将成为惟一的标准正态分布。标准正态分布的概率密度曲线如下图所示:标准正态分布的性质:1、标准正态分布以=0(纵轴)为对称轴;2、标准正态分布曲线下在1与1之间的面积与一般正态分布在与之间的面积相同,都为0.6826;在2与2之间的面积与在与之间的面积相同,都为0.9545;在3与3之间的面积与在与之间的面积相同,都为0.9973。如图所示:3、标准正态分布的图形是惟一的。因此,使用标准正态分布已无需自己计算概率值,只要学会查表就行了。三、标准正态分布表的使用标准正态分布的分布函数为:由于标准正态分布以x=0为对称轴,且标准正态分布曲线与横轴所围成的面积为1,因此有:1X轴上任意两点之间曲线下的面积(两点之间的概率)为:例、已知随机变量X,试求概率:(1)P(X1.2) (2)P(X0.5) (3)P(1X1.5)解:(1)P(X1.2)=1=10.8849=0.1151(2) P(X0.5)= P(X0.5)= 1=10.6915=0.3085(3) P(1X1.5)= =0.9332(10.8413)=0.7745例、已知随机变量X,试求概率:(1)P(X3) (2)P(X9) (3)P(4X8)解:(1)P(X3)=1=10.8413=0.1587(2) P(X9)= 1=10.9772=0. 0228(3) P(4X8)= =0.9332(10.6915)=0.6247第六节 大数定理与中心极限定理极限定理一、贝努里大数定理设是次独立观察中事件出现的次数,而是事件在每次观察中出现的概率。那么,对于任意一个正数,有贝努里大数定理说明:在相同条件下进行多次观察,则随机事件的频率有接近它的概率的趋势。这为用抽样成数来估计总体成数奠定了理论基础。二、切贝谢夫大数定理设随机变量相互独立、服从同一分布,且有数学期望及方差,那么,对于任何一个正数,有这里为个随机变量的算术平均值,即切贝谢夫大数定理表明:当试验次数足够大时,个随机变量的平均值趋近于数学期望。因此,在实际中可用抽样的均值作为总体均值的近似值。三、中心极限定理设为独立同分布的随机变量,不管其分布如何,只要数学期望及方差 (i=1,2,.)存在,则对一切有其中,中心极限定理有如下几种等效的表达方法:l、对于上述的随机变量,只要足够大,就有近似地服从标准正态分布,即:2、对于上述的随机变量,只要足够大,有:X3、对于上述的随机变量,只要足够大,有:4、对于上述的随机变量,只要足够大,有:下面通过实例说明中心极限定理中正态分布的形成过程。例、设某单位发给职工的奖金分为两档:4百元和6百元。发4百元的概率为0.7,发6百元的概率为0.3。即职工奖金发放的概率分布表为: 4(百元) 6(百元)P(=)0.7 0.3求的分布。解:1、的分布 4 6 0.7 0.32、由于和都有两种可能的取值,因此有四种可能的取值。即(4,4)、(4,6)、(6,4)、(6,6)。 和相互独立,因此有:将上述概率值写成分布律有: 4+4 4+6 6+4 6+6 0.49 0.21 0.21 0.09合并相同取值可得的概率分布为: 8 10 12 0.49 0.42 0.093、 12 14 16 18 0.343 0.441 0.189 0.0274、 16 18 20 22 24 0.2401 0.4116 0.2646 0.0756 0.00815、 20 22 24 26 28 30 0.16807 0.36015 0.3087 0.1323 0.02835 0.00243中心极限定理告诉我们:随着随机变量数目的增多,的分布越来越接近正态分布,这为未知分布总体的研究奠定了理论基础。因为实际中很多总体分布往往是未知的。根据中心极限定理,二项分布和泊松分布也以正态分布为其极限分布。若将二项分布中的次独立试验看作个独立同分布的0-1分布变量:则二项分布:P()= 中的为次独立试验中个之和。因此,根据中心极限定理,二项分布必然以正态分布为其极限分布。因为二项分布的数学期望E()等于p, 方差D()等于pq,所以有:在实际中,为无穷是做不到。一般来说,只要30就可以了。应注意的是,正态分布可在整个实数范围内()取值,而二项分布的取值范围为正整数()。为了保证正态分布对二项分布有良好的近似性,必须保证正态分布曲线与二项分布曲线有较大面积的重合。为此,要求即 两边平方得 其中 ,所以有 在实际中,常常取保守估计作为用正态分布来近似计算二项分布的条件。若不满足,而又比较大,则应以泊松分布为其极限分布。出于同样的原因,在实际中,常常取保守估计作为用正态分布来近似计算泊松分布的条件。例、某地区居民中结核病患者占0.2%,现从中随机抽查10000人,问其中结核病患者不超过30人的概率是多少?解:设“抽查的10000人中结核病患者的人数”,则。 很大,很小,似乎可用泊松分布来近似,但由于,用泊松分布来近似也有一定难度,因此,可用正态分布来近似计算。 标准化得:所以有:第七节 常用统计分布一、分布分布是由海尔墨特(Hermert)和卡尔·皮尔逊(k.Pearson)分别于1875年和1900年导出的。它是从正态分布派生出来的一个分布。实际中的很多分布都可以用分布来近似。设随机变量相互独立,且都服从分布,则它们的平方和的分布密度为: 通常把这个分布叫做自由度的分布,并记作()。若随机变量相互独立,且服从同一正态分布。则随机变量 服从自由度为的分布。 由图可见,随着自由度的增加,图形渐趋对称。 若随机变量,则有 二、t分布 (“学生分布”)设随机变量与独立,且服从标准正态分布,服从自由度为的分布,则随机变量的分布密度为:通常把这种分布叫做自由度为的t分布,该分布是由哥塞特于1908年在一篇署名为“学生”的论文中首次提出的,因此又称为“学生”分布。若随机变量,则有 t分布的分布曲线类似于标准正态分布的曲线,它们都是关于z=0对称的钟形曲线,取值范围也都在与+之间。但是,t分布的图形显得较为矮胖。随着自由度不断增大,t分布越来越趋近于标准正态分布。三、F分布设随机变量与独立,且都服从由自度分别为与的分布,则随机变量 的分布密度为: 通常把这种分布叫做自由度为的分布,并记作,其中是分子的自由度,叫做第一自由度;是分母的自由度,叫做第二自由度。分布为非对称分布。