《概率论与数理统计课件(中国矿业大学)第五章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计课件(中国矿业大学)第五章.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章大数定律与中心极限定理 一、大数定律一、大数定律 二、中心极限定理二、中心极限定理1本章是关于随机变量序列的极限理论。本章是关于随机变量序列的极限理论。目的目的是从理论上对第一章中提出的是从理论上对第一章中提出的“频率的频率的稳定性稳定性”给出严格的数学证明。给出严格的数学证明。大数定律大数定律:对于随机变量序列:对于随机变量序列描述其平均值描述其平均值在在什么条件什么条件下以下以什么形什么形式式呈现出稳定性。呈现出稳定性。2中心极限定理中心极限定理:对于随机变量序列:对于随机变量序列其部分和其部分和在在什么条件什么条件下下以正态分布为极限以正态分布为极限分布。分布。3大数定律 第五章
2、第一节一、一、切比雪夫切比雪夫Chebyshev不等式不等式二、几个常见的大数定律二、几个常见的大数定律4定义定义1 1依概率收敛于依概率收敛于a ,记为,记为设随机变量序列设随机变量序列有有:则称则称,如果存,如果存在常数在常数 a,使得对于任意,使得对于任意5请注意请注意:6或或不等式不等式成立,成立,则称此式为则称此式为切比雪夫不等式。切比雪夫不等式。存在,则对任意存在,则对任意证明证明 设设 X 为连续性(离散型类似),其密度为为连续性(离散型类似),其密度为设随机变量设随机变量X 的数学期望的数学期望命题命题 (切比雪夫切比雪夫Chebyshev不等式)不等式)7则则注:注:Cheb
3、yshev不等式不等式对随机变量在以对随机变量在以的一个的一个邻域外取值的概率给出了一个上界邻域外取值的概率给出了一个上界为中心为中心8可见可见D(X)越小,事件越小,事件的概率越接近的概率越接近1 1。X 的值密集在其数学期望附近的概率越大。的值密集在其数学期望附近的概率越大。据此进行的概率估计虽然精度不是很高(所得据此进行的概率估计虽然精度不是很高(所得结果比较保守),但它的最大优点是这种估计在不结果比较保守),但它的最大优点是这种估计在不知道分布的情况下也可进行,相对而言有较宽的适知道分布的情况下也可进行,相对而言有较宽的适用面。用面。9例如:例如:对未知分布对未知分布X,取,取若若10
4、例例1 1 一电网有一电网有1 1万盏路灯,万盏路灯,晚上每盏灯开的概率为晚上每盏灯开的概率为0.7.0.7.求同时开的灯数在求同时开的灯数在6800至至7200之间的概率至少为多少之间的概率至少为多少?解解 设设X 为同时开的灯数。为同时开的灯数。用切比雪夫不等式用切比雪夫不等式11已知正常男性成人血液中,每一毫升白细胞数已知正常男性成人血液中,每一毫升白细胞数解解 设每毫升白细胞数为设每毫升白细胞数为X依题意,依题意,EX=7300,DX=7002所求为所求为由切比雪夫不等式由切比雪夫不等式估计每毫升白细胞数在估计每毫升白细胞数在 5200 52009400 9400 之间的概率之间的概率
5、.平均是平均是73007300,均方差是,均方差是700700,利用切比雪夫不等式利用切比雪夫不等式例例2 2即每毫升白细胞数在即每毫升白细胞数在5200-94005200-9400之间的概率不小于之间的概率不小于8/98/9。12大数定律的客观背景大数定律的客观背景大量的随机现象中平均结果的稳定性大量的随机现象中平均结果的稳定性 大量抛掷硬币大量抛掷硬币正面出现频率正面出现频率字母使用频率字母使用频率生产过程中的生产过程中的废品率废品率13几个常见的大数定律几个常见的大数定律定理定理1 1(切比雪夫大数定律)(切比雪夫大数定律)则则即对任意的即对任意的 0,设设 X1,X2,是一列相互独立的
6、随机变量序列,是一列相互独立的随机变量序列,它们都有相同的数学期望它们都有相同的数学期望证明证明14由切比雪夫不等式得:由切比雪夫不等式得:所以所以其其取值接近于其数学期望取值接近于其数学期望的概率接近于的概率接近于1.1.当当n充分大时,充分大时,差不多不再是随机的了,差不多不再是随机的了,注:注:15定理定理2 2(辛钦定律辛钦定律)且具有相同的数学期望且具有相同的数学期望辛钦设随机变量序列设随机变量序列X1,X2,独立同分布独立同分布,则则辛钦大数定律中,随机变量的方差可以不存在,只要辛钦大数定律中,随机变量的方差可以不存在,只要独立同分布就可以了。独立同分布就可以了。16定理定理3 3
7、(伯努利大数定律)(伯努利大数定律)P是事件是事件A发生的概率,则对任给的发生的概率,则对任给的 0,有,有或或设设nA是是n重贝努里试验中事件重贝努里试验中事件A发生的次数,发生的次数,即即证明证明 引入随机变量引入随机变量试验中A发生,试验中A不发生,17显然显然且且又由于各次试验相互独立,所以又由于各次试验相互独立,所以独立同分布独立同分布,则由则由辛钦大数定律辛钦大数定律可得可得18 其中其中切比雪夫大数定律切比雪夫大数定律说明了说明了平均值具有稳平均值具有稳定性定性;伯努利大数定律伯努利大数定律以严格的数学形式表达了以严格的数学形式表达了频频率稳定于概率率稳定于概率的事实;而的事实;
8、而辛钦大数定律辛钦大数定律则说明在实则说明在实际问题中际问题中“平均数法则平均数法则”的合理性的合理性。大数定律的本质特征是:大量独立随机变量在大数定律的本质特征是:大量独立随机变量在变化过程中,它们的变化过程中,它们的算术平均值算术平均值,在在n充分大时将充分大时将依概率收敛于一个确定的常数依概率收敛于一个确定的常数。此外,大数定律是数理统计中参数估计的理论此外,大数定律是数理统计中参数估计的理论基础,为以样本特征去推断相应总体特征提供了理基础,为以样本特征去推断相应总体特征提供了理论依据。论依据。19 例如要估计某地区的平均亩产量。要收割某例如要估计某地区的平均亩产量。要收割某些具有代表性
9、的地块,例如些具有代表性的地块,例如n 块,计算其平均亩块,计算其平均亩产量,则当产量,则当n 较大时,可用它作为整个地区平均较大时,可用它作为整个地区平均亩产量的一个估计。亩产量的一个估计。大数定律大数定律为寻找随机变量的为寻找随机变量的数学期望数学期望提供了提供了一条实际可行的途径。一条实际可行的途径。20例例3 如何测量某一未知的物理量如何测量某一未知的物理量a,使得误差较小?使得误差较小?解解 在相同的条件下测量在相同的条件下测量n 次,其结果为次,其结果为,它们可看成是相互独立、相同分布的,它们可看成是相互独立、相同分布的随机变量,并且有数学期望为随机变量,并且有数学期望为a.于是由
10、辛钦大数定律于是由辛钦大数定律可知,当可知,当时,有时,有因此我们可取因此我们可取 n 次测量值次测量值的算术平均值的算术平均值作为作为a 得近似值,即得近似值,即,当当n充分大时误差很小。充分大时误差很小。21例例4 如何估计一大批产品的次品率如何估计一大批产品的次品率 p?由由伯努利大数定律伯努利大数定律可知,当可知,当 n 很大时,可取频率很大时,可取频率作为次品率作为次品率 p 的估计值。的估计值。22 大数定律以严格的数学形式表达了随机大数定律以严格的数学形式表达了随机现象最根本的性质之一:现象最根本的性质之一:平均结果的稳定性平均结果的稳定性23作作 业业P126P126127 1
11、27 习题习题5.15.12 2,7 724中心极限定理 第五章 第二节中心极限定理中心极限定理:研究在适当的条件下,独立随机变量研究在适当的条件下,独立随机变量部分和部分和 的分布收敛于正态分布的问题。的分布收敛于正态分布的问题。25中心极限定理的中心极限定理的客观背景客观背景 在实际问题中,常常需要考虑许多随机因素所在实际问题中,常常需要考虑许多随机因素所产生总影响。产生总影响。例如:炮弹射击的落点与目标的偏差,就受到例如:炮弹射击的落点与目标的偏差,就受到许多随机因素的影响。如:许多随机因素的影响。如:对我们来说重要的是这些随机因素的总影响。对我们来说重要的是这些随机因素的总影响。瞄准时
12、的误差;瞄准时的误差;空气阻力所产生的误差;空气阻力所产生的误差;炮弹或炮身结构所引起的误差等等。炮弹或炮身结构所引起的误差等等。26 自从自从高斯高斯指出指出测量误差服从正态分布测量误差服从正态分布之后,之后,人们发现,正态分布在自然界中极为常见。人们发现,正态分布在自然界中极为常见。观察表明,如果一个随机变量受到大量相互独观察表明,如果一个随机变量受到大量相互独立的因素共同影响,且没有一个因素起主导作用,立的因素共同影响,且没有一个因素起主导作用,那么这种随机变量往往服从或近似服从正态分布。那么这种随机变量往往服从或近似服从正态分布。在概率论中,习惯于把和的分布收敛于正态分在概率论中,习惯
13、于把和的分布收敛于正态分布这一类定理都叫做中心极限定理。我们只讨论几布这一类定理都叫做中心极限定理。我们只讨论几种简单情形。种简单情形。27定理定理1 1(独立同分布的中心极限定理)(独立同分布的中心极限定理)且具有相同的期望和方差且具有相同的期望和方差则对任意实数则对任意实数x,有有设设 为一列独立同分布的随机变量,为一列独立同分布的随机变量,即即,或,或28例例1 1 某人要测量甲、乙两地之间的距离。某人要测量甲、乙两地之间的距离。限于测量限于测量工具,分成工具,分成 1200 段独立测量。段独立测量。每段测量误差(单位每段测量误差(单位厘米)服从于(厘米)服从于(-0.5,0.5)上的均
14、匀分布。求总距离误上的均匀分布。求总距离误差的绝对值超过差的绝对值超过20厘米的概率。厘米的概率。解解 设第设第k 段的测量误差为段的测量误差为且且是独立同分布的随机变量。且是独立同分布的随机变量。且29累计误差即总距离误差为累计误差即总距离误差为由由定理定理1可得可得30定理定理2 2(棣莫佛棣莫佛-拉普拉斯定理拉普拉斯定理)De Moivre-LaplaceDe Moivre-Laplace设随机变量设随机变量 服从参数为服从参数为的二项分布的二项分布则对任意的则对任意的x,有,有即即或或33所以所以其中其中相互独立,且都服从(相互独立,且都服从(0-1)分布。)分布。由由独立同分布的中心
15、极限定理独立同分布的中心极限定理可得可得证证 因为因为34推论:推论:设随机变量设随机变量当当n充分大时有:充分大时有:这个公式给出了这个公式给出了n 较大时二项分布的概率计算方法。较大时二项分布的概率计算方法。36 例题例题 某校有学生某校有学生5000人,有一个开水房,由于每天人,有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向学校总务处提议增设水龙头。为此校学生会特向学校总务处提议增设水龙头。如经调查,发现傍晚如经调查,发现傍晚5点每个学生一般有点每个学生一般有1的时间的时间要占用一个水龙头,现有水龙头数量
16、为要占用一个水龙头,现有水龙头数量为45个,请问:个,请问:1未新装水龙头前,拥挤的概率是多少?未新装水龙头前,拥挤的概率是多少?2需至少要装多少个水龙头,才能以需至少要装多少个水龙头,才能以95以上以上的概率保证不拥挤?的概率保证不拥挤?37解解 1.设学生同时用水龙头数为设学生同时用水龙头数为X,则,则我们采用近似计算我们采用近似计算拥挤的概率竟达到拥挤的概率竟达到0.76110.7611。1未新装水龙头前,拥挤的概率是多少?未新装水龙头前,拥挤的概率是多少?由由德莫佛德莫佛-拉普拉斯拉普拉斯定理得定理得38解解 2.要求要求m,使得,使得 即即查表得查表得故需要装故需要装6262个水龙头
17、。个水龙头。由单调性可求得由单调性可求得2需至少要装多少个水龙头,才能以需至少要装多少个水龙头,才能以95以上以上的概率保证不拥挤?的概率保证不拥挤?39例例3 报童沿街向行人兜售报纸,假设每位行人买报报童沿街向行人兜售报纸,假设每位行人买报的概率为的概率为0.2,且他们是否买报是相互独立的。求报童且他们是否买报是相互独立的。求报童向向100位行人兜售之后,卖掉位行人兜售之后,卖掉1530份报纸的概率。份报纸的概率。解解 设报童卖掉报纸的份数为设报童卖掉报纸的份数为X,41例例4 有有100100台车床彼此独立地工作。每台车床的实台车床彼此独立地工作。每台车床的实际工作时间占全部工作时间的际工
18、作时间占全部工作时间的80,求下列事件的,求下列事件的概率。概率。1、任一时刻有、任一时刻有7086台车床工作。台车床工作。2、任一时刻有、任一时刻有80台以上车床工作。台以上车床工作。解解 设任一时刻工作的车床台数为设任一时刻工作的车床台数为X。42例例5 某单位有某单位有200200台电话分机,每台分机有台电话分机,每台分机有5%的时间的时间要使用外线通话。假定每台分机是否使用外线是相互独要使用外线通话。假定每台分机是否使用外线是相互独立的,问该单位总机要安装多少条外线,才能以立的,问该单位总机要安装多少条外线,才能以90%以以上的概率保证分机用外线时不等待?上的概率保证分机用外线时不等待
19、?解解 设有设有X 部分机同时使用外线,则有部分机同时使用外线,则有设有设有N 条外线。由题意有条外线。由题意有由德莫佛由德莫佛-拉普拉斯定理得拉普拉斯定理得其中其中43故故 N 应满足条件应满足条件44例例7 利用利用 契比雪夫不等式契比雪夫不等式 中心极限定理中心极限定理分别确定投掷一枚均匀硬币的次数,使得出现分别确定投掷一枚均匀硬币的次数,使得出现“正面正面向上向上”的频率在的频率在0.4到到0.6之间的概率不小于之间的概率不小于0.9。解解 设设 X 表示正面出现的次数(表示正面出现的次数(n 次试验)次试验)利用契比雪夫不等式利用契比雪夫不等式47由契比雪夫不等式由契比雪夫不等式所以所以 利用中心极限定理利用中心极限定理48因为因为由德莫佛由德莫佛-拉普拉斯定理得拉普拉斯定理得49 切比雪夫不等式得到的下界是比较粗糙的。但由切比雪夫不等式得到的下界是比较粗糙的。但由于其要求低,因而在理论和实际中仍有许多应用。于其要求低,因而在理论和实际中仍有许多应用。结果表明,用切比雪夫不等式进行的概率估计结果表明,用切比雪夫不等式进行的概率估计所需试验次数比利用中心极限定理的结果要多。所需试验次数比利用中心极限定理的结果要多。?50作作 业业P130 P130 习题习题5.25.21 1,3 3,7 752
限制150内