分布函数的计算.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《分布函数的计算.ppt》由会员分享,可在线阅读,更多相关《分布函数的计算.ppt(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1、密度函数和分布函数、密度函数和分布函数2、分布函数的一般计算方法、分布函数的一般计算方法3、标准正态分布的计算方法、标准正态分布的计算方法4、统计工具箱的各种分布计算、统计工具箱的各种分布计算5、统计推断原理、统计推断原理6、非参数统计分析、非参数统计分析7、习题、习题第三章第三章分布函数的计算分布函数的计算分布函数的计算在整个信息统计分析应用中起着基础性的作用,分布函数的计算在整个信息统计分析应用中起着基础性的作用,当我们建立了某个统计模型后,会产生很多的统计量,用它们对某当我们建立了某个统计模型后,会产生很多的统计量,用它们对某个假设进行检验。这时必须知道这些统计量的分布,某一点的概率
2、、个假设进行检验。这时必须知道这些统计量的分布,某一点的概率、某概率的分位点。在学习概率论时我们已经知道用查表的方法进行某概率的分位点。在学习概率论时我们已经知道用查表的方法进行计算。本章介绍分布函数的计算方法,以及如何用计算。本章介绍分布函数的计算方法,以及如何用MATLAB的统计的统计工具箱计算各种分布的概率与分位点的计算。工具箱计算各种分布的概率与分位点的计算。1、密度函数和分布函数、密度函数和分布函数密度函数和分布函数是反映随机变量的总体规律的函数,当密度函数和分布函数是反映随机变量的总体规律的函数,当一个变量一个变量X在没有抽样之前不知会有什么结果,但结果的范围是在没有抽样之前不知会
3、有什么结果,但结果的范围是知道的,这样的变量称为随机变量。随机变量可以分为:知道的,这样的变量称为随机变量。随机变量可以分为:(1)连续型随机变量)连续型随机变量(2)离散型随机变量)离散型随机变量(1)连续型随机变量)连续型随机变量随机变量的结果空间是实数,例如服从(随机变量的结果空间是实数,例如服从(0,1)上的均匀分布随)上的均匀分布随机数、人体身高随机数等。机数、人体身高随机数等。例例3.1.1续型随机变量的例子:续型随机变量的例子:大学生男性身高大学生男性身高X、随机抽一个大学生量其身高得随机变量的、随机抽一个大学生量其身高得随机变量的一个实现,例如一个实现,例如x=1.75米。则米
4、。则X是一个连续型的随机变量。这种是一个连续型的随机变量。这种随机变量服从正态分布。正态分布是统计分析中极其重要的分布。随机变量服从正态分布。正态分布是统计分析中极其重要的分布。(2)离散型随机变量)离散型随机变量当一个随机变量当一个随机变量X的结果空间有有限个元素或可列个元素时,的结果空间有有限个元素或可列个元素时,称该随机变量为离散型随机变量。称该随机变量为离散型随机变量。例例3.1.2离散型随机变量的例离散型随机变量的例设某汽车站设某汽车站7点到点到7点点05分等车的人数为一变量分等车的人数为一变量X,显然,显然X可取可取值值0,1,2,3,。则。则X是一个离散型的随机变量。事实上这种随
5、是一个离散型的随机变量。事实上这种随机变量称为服从泊松分布规律的随机变量。机变量称为服从泊松分布规律的随机变量。投一硬币,正面为投一硬币,正面为1,反面为,反面为0。记该随机变量为。记该随机变量为X,则其结果,则其结果空间为空间为0,1。也是一个离散随机变量。也是一个离散随机变量。(一)密度函数和分布律(一)密度函数和分布律随机变量随机变量X在没有发生时我们不知到,也不能预测其结果,看在没有发生时我们不知到,也不能预测其结果,看似随机变量没有规律。但是我们进行大量抽样或实验时,却可以看似随机变量没有规律。但是我们进行大量抽样或实验时,却可以看见明显的规律。见明显的规律。例:例:对男性大学生随机
6、抽检,共抽对男性大学生随机抽检,共抽400名大学生测量其身高。将身名大学生测量其身高。将身高区间(高区间(1.50,2.1)分划分成若干段,计算每段学生身高的数量,)分划分成若干段,计算每段学生身高的数量,并作直方图。并作直方图。%第三章,例第三章,例R=normrnd(1.7,0.1,400,1);%产生正态分布的随机数产生正态分布的随机数histfit(R,12)%作直方图并建立拟合曲线作直方图并建立拟合曲线从例可以看出,大学生身高的一些特点。从例可以看出,大学生身高的一些特点。1)首先身高在平均值附近的人数特别多。)首先身高在平均值附近的人数特别多。2)从直方图中我们可以看出身高的趋势具
7、有对称性。)从直方图中我们可以看出身高的趋势具有对称性。3)离平均值越远数量越少。)离平均值越远数量越少。这是典型的正态分布的特点。可以想象当我们抽样量增大应该这是典型的正态分布的特点。可以想象当我们抽样量增大应该有一个理论函数作为极限。有一个理论函数作为极限。密度函数(密度函数(inv)称这个理论函数为连续型随机变量的密度函数,上图中的红线所显称这个理论函数为连续型随机变量的密度函数,上图中的红线所显示的就是密度函数的图形。在示的就是密度函数的图形。在MATLAB这密度函数用这密度函数用inv来表示。来表示。正态分布的密度函数正态分布的密度函数p 表达式为:表达式为:其中参数:其中参数:为平
8、均值。是随机变量中心趋势的描述。:为平均值。是随机变量中心趋势的描述。:为标准差。是随机变量离散程度的描述。:为标准差。是随机变量离散程度的描述。分布律(分布律(inv)对于离散型随机变量,分布律相当于连续型随机变量的密度函数。对于离散型随机变量,分布律相当于连续型随机变量的密度函数。例:作泊松分布随机变量的分布律图形。例:作泊松分布随机变量的分布律图形。这里这里为参数,表示随机变量的平均值和方差。为参数,表示随机变量的平均值和方差。设平均值为设平均值为5,算出,算出0到到10的分布律的分布律X=0:10;Y=poissinv(X,5);%计算泊松分布每点的概率计算泊松分布每点的概率stem(
9、X,Y)%作分布律图形作分布律图形(二)分布函数(二)分布函数cdf分布函数是对密度函数进行积分,其表达式为:分布函数是对密度函数进行积分,其表达式为:分布函数函数具有以下性质:分布函数函数具有以下性质:1)对任意)对任意x有有2)单调不降,)单调不降,利用分布函数我们可以计算随机变量利用分布函数我们可以计算随机变量X落在某一范围的概率,落在某一范围的概率,或者说我们掌握了该随机变量的规律了。或者说我们掌握了该随机变量的规律了。连续型连续型离散型离散型例:分别作出连续型和离散型随机变量的例:分别作出连续型和离散型随机变量的inv和和cdf(1)设男性大学生的身高)设男性大学生的身高X的平均值为
10、的平均值为1.7米,标准差为米,标准差为0.1米。米。作密度函数和分布函数。利用作密度函数和分布函数。利用MATLAB中的正态分布中的正态分布norminv和和normcdf命令进行计算命令进行计算X=linspace(1.4,2.1,100);P=normcdf(X,1.7,0.1);p=norminv(X,1.7,0.1);subplot(1,2,1),plot(X,p),title(身高密度函数身高密度函数)subplot(1,2,2),plot(X,P),title(身高分布函数身高分布函数)(2)设)设X服从均值为服从均值为5的泊松分布,作分布律和分布函数图形。的泊松分布,作分布律和
11、分布函数图形。X=0:10;Y=poissinv(X,5);Y1=poisscdf(X,5)subplot(1,2,1),stem(X,Y),title(泊松分布律泊松分布律)subplot(1,2,2),stairs(X,Y1),title(泊松分布函数泊松分布函数)(三)下侧概率、上侧概率和分位点(三)下侧概率、上侧概率和分位点下侧概率的定义:下侧概率的定义:上侧概率的定义:上侧概率的定义:利用分布函数我们可以计算随机变量利用分布函数我们可以计算随机变量X落在某一范围的概率,落在某一范围的概率,或者说我们掌握了该随机变量的规律了。例如随机变量或者说我们掌握了该随机变量的规律了。例如随机变量
12、X小于分位小于分位点的概率即下侧概率,大于分位点的概率即上侧概率。而随机变量点的概率即下侧概率,大于分位点的概率即上侧概率。而随机变量落入落入x1和和x2之间的概率可用以下公式计算。之间的概率可用以下公式计算。例:男性大学生身高例:男性大学生身高X的平均值为的平均值为1.7米,标准差为米,标准差为0.1米。米。1)计算身高小于)计算身高小于1.8米大于米大于1.6米发生的概率,即随机变量米发生的概率,即随机变量X落入落入区间(区间(1.6,1.8)的概率。)的概率。2)求下侧概率为)求下侧概率为0.95的分位点。的分位点。解:本题利用分布函数进行计算解:本题利用分布函数进行计算P(1.6X1.
13、8)=F(1.8)-F(1.6)%例例3.1.6计算身高小于计算身高小于1.8米大于米大于1.6米发生的概率米发生的概率P=normcdf(1.8,1.7,0.1)-normcdf(1.6,1.7,0.1)计算结果为:计算结果为:P=0.6827X=norminv(0.95,1.70,0.1)%计算下侧概率的分位点计算下侧概率的分位点计算结果为:计算结果为:X=1.8645,即有,即有95%的人身高在的人身高在1.86以下。以下。例:设某车站例:设某车站7:00到到7:05分等车人数为服从泊松分布的随机变分等车人数为服从泊松分布的随机变量量X,均值为,均值为5。求。求1)人数小于等于)人数小于
14、等于12发生的概率。发生的概率。2)人数大于等于)人数大于等于8发生的概率。发生的概率。3)计算上侧概率为)计算上侧概率为0.05的分位点。的分位点。解:本题利用分布函数进行计算解:本题利用分布函数进行计算1)小于)小于12的计算公式为:的计算公式为:P=poisscdf(12,5)%小于小于12的概率的概率计算结果为:计算结果为:P=0.9982)大于)大于8的计算公式为:的计算公式为:1-F(8)P=poisscdf(12,5)%小于小于12的概率的概率3)按题义命令为:按题义命令为:x=poissinv(0.95,5)计算结果为:计算结果为:x=9(一)(一)积分计算的一般方法积分计算的
15、一般方法分布函数的一般形式为:分布函数的一般形式为:问题实际归为求积分,问题实际归为求积分,当当密密度度函函数数非非常常复复杂杂或或用用解解析析方方法法不不能能积积分分时时,我我们们常常常常使使用用数值积分的方法来处理。数值积分的方法来处理。(3.2.1)2、分布函数的一般计算方法、分布函数的一般计算方法其基本思想是,用简单函数来代替复杂的被积函数。例如在被其基本思想是,用简单函数来代替复杂的被积函数。例如在被积函数的定义域内选一系列的点。积函数的定义域内选一系列的点。然后求在该点处的函数值然后求在该点处的函数值定义插值多项式如下:定义插值多项式如下:(3.1.2)其中其中这里这里称为拉格朗日
16、插值多项式称为拉格朗日插值多项式,其具有以下性质:,其具有以下性质:1)。2)在上点与点之间为线性函数。在上点与点之间为线性函数。显然有以下关系式成立:显然有以下关系式成立:(3.1.3)其中其中是误差函数。是误差函数。可以证明,当可以证明,当有有n+1阶有界导数时,阶有界导数时,(3.1.4)当当时,时,即当,即当是不高于是不高于n阶的多项式时,有阶的多项式时,有对对(3.1.3)两边积分,我们有两边积分,我们有(3.1.5)从而我们可以得到积分的一般近似公式从而我们可以得到积分的一般近似公式:(3.1.7)其中,其中,(3.1.7)称为称为NewtonCotes型积分公式,型积分公式,而而
17、Ai 为为Cotes系数,其误差为系数,其误差为这样我们就将一个复杂的积分问题,近似地用代数和的形式来这样我们就将一个复杂的积分问题,近似地用代数和的形式来代替了。关于计算的精度我们可以通过代替了。关于计算的精度我们可以通过 E来估计。来估计。目前一些目前一些数学软件如数学软件如Mathematica等,可以方便地获取等,可以方便地获取Cotes系数,系数,x0 x1x2x3x4f(x2)f(x4)红色折线为红色折线为拉格朗日拉格朗日插值插值多项式多项式l l代数精度概念代数精度概念定定义义3.1.1若若某某个个求求积积公公式式对对于于小小于于等等于于n的的多多项项式式均均能能准准确确地地成成
18、立立,但但对对n+1次次多多项项式式则则不不能能。则则称称该该求求积积公公式式具具有有n次次代数精度。代数精度。例例3.1.1梯形求积公式梯形求积公式当当 时,左边时,左边=右边。准确地成立。右边。准确地成立。当当时,也准确成立。时,也准确成立。当当时时,而,而所以梯形求积公式具有一次代数精度。所以梯形求积公式具有一次代数精度。例例利用梯形、抛物线及利用梯形、抛物线及NewtonCotes求积公式求积公式(n=7)计算)计算解:(解:(1)梯形求积公式)梯形求积公式Cotes系数为系数为1/2,1/2,(2)抛物线求积公式)抛物线求积公式Cotes系数为系数为1/6,4/6,1/6(3)取)取
19、7个点个点Cotes系数为系数为41/840,9/35,9/280,34/105,9/280,9/35,/41/840复合求积公式复合求积公式对对于于一一个个求求积积公公式式,我我们们要要求求它它们们的的算算法法稳稳定定并并收收敛敛,但但不不幸幸的的是是NewtonCotes求求积积公公式式并并不不稳稳定定,在在某某些些情情况况下下计计算不收敛。算不收敛。例例讨论函数讨论函数在区间在区间-1,1,用,用Cotes系系数计算的收敛问题。数计算的收敛问题。如用如用 Newton-Cotes求积公式,则在该区间不收敛。请见以求积公式,则在该区间不收敛。请见以下结果下结果n=1时时NC=0.07692
20、n=2时时NC=1.35897n=10时时NC=0.93466n=40时时NC=-4912.42显然显然NewtonCotes求积公式有致命的弱点。求积公式有致命的弱点。为为改改善善求求积积公公式式,我我们们使使用用复复合合求求积积公公式式。其其基基本本思思想想是是把把积积分分区区间间分分成成若若干干小小区区间间,每每个个小小区区间间中中用用次次数数不不高高的的插插值值多项式近似逼近。多项式近似逼近。1)复合梯形求积公式)复合梯形求积公式对区间对区间a,bn等份,基点等份,基点对每个小区间用梯形求积公式,则对每个小区间用梯形求积公式,则Tn 称称为为复复合合梯梯形形公公式式。为为便便于于按按迭
21、迭代代计计算算,在在原原有有的的分分划划基基础上把区间分为础上把区间分为2n等分,每个小区使用梯形公式,则有等分,每个小区使用梯形公式,则有这里这里2)复合抛物线求积公式)复合抛物线求积公式复复合合抛抛物物线线求求积积公公式式具具有有比比复复合合梯梯形形求求积积公公式式更更快快的的收收敛敛速速度度。抛抛物物线线公公式式用用到到了了区区间间的的中中点点,所所以以对对区区间间a,b进行划分时应该分成偶数个小区间。进行划分时应该分成偶数个小区间。令令n=2m,m为正整数,在每个小区间为正整数,在每个小区间 上用抛物线公式上用抛物线公式从而从而3)步长的自动选择与停止准则步长的自动选择与停止准则在在实
22、实际际计计算算中中,往往往往是是先先给给出出误误差差精精度度,在在保保证证精精度度的的前前提提下,没有必要将区间无限的分下去。下,没有必要将区间无限的分下去。假设给出的误差精度为假设给出的误差精度为,若,若则对区间划分到则对区间划分到 2n等分即告停止。等分即告停止。例例对对于于误误差差为为0.000001,我我们们来来看看用用复复合合梯梯形形积积分分公公式式和和复复合抛物线求积公式计算结果合抛物线求积公式计算结果复合梯形求积公式的结果复合梯形求积公式的结果结果为:结果为:n=12t=0.5496878eps=0.0004596结果为:结果为:n=24t=0.54927516eps=0.000
23、4126结果为:结果为:n=48t=0.54933891eps=0.0000638结果为:结果为:n=96t=0.54935496eps=0.0001604结果为:结果为:n=192t=0.54936892eps=4.01210-6结果为:结果为:n=384t=0.54935997eps=1.003210-6结果为:结果为:n=768t=0.54936022eps=2.50810-7复合抛物线求积公式的结果复合抛物线求积公式的结果结果为:结果为:n=12t=0.54036028eps=0.1036734结果为:结果为:n=24t=0.54913762eps=0.0087778结果为:结果为:n
24、=48t=0.549360162eps=0.0002225结果为:结果为:n=96t=0.54936031eps=1.42910-7l高斯(高斯(Gauss)型求积公式)型求积公式我我们们已已经经知知道道用用NowtonCotes系系数数来来进进行行近近似似积积分分,其其一一般公式为:般公式为:其其基基点点是是等等距距离离的的,且且代代数数精精度度最最多多仅仅为为n+1,并并且且对对于于某某些些积积分分步步收收敛敛。能能否否通通过过改改变变基基点点的的距距离离来来提高计算的精度和稳定性呢?回答是肯定的。提高计算的精度和稳定性呢?回答是肯定的。定定义义3.1.2如如果果区区间间a,b的的一一组组
25、基基点点能能够够使使得得插插值值求求积积公公式式具具有有2n+1次次代代数数精精度度,则则称称其其为为高高斯斯型型插插值值求求积公式,其基点称为高斯点,而系数积公式,其基点称为高斯点,而系数Ai则称为高斯系数。则称为高斯系数。高斯点与正交多项式的关系高斯点与正交多项式的关系定理定理是区间是区间a,b上的高斯点的上的高斯点的充分必要条件为多项式充分必要条件为多项式是区间是区间a,b上的上的n+1次正交多项式。次正交多项式。例例3.1.6我们仍然来看前面的例子,对积分我们仍然来看前面的例子,对积分利用高斯插值公式进行近似计算。利用高斯插值公式进行近似计算。解:这里我们取解:这里我们取35个高斯点进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布 函数 计算
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内