一些重要的概率分布.ppt
《一些重要的概率分布.ppt》由会员分享,可在线阅读,更多相关《一些重要的概率分布.ppt(50页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、现在学习的是第1页,共50页l1.1 什么是正态分布?l对于连续型随机变量而言,正态分布是最重要的一种概率分布,其形状似“钟型”。l经验表明:对于其值依赖于众多微小因素且每一因素均产生微小的或正或负影响的连续型随机变量来说,正态分布是一个相当好的描述模型。如身高、体重、考试成绩等。现在学习的是第2页,共50页为了方便,通常用:),(2NX表示随机变量X服从正态分布。符号表示随机变量服从什么样的分布;N表示正态分布;,为正态分布的(总体)均值(或期望)和方差。X是一个连续型随机变量,可在区间(,+)内任意取值。现在学习的是第3页,共50页-2268%(近似)3-395%(近似)99.7%(近似)
2、正态曲线下的区域示意图现在学习的是第4页,共50页l 正态分布曲线以均值为中心,对称分布。l 正态分布的概率密度函数呈中间高、两边低,在均值处达到最高,向两边逐渐降低,即随机变量在远离均值处取值的概率逐渐变小。l 正态曲线下的面积约有68%位于 两值之间;约有95%面积位于2之间;约有99.7%的面积位于 3之间。这些区域可用作概率的度量。现在学习的是第5页,共50页l 正态分布可由两个参数,来描述,即一旦知道,的值,就可以根据附录表查到随机变量X落于某一区间的概率值。l 两个(或多个)正态分布随机变量的线性组合仍服从正态分布。该性质很重要,解释如下:l 正态分布的偏度为0,峰度为3。现在学习
3、的是第6页,共50页),(),(22YYXXNYNX令:假定X和Y相互独立,设a、b为常数,考虑线性组合:W=aX+bY 则有:),(2wwNW其中,22222yxwyxwbaba现在学习的是第7页,共50页例:令X表示在曼哈顿非商业区一花商每日出售玫瑰花数量,Y表示在曼哈顿商业区一花商每日出售玫瑰花的数量,假定X和Y均服从正态分布,且相互独立。已知:XN(100,64),YN(150,81),求两天内两花商出售玫瑰花数量的期望和方差。 W=2X+2Y根据上述公式,得: E(W)=2E(X)+2E(Y)=500 Var(W)=4Var(X)+4Var(Y)=580因此,W服从均值为500,方差
4、为580的正态分布,即 WN(500,580)现在学习的是第8页,共50页l由于期望和方差的不同,正态分布之间会存在一定的区别(见下图),如何将其简单化,从而引入标准正态分布。12不同均值,同方差的两个正态分布图现在学习的是第9页,共50页121=2不同均值,不同方差相同均值,不同方差现在学习的是第10页,共50页l如果变量X的均值为,方差为,定义一个新的变量Z,XZ则根据性质5,变量Z的均值为0,方差为1。在统计学中,我们称之为单位或标准正态变量,用符号表示为:)1 ,0( NZ任一给定均值和方差的正态变量都可转化为标准正态变量,将其标准化可以大大简化计算。现在学习的是第11页,共50页l例
5、:变量X表示面包房每日出售的面包量,假定它服从均值为70、方差为9的正态分布,即X(70,9),求任给一天,出售面包数量大于75条的概率。l首先,定义变量Z,Z=(75-70)/31.67l求:P(Z1.67)l查正态分布表得:l P(0Z1.67)=0.4525l则:P(Z1.67)=0.5-0.4525=0.0475l即每天出售面包的数量超过75条的概率为0.0475。现在学习的是第12页,共50页1.6700.45250.0475f(Z)标准正态变量概率密度函数现在学习的是第13页,共50页l引言:样本均值是总体均值的估计量,但是由于样本均值是依靠某一给定样本而定,因此它的值会因随机样本
6、的不同而变化。由此,我们将样本均值看作随机变量,在样本是随机抽取得到的条件下,求样本均值的概率密度函数。l随机抽样:表示总体中每一个个体有同等机会被选入样本。l独立同分布随机变量:由X1、X2,Xn构成容量为n的随机样本Xs,如果所有的Xs是从同一个概率密度(Xi有相同的概率密度函数)中独立抽取得到的,称Xs为独立同分布随机变量。现在学习的是第14页,共50页l例:已知正态分布的均值为10,方差为4,即 N(10,4)。现在从这个正态总体中抽取20个随机样本,每个样本包括20个观察值,对抽取的每一个样本,得到其样本均值,因此,共有20个样本均值。来自N(10,4)的20个样本均值9.641 1
7、0.134 10.040 10.249 9.17410.321 10.480 9.504 11.386 8.6219.740 9.739 9.937 10.184 10.2509.765 10.334 10.410 10.57 10.57 求和=201.05现在学习的是第15页,共50页20个样本的频率分布样本均值范围频数频率 8.59.0 1 0.05 9.09.5 2 0.10 9.510.0 5 0.25 10.010.5 9 0.45 10.511.0 2 0.10 11.011.5 1 0.05现在学习的是第16页,共50页 8.75 9.25 9.75 10.25 10.75 11
8、.250.500.050.25样本均值)(Xf来自N(10,4)总体的20个样本均值的分布现在学习的是第17页,共50页理论依据: 若X1,X2,X3,Xn是来自于均值为,方差为的正态总体的一随机样本。则样本均值 也服从正态分布,其均值为,方差为/n,即:_X),(2_nNX也就是说,样本均值 的抽样(或概率)分布,同样服从正态分布。X现在学习的是第18页,共50页2.2 样本均值概率分布的标准正态变量:nXZ_将样本均值的概率密度转化为标准正态分布后,可以从标准正态分布表中计算某一给定样本均值大于或小于给定的总体均值的概率。现在学习的是第19页,共50页例:令X代表某一型号汽车每消耗一加仑汽
9、油所行驶的距离(英里)。已知X(20,4)。则对于由一个25辆汽车组成的随机样本,求:每消耗一加仑汽油所行驶的平均距离大于21英里的概率。分析:由于X服从均值为20,方差为4的正态分布,则样本均值也服从正态分布,其均值为20,方差为4/25。那么,)1 , 0(4 .02025420_NXXZ现在学习的是第20页,共50页Z服从标准正态分布,求:) 5 . 2()4 . 02021()21(_ZPZPXP查标准正态概率密度表得:0062.0)5 .2(ZP即每消耗一加仑汽油所行驶的平均距离大于21英里的概率为0.0062。现在学习的是第21页,共50页l引言:从正态总体中抽样,其样本均值服从正
10、态分布,那么,如果从其他总体中抽样,情况如何呢?l中心极限定理:如果X1,X2,Xn是来自(均值为,方差为)任一总体的随机样本,随着样本容量的无限增大,其样本均值趋于正态分布,其均值为,方差为/n。现在学习的是第22页,共50页l3.1 何谓分布?l分布是统计学中常用的一种概率分布,它与正态分布有紧密的关系。l统计理论证明:标准正态变量的平方服从自由度为1的分布,用符号表示为,2)1(2xZ 其中,Z是标准正态变量,即ZN(0,1); x的下标(1)表示自由度。自由度是指平方和中独立观察值的个数。因为我们考虑的是一个标准正态变量的平方,故自由度为1。现在学习的是第23页,共50页现在令Z1,Z
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一些 重要 概率 分布
限制150内