第六章(三)常用连续型随机变量的理论分布.ppt





《第六章(三)常用连续型随机变量的理论分布.ppt》由会员分享,可在线阅读,更多相关《第六章(三)常用连续型随机变量的理论分布.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三节 常用连续型随机变量的理论分布一、正态分布正态分布是最重要的概率分布。因为正态分布是最重要的概率分布。因为:第一,许多自然现象与社会现象,都可用第一,许多自然现象与社会现象,都可用正态分布加以叙述;正态分布加以叙述;第二第二,许多概率分布以正态分布为其极限;许多概率分布以正态分布为其极限;第三,许多统计量的抽样分布呈现正态分第三,许多统计量的抽样分布呈现正态分布。布。因此,许多统计分析方法都是以正态分布因此,许多统计分析方法都是以正态分布为基础的。为基础的。(一)正态分布的概率函数若连续型随机变量若连续型随机变量x的概率分布密度的概率分布密度函数为函数为 其中其中为平均数,为平均数,2为
2、方差,则称随为方差,则称随机变量机变量x服从正态分布服从正态分布(normal distribztion),记为,记为xN(,2)。相。相应的概率分布函数为应的概率分布函数为 分布密度曲线99.74%68.26%95.46%(二)正态分布的特征1.正态分布密度曲线是单峰、对称正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为的悬钟形曲线,对称轴为x=;2.f(x)在在x=处达到极大,极大值处达到极大,极大值 ;3.f(x)是非负函数,以是非负函数,以x轴为渐近线,轴为渐近线,分布从分布从-至至+;4.曲线在曲线在x=处各有一个拐点,即曲线处各有一个拐点,即曲线在在(-,-)和和(+,+)区间上
3、是下凸的,区间上是下凸的,在在-,+区间内是上凸的;区间内是上凸的;5.正态分布有平均数正态分布有平均数和标准差和标准差两个参数。两个参数。是位置参数,是位置参数,是变异度参数。是变异度参数。图图1 标准差相同标准差相同(1)而平均数不同而平均数不同(=0、=1、=2)的三个正态分布曲线的三个正态分布曲线 图图2 平均数相同平均数相同(0)而标准差不而标准差不同同(=1、=1.5、=2)的三个正态分的三个正态分布曲线布曲线 6.分布密度曲线与横轴所夹面积为分布密度曲线与横轴所夹面积为1,即:即:正态分布是依赖于参数正态分布是依赖于参数和和的一簇的一簇分布。将一般的分布。将一般的N(,2)转换为
4、转换为=0,2=1的正态分布,应用就方便了。的正态分布,应用就方便了。称称=0,2=1的正态分布为标准正态的正态分布为标准正态分布分布(standard normal distribztion)。(三)标准正态分布标准正态分布的概率密度函数及分布标准正态分布的概率密度函数及分布函数分别记作函数分别记作(z)和和(z),得:,得:随机变量随机变量z服从标准正态分布,记作服从标准正态分布,记作zN(0,1)。2221)(zez-=pjdzezzz-=22121)(pf对于任何一个服从正态分布对于任何一个服从正态分布N(,2)的随机变量的随机变量x,都可以通过标准化变换:,都可以通过标准化变换:z=
5、(x-)将其变换为服从标准正态分布的随机将其变换为服从标准正态分布的随机变量变量z。z称为标准正态变量或标准正称为标准正态变量或标准正态离差态离差(standard normal deviate)。(四)正态分布的概率计算标准正态分布的概率计算标准正态分布的概率计算 设设z服从标准正态分布,则服从标准正态分布,则z在在z1,z2)何内取值的概率为:何内取值的概率为:(z2)(z1)而而(z1)与与(z2)可由附表查得。可由附表查得。dzedzedzezzzPzzzzzzz -30就可就可以应用这一定理。以应用这一定理。平均数的标准化分布是将上述平均数平均数的标准化分布是将上述平均数 转换为转换
6、为z变数。变数。xxnxxzxsmsm)()(-=-=、标准误标准误标准误(平均数抽样总体的标准差平均数抽样总体的标准差)的大小反映样本平均数的大小反映样本平均数 的抽样误差的的抽样误差的大小,即精确性的高低。标准误大,说大小,即精确性的高低。标准误大,说明各样本平均数明各样本平均数 间差异程度大,样本间差异程度大,样本平均数的精确性低。反之,平均数的精确性低。反之,小,样本平小,样本平均数的精确性高。均数的精确性高。的大小与原总体的的大小与原总体的标准差标准差成正比,与样本含量成正比,与样本含量n的平方根的平方根成反比。从某特定总体抽样,因为成反比。从某特定总体抽样,因为是一是一常数,所以只
7、有增大样本含量才能降低常数,所以只有增大样本含量才能降低样本平均数样本平均数 的抽样误差。的抽样误差。在实际工作中,总体标准差在实际工作中,总体标准差往往是往往是未知的,因而无法求得未知的,因而无法求得 。此时,可。此时,可用样本标准差用样本标准差S估计估计。于是,以。于是,以 估计估计 。记。记 为为 ,称作样本标称作样本标准误或均数标准误。样本标准误准误或均数标准误。样本标准误 是是平均数抽样误差的估计值。若样本中平均数抽样误差的估计值。若样本中各观测值为各观测值为 x1、x2、xn,则,则注意:样本标准差与样本标准误是既注意:样本标准差与样本标准误是既有联系又有区别的两个统计量。有联系又
8、有区别的两个统计量。二者的区别是样本标准差二者的区别是样本标准差S是反映样是反映样本中各观测值的变异程度,它的大小本中各观测值的变异程度,它的大小说明了说明了 对该样本代表性的强弱。对该样本代表性的强弱。样本标准误是样本平均数样本标准误是样本平均数 的标准差,它是抽样误差的估计值,的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小其大小说明了样本间变异程度的大小及精确性的高低。及精确性的高低。(二二)两个独立样本平均数差数的分布两个独立样本平均数差数的分布 假定有两个正态总体各具有平均数和标准差为假定有两个正态总体各具有平均数和标准差为 ,和和 ,从第一个总体随机抽取,从第一个总
9、体随机抽取n1个观察值,同时独立地从第个观察值,同时独立地从第二个总体随时机抽取二个总体随时机抽取n2个观察值。这样计算出样本平均数个观察值。这样计算出样本平均数和标准差和标准差 ,s1和和 ,s2。从统计理论可以推导出其样本平均数的差数从统计理论可以推导出其样本平均数的差数()的抽样分布,具有以下特性:的抽样分布,具有以下特性:(1)如果两个总体各作正态分布,则其样本平均数差数如果两个总体各作正态分布,则其样本平均数差数()准确地遵循正态分布律,无论样本容量大或小,准确地遵循正态分布律,无论样本容量大或小,都有都有N(,)。(2)两个样本平均数差数分布的平均数必等于两个总体两个样本平均数差数
10、分布的平均数必等于两个总体平均数的差数,即平均数的差数,即 (3)两个独立的样本平均数差数分布的方差等于两个两个独立的样本平均数差数分布的方差等于两个总体的样本平均数的方差总和,即总体的样本平均数的方差总和,即 其差数标准差为:其差数标准差为:这个分布也可标准化,获得这个分布也可标准化,获得z值。值。nnyyz2221212121)()(ssmm+-=小结:小结:l若两个样本抽自于同一正态总体,则其平均数差数的抽若两个样本抽自于同一正态总体,则其平均数差数的抽样分布不论容量大小亦作正态分布具:样分布不论容量大小亦作正态分布具:l若两个样本抽自于同一总体,但并非正态总体,则其平均若两个样本抽自于
11、同一总体,但并非正态总体,则其平均数差数的抽样分布按中心极限定理在数差数的抽样分布按中心极限定理在n1和和n2相当大时相当大时(大于大于30)才逐渐接近于正态分布。才逐渐接近于正态分布。l若两个样本抽自于两个非正态总体,当若两个样本抽自于两个非正态总体,当n1和和n2相当大、而相当大、而 与与 相差不太远时,也可近似地应用正态接近方法估计相差不太远时,也可近似地应用正态接近方法估计平均数差数出现的概率,当然这种估计的可靠性得依两总体平均数差数出现的概率,当然这种估计的可靠性得依两总体偏离正态的程度和相差大小而转移。偏离正态的程度和相差大小而转移。例例 假定第一个总体包括假定第一个总体包括3个观
12、察值,个观察值,2、4和和6(N1=3,n1=2),所有样本数为,所有样本数为Nn=32=9个,总体平均数和个,总体平均数和方差方差 =4,=8/3。第二个总体包括。第二个总体包括2个观察值,个观察值,3和和6(N2=2),抽出的样本容量为,抽出的样本容量为3(n2=3),所以所有样本数为,所以所有样本数为23=8个,总体平均数和方差个,总体平均数和方差 =4.5,=2.25。现将上述。现将上述两个总体两个总体 的次数分布列于表,并计算出其分布的参的次数分布列于表,并计算出其分布的参数。数。将第一总体的将第一总体的9个样本平均数和第二总体的个样本平均数和第二总体的8个样本平均个样本平均数作所有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六 常用 连续 随机变量 理论 分布

限制150内