分布与抽样分布.pptx
《分布与抽样分布.pptx》由会员分享,可在线阅读,更多相关《分布与抽样分布.pptx(94页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 分布与抽样分布分布与抽样分布 第二节第二节 抽样分布抽样分布 第一节第一节 概率与概率分布概率与概率分布 第三节第三节 统计推断统计推断 第一节第一节 概率与概率分布概率与概率分布统计学一一 概率概率(一)概率的统计定义(一)概率的统计定义 研究随机试验,仅知道可能发生哪些随机研究随机试验,仅知道可能发生哪些随机事件是不够的,还需了解各种随机事件发生事件是不够的,还需了解各种随机事件发生的可能性大小,以揭示这些事件的内在的统的可能性大小,以揭示这些事件的内在的统计规律性,从而指导实践。这就要求有一个计规律性,从而指导实践。这就要求有一个能够能够刻划事件发生可能性大小的数量指标刻划
2、事件发生可能性大小的数量指标,这指标应该是事件本身所固有的,且不随人这指标应该是事件本身所固有的,且不随人的主观意志而改变,人们的主观意志而改变,人们称之为概率称之为概率(probability)。)。事件事件A的概率记为的概率记为P(A)。)。 概率的统计定义概率的统计定义 在相同条件下进行在相同条件下进行n次重复试验,如次重复试验,如果随机事件果随机事件A发生的次数为发生的次数为m,那么那么m/n称为随机事件称为随机事件A的的频率频率(frequency););当试验重复数当试验重复数n逐渐增大时,随逐渐增大时,随机事件机事件A的频率越来越稳定地接近某一数值的频率越来越稳定地接近某一数值
3、p , 那么那么 就就 把把 p称为随机事件称为随机事件A的的概率概率。 这这 样样 定定 义义 的的 概概 率率 称称 为为 统统 计计 概概 率(率(statistics probability),),或者称后验概率(或者称后验概率(posterior probability)表表3-1 抛掷一枚硬币发生正面朝上的试验记录抛掷一枚硬币发生正面朝上的试验记录 从表从表3-1可看出,随着实验次数的增多,正面朝可看出,随着实验次数的增多,正面朝上这个事件发生的频率越来越稳定地接近上这个事件发生的频率越来越稳定地接近0.5,我们就,我们就把把0.5作为这个事件的概率。作为这个事件的概率。 在一般情
4、况下,随机事件的概率在一般情况下,随机事件的概率p是不可能准确是不可能准确得到的。通常以试验次数得到的。通常以试验次数n充分大时随机事件充分大时随机事件A的频率的频率作为该随机事件概率的近似值。作为该随机事件概率的近似值。 即即 P(A)=pm/n (n充分大)充分大)(二(二)概率的性质概率的性质 1、对于任何事件、对于任何事件A,有有0P(A)1; 2、必然事件的概率为必然事件的概率为1,即,即P()=1; 3、不可能事件的概率为不可能事件的概率为0,即,即P()=0。一个总体是由一个随机变量的所有可能取值来构成的,而样本只一个总体是由一个随机变量的所有可能取值来构成的,而样本只是这些所有
5、可能取值的一部分是这些所有可能取值的一部分 随机变量中某一个值出现的概率,只是随机变量一个侧面的反映,随机变量中某一个值出现的概率,只是随机变量一个侧面的反映,若要全面了解随机变量则必须知道若要全面了解随机变量则必须知道随机变量的全部值随机变量的全部值和和各个值出各个值出现的概率现的概率,即随机变量的概率分布,即随机变量的概率分布 概率和概率分布是生命科学研究中由样本推断总体的理论基础概率和概率分布是生命科学研究中由样本推断总体的理论基础 随机变量的种类很多,每一种随机变量都有其特定的概率分布。随机变量的种类很多,每一种随机变量都有其特定的概率分布。 连续型随机变量连续型随机变量 离散型随机变
6、量离散型随机变量 在一定范围内可连续取值的变量。在一定范围内可连续取值的变量。在一定范围内只取有限种可能的值的变量。在一定范围内只取有限种可能的值的变量。正态分布正态分布 二项分布、泊松分布二项分布、泊松分布 二二 概率分布概率分布1. 正态分布正态分布 正态分布(正态分布(normal distribution)的概念是由德国数学家和天文学家的概念是由德国数学家和天文学家Moivre于于1733年首次提出的,由德国数学家年首次提出的,由德国数学家Gauss率先将其应用于天文学研究,故正率先将其应用于天文学研究,故正态分布又称为态分布又称为Gauss分布(分布(Gaussian distrib
7、ution)。)。许多生物学领域(许多生物学领域(如身高、体重、脉搏、血红蛋白、血清总胆固醇等如身高、体重、脉搏、血红蛋白、血清总胆固醇等)的随机变量都)的随机变量都服从或者近似服从正态分布或通过某种转换后服从正态分布,许多其他类型服从或者近似服从正态分布或通过某种转换后服从正态分布,许多其他类型分布基本上都与正态分布有关,它们的极限就是正态分布。分布基本上都与正态分布有关,它们的极限就是正态分布。1.1 正态分布的定义正态分布的定义 在日常工作中所遇到的变量大多是连续型随机变量,当这一类随机变量呈线在日常工作中所遇到的变量大多是连续型随机变量,当这一类随机变量呈线性时,往往服从正态分布性时,
8、往往服从正态分布 频数分布表:某地 13 岁女孩 118 人的身高(cm)资料频数分布 身高组段 频数 组中值 (1) (2) (3) 129 2 130.5 132 2 133.5 135 8 136.5 138 20 139.5 141 26 142.5 144 25 145.5 147 20 148.5 150 9 151.5 153 3 154.5 156 2 157.5 159162 1 160.5 合计 118 下面我们以某地13岁女孩118人的身高(cm)资料,来说明身高变量服从正态分布。频数分布图(又称直方图) 身高(cm)160.5157.5154.5151.5148.514
9、5.5142.5139.5136.5133.5130.5 某地13岁女孩118人身高(cm)频数分布图频数3020100从频数表及频数分布图上可得知: 该数值变量资料频数分布呈现中间频数多,左右两侧基本对称的分布。所以我们通俗地认为该资料服从正态分布。 身高(cm) 某地13岁女孩118人身高(cm)频数分布图频数20100频数分布图二频数分布图三身高(cm) 某地13岁女孩118人身高(cm)频数分布图频数14121086420正态分布图四身高(cm) 频数分布逐渐接近正态分布示意图和正态分布相对应的曲线称为正态分布密度曲线,简称为和正态分布相对应的曲线称为正态分布密度曲线,简称为正态曲线。
10、正态曲线。 用来描述正态曲线的函数称为正态分布密度函数用来描述正态曲线的函数称为正态分布密度函数 222)(21)(xexf 总体平均数 2 总体方差 圆周率3.14 总体标准差 任何一个正态分布均由参数任何一个正态分布均由参数和和所决定所决定如果一个随机变量如果一个随机变量x服从平均数为服从平均数为、方差为方差为2的正态分布,可的正态分布,可记为记为xN(,2)。)。e 自然对数的底,2.718281.2 正态分布的特点正态分布的特点 (1)正态分布曲线以直线)正态分布曲线以直线x =为对称轴,左右完全对称为对称轴,左右完全对称(3)正态分布曲线有两个拐点,拐点座标分别为(正态分布曲线有两个
11、拐点,拐点座标分别为(-,f(-)和(和(+,f(+),),在这两个拐点处曲线改变方向,在这两个拐点处曲线改变方向,即曲线在(即曲线在(-,-)和(和(+,+) 区间上是下凹的,在区间上是下凹的,在-,+区间内是上凸的区间内是上凸的x(2)在在x =处,处,f(x)有最大值有最大值 21)(f(4)正态分布密度曲线的位置由正态分布密度曲线的位置由决定(决定(为位置参数),形状为位置参数),形状由由决定(决定(为形状参数)为形状参数)(5)正态分布曲线向两边无限延伸,以正态分布曲线向两边无限延伸,以x轴为渐进线,分布从轴为渐进线,分布从-到到+ 的大小决定了曲线在的大小决定了曲线在x轴上的位置轴
12、上的位置的大小则决定了曲线的胖瘦程度的大小则决定了曲线的胖瘦程度当当恒定时,恒定时,愈大,则曲线沿愈大,则曲线沿x轴愈向右轴愈向右移动移动愈小,曲线沿愈小,曲线沿x轴愈向左移动轴愈向左移动越大表示数据越分散,曲线越胖越大表示数据越分散,曲线越胖越小表示数据越集中,曲线越瘦越小表示数据越集中,曲线越瘦1.3 标准正态分布标准正态分布正态分布由正态分布由和和所决定,不同的所决定,不同的、值就决定了不同的正态分值就决定了不同的正态分布密度函数,因此在实际计算中很不方便的。需将一般的布密度函数,因此在实际计算中很不方便的。需将一般的N(,2 2 )转换为转换为=0, 2 2 =1的正态分布。我们称的正
13、态分布。我们称=0, 2 2 =1的正态分的正态分布为标准正态分布布为标准正态分布(standard normal distribution) 可见,由正态分布密度函数得到标准正态分布密度函数:222)(21)(xexf2221)(xexf1.4 正态分布的概率计算正态分布的概率计算 根据概率论原理,可知随机变量根据概率论原理,可知随机变量x在区间(在区间(a,b)内取值的概率是一块面积:内取值的概率是一块面积: axbx 面积由面积由0y曲线曲线 所围成的曲边梯形所组成:所围成的曲边梯形所组成: badxxfbxaP)()(随机变量随机变量x在(在(-,+)间取值的概率为)间取值的概率为1
14、,即:,即:1)()(dxxfxP 求随机变量x在某一区段内取值的概率就转化成了求由该区段与相应曲线所围成的曲边梯形的面积。 由于正态分布的概率密度函数比较复杂,积分的计算也比较麻烦,而这些由于正态分布的概率密度函数比较复杂,积分的计算也比较麻烦,而这些计算在动物科学或动物医学生产实践中又经常会用到。计算在动物科学或动物医学生产实践中又经常会用到。 最好的解决办法:将正态分布最好的解决办法:将正态分布转化为转化为标准正态分布,然后根据标准正态分标准正态分布,然后根据标准正态分布表(附表布表(附表1)直接查出概率值。)直接查出概率值。 (1) 标准正态分布的概率计算标准正态分布的概率计算 附表附
15、表1列出了在标准正态分布随机变量列出了在标准正态分布随机变量u在区间在区间(,u内取值的概率:内取值的概率: uuudueduufuuP2221)()(标准正态分布的概率计算通式标准正态分布的概率计算通式 标准正态分布函数表标准正态分布函数表 例例1:若u N(0,1),),求: )64. 0( uP)53. 1( uP)53. 012. 2(uP(1)(2)(3)解:解:(1))64. 0( uP)53. 012. 2(uP)53. 1( uP7389. 0(2))53. 1(1uP9370. 010630. 0(3))12. 2()53. 0(uPuP)12. 2(1 )53. 0(1 u
16、PuP)9830. 01 ()7109. 01 (0170. 02981. 02811. 0关于标准正态分布,以下几种概率应当熟记:关于标准正态分布,以下几种概率应当熟记:P(-1u1)=0.6826P(-2u2)=0.9545P(-3u3)=0.9973P(-1.96u1.96)=0.95P(-2.58u2.58)=0.99P(u1) u变量在上述区间以外取值的概率,变量在上述区间以外取值的概率, 即两尾概率:即两尾概率:= 1- P(-1u1) = 1-0.6826 = 0.3174 P(u2)=1- P(-2u2)= 0.0455P(u3)= 1-0.9973 = 0.0027P(u1.
17、96)= 1-0.95 = 0.05P(u2.58)= 1-0.99 = 0.01(2) 正态分布的概率计算正态分布的概率计算 对于服从任意正态分布对于服从任意正态分布N(,2)的随机变量,欲求其在某个区间的取值概率,需的随机变量,欲求其在某个区间的取值概率,需先将它标准化为标准正态分布先将它标准化为标准正态分布N(0,1)的随机变量,然后查表即可。的随机变量,然后查表即可。xu实质:实质:为了能使正态分布应用起来更方便一些,可以将为了能使正态分布应用起来更方便一些,可以将x作一变换,令:作一变换,令:变换后的正态分布密度函数为:变换后的正态分布密度函数为:2221)(ueuf标准正态分布均具
18、有标准正态分布均具有=0,2=1的特性的特性如果随机变量如果随机变量u服从标准正态分布,可记为:服从标准正态分布,可记为:uN(0,1) u变换变换这个变换称为标准化或这个变换称为标准化或u变换变换, ,由于由于x是随机变量,因此是随机变量,因此u也是随机变量,也是随机变量,所得到的随机变量所得到的随机变量U也服从正也服从正态分布,因此,由任意正态分布随机变量标准化得到的随机变量的标准正态分布常称为态分布,因此,由任意正态分布随机变量标准化得到的随机变量的标准正态分布常称为u分布。可见:分布。可见:例2:设 x N(30,102)试求x 40的概率。解:解: 首先将正态分布首先将正态分布 转化
19、为标准正态分布,令转化为标准正态分布,令:)103040(uP)40( xP1030 xu则则u服从标准正态分布,故服从标准正态分布,故:) 1( uP) 1(1uP8413. 011587. 0例3:设x服从=30.26, =5.102的正态分布,试求P(21.64x32.98)。 解:解: 令令10.526.30 xu)10. 526.3098.3210. 526.3010. 526.3064.21()98.3264.21(xPxP关于一般正态分布,经常用到以下几个概率:关于一般正态分布,经常用到以下几个概率:P(-x+)= 0.6826P(-2x+2) = 0.9545P(-3x+3)
20、=0.9973P(-1.96x+1.96) = 0.95P(-2.58x+2.58) = 0.99把随机变量把随机变量x落在平均数落在平均数加减不同加减不同倍数标准差倍数标准差区间之外的概率称为两区间之外的概率称为两尾概率(双侧概率),记作尾概率(双侧概率),记作。对应于两尾概率可以求得随机变量对应于两尾概率可以求得随机变量x小于小于-k或大于或大于+k的概率,称为的概率,称为一尾概率(单侧概率),记作一尾概率(单侧概率),记作2。0.3173 0.0455 0.0027 0.05 0.01 /2附表2: 给出了满足给出了满足)uuP(两尾临界值两尾临界值u 因此,可以根据两尾概率因此,可以根
21、据两尾概率,由附表由附表2查出相应的临界值查出相应的临界值u。 例4:已知 u N(0,1),),试求u: 10. 0()()uuPuuP(1)(2)86. 0()uuuP解:解:(1)10. 0)()(uuPuuP644854. 110. 0u(2)()(uuPuuP)(uuuP114. 086. 01475791. 114. 0u2. 二项分布二项分布 二项分布(二项分布(binomial distribution)是一种最常见的、典型的离散型随机变是一种最常见的、典型的离散型随机变量的概率分布。量的概率分布。有些试验只有非此即彼两种结果,这种由非此即彼的事件构成的总体,称有些试验只有非此
22、即彼两种结果,这种由非此即彼的事件构成的总体,称为二项总体。为二项总体。 结果结果“此此”用变量用变量1表示,表示, 概率为概率为 p 结果结果“彼彼”用变量用变量0表示,表示, 概率为概率为 q pxP ) 1(qxP )0(1 qp对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与A-中之一,在每次试验中出现A的概率是p(0p5,np、nq较接近时,接近正态较接近时,接近正态分布,分布,n时服从正态分布,即二项分布的极限是正态分布时服从正态分布,即二项分布的极限是正态分布 (4)二项分布的平均数为:)二项分布的平均数为: np npq2方差为:方差为:npq标准差为:例4:某奶牛
23、场情期受胎率为0.6,该场对30头发情母牛配种,使24头母牛一次配种受胎的概率为多少?解:解:6 . 0p30n24m)24(30P6242430)4 . 0()6 . 0(C624)4 . 0()6 . 0()2430(2430!0115. 0%15. 1186 . 030 np2 . 74 . 06 . 0302 npq68. 22 . 7npq2.3 二项分布的概率计算二项分布的概率计算课堂练习:用某种常规药物治疗猪瘟的治愈率为0.7,对20头患猪瘟的肥育猪进行治疗,问20头猪中16头猪治愈的概率是多少? 解:解:7 . 0p20n16m)16(20P4161620) 3 . 0()7
24、. 0(C416) 3 . 0()7 . 0()1620(1620!1295. 0%95.12147 . 020 np2 . 43 . 07 . 0202 npq05. 22 . 4npq3. 泊松分布泊松分布 当二项分布中的当二项分布中的n,p0时,二项分布趋向于一种新的分布时,二项分布趋向于一种新的分布 泊松分布(普哇松分布)泊松分布(普哇松分布) (Poissons distribution)当试验次数(或称观测次数)很大,而某事件出现的概率很小,当试验次数(或称观测次数)很大,而某事件出现的概率很小,则离散型随机变量则离散型随机变量x服从于泊松分布。服从于泊松分布。 3.1 泊松分布的
25、定义泊松分布的定义 若随机变量若随机变量x(x = m)只取零和正整数值只取零和正整数值0,1,2,且其概,且其概率分布为:率分布为: )(mxPemm!0其中:其中: = np,是一个常量,且是一个常量,且 7182. 2e则称则称x服从参数为服从参数为的泊松分布,的泊松分布,记为记为x P() n 泊松分布主要是用来描述小概率事件发生的概率泊松分布主要是用来描述小概率事件发生的概率 单位空间中某些野单位空间中某些野生动物数生动物数 畜群中的畸形畜群中的畸形个体数个体数 畜群中某些遗传性畜群中某些遗传性疾病的患病数疾病的患病数 n 泊松分布不是用来描述几乎不可能发生的事件的概率泊松分布不是用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分布 抽样
限制150内