概率与概率分布 (2)精选PPT.ppt
《概率与概率分布 (2)精选PPT.ppt》由会员分享,可在线阅读,更多相关《概率与概率分布 (2)精选PPT.ppt(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于概率与概率分布(2)第1页,讲稿共28张,创作于星期二第二章第二章概率与概率分布概率与概率分布 学习要求学习要求 通过本章课堂的学习,使同学了解事件与概率的基本概念,了解正态分布、二项分布和普哇松分布是随机变量分布的三种主要理论分布及三者的关系,理解三种分布的特点及在生物统计学中的应用。掌握三种分布下的概率计算方法。统计学中的应用;三种分布下的概率计算方法。重点与难点重点与难点 重点:重点:小概率原理的基本概念,三种分布的特点及概率计算 难点:难点:三种主要理论分布思考题及作业思考题及作业 1、随机事件的频率与概率之间有何关系?2、正态分布、二项分布和普哇松分布之间有何关系?3、习题作业:
2、标准化综合测试题第四章19题 参考书参考书 1、贵州农学院(主编).2001.生物统计附试验设计教材.中国农业出版 社.2943页 2、杜荣骞编.1987.生物统计学.高等教学出版社.3284页 第2页,讲稿共28张,创作于星期二第一节第一节 事件与概率事件与概率 (一)、事件(一)、事件可分为两种现象:事件基本事件:不能再分的事件称基本事件或称样本点。个别随机事件的出现带有偶然性,似无规律可循。但是,若对大量的同类随机事件进行观察和试验,我们会发现随机事件的发生也具有必然的规律性。例如,多次重复投掷一枚硬币,我们发现得币值一面的次数约为试验次数的一半,即投掷一枚硬币得币值一面的可能性是0.5
3、。概率论与数理统计就是从数量上研究大量同类随机现象规律性的科学。(二)、概率(二)、概率频率的稳定频率的稳定 对于随机事件,仅指出其发生的偶然性是不够的,重要的是应指出该随机事件发生的可能性大小。事实上,一些随机事件发生的可能性要大些;另一些随机事件发生的可能性要小些。例如,“孵化一枚种蛋孵出雏鸡”这一随机事件发生的可能性一般大于“孵化一枚种蛋孵出母鸡”这一随机事件发生的可能性等。既然不同的随机事件出现的可能性有大有小,这就使人们想到用一个数量来表示。随机事件出现较大的可能性用较大的数量来表示,较小的可能性则用较小的数量来表示。对于某一随机事件A,应该用怎样的数量来表示其发生的可能性大小呢?下
4、面通过实例予以说明。第3页,讲稿共28张,创作于星期二例1分别取种蛋50、100、150、200、500、1000枚,在同样条件下进行孵化,21天后,其孵化结果如表4l所示表表2l种蛋孵化频率种蛋孵化频率入孵种蛋数(n)501001502005001000出 雏 数(a)4491135179452901孵 化 频 率(a/n)0.880.910.900.8950.9040.901 尽管孵化一枚种蛋孵出雏鸡具有随机性,但是,随着入孵种蛋数的增多,孵化频率(出雏数与入孵种蛋数之比)越来越清楚地呈现出稳定性来,即孵化频率越来越稳定地接近定值0.9,只是偶尔产生较大的偏差。随机事件的频率实际存在的稳定
5、性正是对随机事件发生的可能性大小进行度量的客观基础。数值0.9也正是“孵化一枚种蛋孵出雏鸡”这一随机事件发生的可能性大小的数量描述。我们把0.9称为从这批种蛋中“孵化一枚种蛋孵出雏鸡”的概率。随机事件的概率的统计定义如下:P(A)pa/n(n充分大)古典概率的定定义义:设样本空间由n个等可能的基本事件所构成,其中事件A包含有m个基本事件,则事件A的概率为m/n,即 P(A)m/n 定义:定义:在相同条件下进行n次重复试验,随机事件A发生的次数为a,称an为随机事件A的频率;如果试验次数n逐渐增大,随机事件A的频率越来越稳定地接近定值p,就称p为随机事件A的概率。记为P(A)=p。在一般情况下,
6、随机事件的概率p是不可能准确得到的,常以试验次数n充分大时随机事件的频率作为该随机事件的概率的近似值,即第4页,讲稿共28张,创作于星期二根据随机事件的概率定义,随机事件的概率有以下三个基本性质:1任何事件(包括必然事件、不可能事件、随机事件)的概率都在0与1之间,即 0P(A)12必然事件的概率等于1,即 P()=13不可能事件的概率等于0,即 P()0随机事件的概率表示了随机事件的客观规律性,它反映了随机事件在一次试验中出现的可能性大小。若P(A)0,表示该随机事件是不可能事件。若P(A)很小,例如:小于 0.05,小于0.01、0.001或接近于0,表示该随机事件在一次试验中出现的可能性
7、很小或者极小,不出现的可能性很大或者极大,以至实际上可以认为是不可能事件。这种将小概率随机事件在一次试验中看成实际不可能出现的随机事件称为小概率事件实际不可能性原理,简称,小概率原理。小概率原理是统计上进行显著性检验的基本依据。第二节第二节概率分布概率分布 前面我们讨论了随机事件与随机事件概率,现在来讨论随机试验。作一次试验以后试验的结果可能是多种的,这种试验称为随机试验。简称试验。例如,掷一枚硬币有二种可能结果:或者币值一面向上或者国徽一面向上;掷一枚骰子有六种可能结果:“得一点”,“得二点”,“得六点”;五头母牛所生五头小牛以性别来划分有六种可能情况:05、14、23、32、41、50,它
8、们都是随机试验。又如。称量某品种100头成年猪体重,所得的100个数据不第5页,讲稿共28张,创作于星期二可能完全一样,在某一个范围内有各种可能情况,即称量成年猪体重也是一个随机试验。前面所讲所讲的随机事件实际上是做一次试验的某一种可能结果或由某些可能结果组成,表示了随机试验的某一个侧面,因而随机事件的概率也只表示了随机试验的某一个侧面发生的可能性大小。为了对随机试验作全面的认识,有必要进一步讨论做一次试验出现的各种可能情况的可能性大小即随机试验的概率分布问题。一、随机变量一、随机变量 作一次试验,试验的可能结果是多种的,每一种可能结果都可以用一个数来表示。把这些数作为变量x的取值范围,则随机
9、试验的结果可以用变量x来表示。例2孵化一枚种蛋只可能出现两种情况:“孵出雏鸡”(其可能性记为p)与“未孵出雏鸡”(其可能性记为q,显然,q1p)。“孵出雏鸡”相当于“得一个雏鸡”;“未孵出雏鸡”相当于“得0个雏鸡”。于是我们分别用数0和1表示“未孵出雏鸡”与“孵出雏鸡”这两种可能情况。把0、1作为变量x的取值范围,则孵化一枚种蛋这一随机试验可用取值为0、1的变量x来表示了。我们可用 P(x=0)=q,P(x=1)=p,(p+q=1)来表示孵化一枚种蛋的二种可能结果出现的可能性大小。例3用变量x表示某品种成年猪体重,若x在75kg到90kg之间的概率为0.2,可表示为 P(75x90)0.2 在
10、例2中,表示试验结果的变量x,只有两个数值0、1,可以一一列出;且x取某个固定值时,其概率是确定的:P(x=0)=q,P(x=1)=p,(p+q=1)这种类型的变量叫离散型随机变量第6页,讲稿共28张,创作于星期二在例3中,表示试验结果的变量。所取的值为某一个范围。例如成年猪体重范围为50150(kg)(在理论上可以为整个实数)。且x在某个范围内取值时,其概率是确定的,例如P(75x90)0.2(这时研究“x取某个固定值的概率”,例如研究成年猪体重为80kg的概率往往是无意义的),这种类型的变量叫连续型随机变量。一个随机变量完整地描述了一个随机试验,它不仅告诉我们随机试验的所有可能结果,而且告
11、诉了我们该随机试验各种可能情况出现的可能性大小。这样,对随机试验概率分布的研究,也就转而对随机变量的概率分布进行研究了。下面我们介绍几种常见的随机变量的概率分布。二、正态分布二、正态分布(一一)实实例例 正态分布是一种常见的连续型随机变量的概率分布。我们结合一个具体例子予以说明。例4对200头大白母猪的仔猪一月窝重资料进行整理,列出了次数分布表如下,现研究大白母猪(经产)的仔猪一月窝重的概率分布。先列出频率分布表:分 组8|15.916|23.924|31.932|39.940|47.948|55.956|63.964|71.972|79.980|87.988|95.996|103.9104|
12、111.9112|119.9次 数(f)4691013172635282116843频率(f/n)累计频率0.020.020.030.050.0450.0950.0500.1450.0650.2100.0850.2950.1300.4250.1750.6000.1400.7400.1050.8450.0800.0250.0400.9650.0200.9850.0151.000表表22200头大白母猪的仔猪一月窝重次数分布与颁率分布表头大白母猪的仔猪一月窝重次数分布与颁率分布表 第7页,讲稿共28张,创作于星期二 如果在直角坐标系的横轴上标记各组组限、在纵轴上标记各组的频率与组距之比,可以作出频
13、率分布矩形图(此时每个矩形的面积等于该组的频率),见图21。x月窝重(kg)图 2l 频率分布矩形图 可以设想,如果样本取得更大(n),组分得更细(i0),某一范围内的频率将趋近于一个稳定的值概率,这时,频率分布矩形图各矩形顶端中点的联线频率分布折线将逐渐趋近于一条曲线。换句话说,作为频率分布当 n,i0时的极限,可以考虑一个稳定的函数,对于样本是取自连续型随机变量的情形。这个函数的图形将是一条光滑曲线。对于此例,这条曲线排除了抽样和测量的误差,完全反映了大白母猪仔猪一月第8页,讲稿共28张,创作于星期二窝重的波动规律。这种曲线在统计学中很重要,叫概率分布密度曲线,相应的函数叫概率分布密度函数
14、。变量的波动规律不同,概率分布密度函数不同。概率分布密度曲线的形状不一样。如图43的概率分布叫正态分布。很多连续型随机变量的概率分布常常呈正态分布。这是一种在统计理论研究和实际应用上最重要的分布。试验误差一般服从这种分布,许多生物现象的数量资料均近似服从这种分布。图22 正态分布密度曲线图与正态分布密度曲线相对应的函数叫正态分布密度函数,记为f(x)。统计学已证明正态分布密度函数f(x)为(二)正态分布的特点(二)正态分布的特点 下面对正态分布进行详细的讨论。一般说来,正态分布的密度曲线是一条“钟形”光滑曲线(见图22)。第9页,讲稿共28张,创作于星期二正态分布密度曲线有以下特点:1过x轴上
15、的点(=0)作x轴的垂线,该直线方程为x=,正态分布密度曲线以这条直线为对称。2以为横坐标,f()为纵坐标和以+为横坐标,f(+)为纵坐标所确定的两点是正态分布密度曲线上的两点。可以证明,这两点是正态分布密度曲线的两个“拐点”:当x在到范围内取值时。曲线“向上弯”;当x在到+范围内取值时,曲线“向下弯”,当x在到范围内取值时曲线“向上弯”。3正态分布密度曲线向左、向右无限延伸,以x轴为渐近线,分布从到+。4当x=时,f(x)具有最大的纵坐标:,即当x=时,具有最大的概率分布密度。说明随机变量在附近取值的可能性最大,离越远,取值的可能性越小。其中,为服从正态分布的随机变量x的平均数,2为x的方差
16、,为x的标准差。任何一个正态分布都由参数、唯一确定。若随机变量x服从平均数为方差为2的正态分布,常记为xN(,2)。5的大小,决定了曲线的“胖”、“瘦”程度。越小。曲线越“瘦”,变量越集中在平均数仟的周围;越大,曲线越“胖”,数据越分散。统计学已证明,随机变量x在区间(a,b)内取值的概率就等于图42中阴影部分曲边梯形的面积:第10页,讲稿共28张,创作于星期二统计学还证明了以下结果:随机变量x在到范围内取值的概率等于1:以上结果如图23所示。图2一3 正态分布密度曲线图 随机变量x在平均数左右一倍标准差范围内取值的概率等于0.6827:随机变量x在平均数左右二倍标准差范围内取值的概率等于0.
17、9545:随机变量x在平均数左右三倍标准差范围内取值的概率等于0.9973:第11页,讲稿共28张,创作于星期二 表表23126头头基础母羊体重基础母羊体重在平均数标准差范围内所包括的次数和频率在平均数标准差范围内所包括的次数和频率 由表23,我们看到实际的频率与理论的概率很接近,这也进一步证实了126头基础母羊体重的概率分布是接近正态分布的。除上面所讨论的以外,在实际的统计检验中常常要研究随机变量x在平均数左右取值的概率为0.95、0.99的取值范围。显然,随机变量x在这个范围外取值的概率为0.05和0.01。统计学已证明了下述结果:反之,随机变量x在平均数左右一倍标准差外出现的概率为10.
18、6827=0.3173,即 P(x+)=1 P(x+)=10.6827=0.3173。类似地还有:P(x+2)=1P(2x+2)=10.9545=0.0455。P(x+3)=1P(3x+3)=10.9973=0.0027。以上所述仅是理论的结果,我们可以用具体实例来印证,从图 17可以看出:126头基础母羊体重的次数分布接近正态分布。我们计算在这个样本中各变数落在样本平均数不同倍数标准差范围内的次数和频率,列在表23中样本平均数土样本标准差(kg)范 围(kg)范围内所包括的变数次 数频 率(%)1s 2s 3s 1.96s 2.58s52.26 5.1052.26 10.2052.26 15
19、.3052.26 10.0052.26 13.1647.1657.3642.06 62.4636.96 67.5642.26 62.2639.10 65.428411912611912667.4694.44100.0094.44100.00第12页,讲稿共28张,创作于星期二 P(x+1.96)=1P(1.96x+1.96)=10.95=0.05 P(x+2.58)=1P(2.58x+2.58)=10.99=0.01于是有0.05,0.01是今后常用的两个概率值。P(x+1.96)=0.05与P(x+2.58)=0.01都是两尾概率。如图24所示 图24两尾概率与一尾概率 由两尾概率,可以计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率与概率分布 2精选PPT 概率 分布 精选 PPT
限制150内