第三章理论分布与抽样分布.pptx
《第三章理论分布与抽样分布.pptx》由会员分享,可在线阅读,更多相关《第三章理论分布与抽样分布.pptx(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1西南科技大学生命科学与工程学院周海廷制作2西南科技大学生命科学与工程学院周海廷制作3.1.1 事件和事件发生的概率事件和事件发生的概率事件事件( (event)event):在自然界中一种事物,常存在几种可能出现的情况,每一种可能出现的情况称为事件。概率概率(probability):每一事件出现的可能性,称为该事件的概率。随机事件随机事件(random event):若某特定事件只是可能发生的几种事件中的一种,这种事件称为随机事件。3西南科技大学生命科学与工程学院周海廷制作要认识随机事件的规律性,个别的试验或观察是不适用的,必须在大量的实验中才能观察到。下面用棉田发生盲椿象为害的情况来说明
2、这一问题。调查株数(n)受害株数(a)受害频率(a/n)52.402512.485015.3010033.3320072.36500177.3541000351.3511500525.3502000704.3524西南科技大学生命科学与工程学院周海廷制作统计学上通过大量实验而估计的概率称为实验概率或统计概率,用公式表示为:naAPnlim)(式中P代表概率,P(A)代表事件A的概率。P(A)的取集范围为:0 P(A) 1。随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。5西南科技大学生命科学与工程学
3、院周海廷制作小小概率原理概率原理:若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率实际不可能性原理,简称小概率原理。必然事件必然事件:对于一类事件来说,如在同一组条件的实现之下必然要发生的事件。不可能事件不可能事件:如果在同一组条件下必然不发生的事件。6西南科技大学生命科学与工程学院周海廷制作3.1.2 3.1.2 事件间的关系事件间的关系一、和事件一、和事件事件A和事件B至少有一个发生构成的新事件称为事件A和事件B的和事件,记为AB,读作“或A发生,或B发生”。例如测定棉花的纤维长度,以28毫米为事件A,28至30毫米为事件B,则抽取一根3
4、0毫米的这一新事件为AB。7西南科技大学生命科学与工程学院周海廷制作二、积事件二、积事件事件A和B同时发生而构成的新事件,称为事件A和B的积事件,记为AB,读作“A和B同时发生或相续发生”。例如某小麦品种,以发生锈病为事件A,发生白粉病为事件B,则锈病和白粉病同时发生这一新事件为AB。8西南科技大学生命科学与工程学院周海廷制作三、互斥事件三、互斥事件如果事件A和B不能同时发生,即A和B是不可能事件,则称事件A和B互斥。例如棉花纤维长度“28毫米”和“等于28毫米”不可能同时发生,为互斥事件。9西南科技大学生命科学与工程学院周海廷制作四、对立事件四、对立事件事件A和B不可能同时发生,但必发生其一
5、,即AB为必然事件(记为ABU),AB为不可能事件(记为AB=V),则称事件B为事件A的对立事件,并记B为例如,有一袋种子,按种皮分黄色和白色,事件A为“取到黄色”,事件B为“取到白色”,A与B不能同时发生,但是,任意取一粒种子,其皮色不是黄色就是白色,即A和B必发生其一,因此A和B互为对立事件。_A10西南科技大学生命科学与工程学院周海廷制作五、完全事件系五、完全事件系若事件A1、A2、An两两互斥,且每次试验结果必发生其一,则称A1、A2、An为完全事件系。例如对于棉花纤维长度,28毫米、28毫米和30毫米、30毫米均构成了完全事件系。11西南科技大学生命科学与工程学院周海廷制作六、事件的
6、独立性六、事件的独立性若事件A发生与否不影响B发生的可能性,则称事件A和事件B相互独立。例如,事件A为“花的颜色为黄色”,事件B为“产量高”,显然如果花的颜色与产量无关,则事件A和B相互独立。12西南科技大学生命科学与工程学院周海廷制作3.1.3 计算事件概率的法则计算事件概率的法则一、互斥事件的加法一、互斥事件的加法假定两互斥事件A和B的概率分别为P(A)和P(B),则 P(A+B)=P(A)+P(B)例如:荣昌猪的每胎产仔数9头的概率P(A)=0.65,为10头的概率P(B)=0.18,则每胎产仔10头的概率为:P(A+B)=P(A)+P(B)=0.65+0.18=0.8313西南科技大学
7、生命科学与工程学院周海廷制作二、独立事件的乘法二、独立事件的乘法假定P(A)和P(B)是两个独立事件A与B各自出现的概率,则: P(AB)=P(A)P(B)例:现有4粒种子,其中3粒是黄色、1粒是白色,采用复置抽样。试求下列两事件的概率(1)第一次抽到黄色,第二次抽到白色;(2)两次都抽到黄色。14西南科技大学生命科学与工程学院周海廷制作先求出抽到黄色种子的概率为3/4=0.75,抽到白色种子的概率为1/4=0.25.P(A)=P(第一次抽到黄色种子)P(第二次抽到白色种子)=0.750.25=0.1875P(B)= P(第一次抽到黄色种子) P(第二次抽到黄色种子)=0.750.75=0.5
8、62515西南科技大学生命科学与工程学院周海廷制作三、对立事件的概率三、对立事件的概率若事件A的概率为P(A),那么其对立事件的概率为: P( )=1P(A)四、完全事件系的概率四、完全事件系的概率例如上例,黄色种子和白色种子构成完全事件系,其概率为1。_A16西南科技大学生命科学与工程学院周海廷制作五、非独立事件的乘法五、非独立事件的乘法 P(AB)=P(A)P(B|A)17西南科技大学生命科学与工程学院周海廷制作3.1.4 随机变量随机变量定义定义:随机变量是指随机变数所取的某一个实数值。例如:在抛硬币试验中,币值面向上的用数“1”表示,国徽面向上的用“0”表示。把0,1作为变量y 的取值
9、。 P(y=1)=0.5 P(y=0)=0.518西南科技大学生命科学与工程学院周海廷制作一、离散型随机变量一、离散型随机变量变量y的取值可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。将这种变量的所有可能取值及其对应的概率一一列出所形成的分布,称为离散型随机变量的概率分布: 变量yi y1 y2 y3 yn 概率P(y=yi) P1 P2 P3 Pn19西南科技大学生命科学与工程学院周海廷制作二、连续型随机变量二、连续型随机变量变量y的取值仅为一范围,且y在该范围内取值时,其概率是确定的,这种类型的变量称为连续型随机变量(continuous random v
10、ariate)。badyyfbyaP)()(式中,f(y)称为y的概率密度函数(probability density function)或分布密度(distribution density)20西南科技大学生命科学与工程学院周海廷制作随机变量可能取得的每一个实数值或某随机变量可能取得的每一个实数值或某一范围的实数值是有一个相应概率于其一范围的实数值是有一个相应概率于其对应的,这就是所要研究和掌握的规律,对应的,这就是所要研究和掌握的规律,这个规律称为随机变量的概率分布。这个规律称为随机变量的概率分布。21西南科技大学生命科学与工程学院周海廷制作22西南科技大学生命科学与工程学院周海廷制作3.
11、2.1 二项总体与二项式分布二项总体与二项式分布 有些总体的各个个体的某些性状,只能发生非此即彼的两种结果,“此”和“彼”是对立事件。例如种子的发芽与不发芽,施药后害虫的死或活,产品的合格与不合格。这种由非此及彼事件构成的总体,称之为二项总体二项总体(binomial population)。23西南科技大学生命科学与工程学院周海廷制作为便于研究,通常给“此”事件以变量“1”,具概率p;给“彼”事件以变量“0”,具概率q其概率关系为: pq=1 q1=p如果我们每次抽取0、1总体的n个个体,则所得变量y将可能有0,1,n,共n+1种。这n+1变量有它各自的概率而组成一个分布。这个分布叫做二项概
12、率分布,简称二项分布二项分布(binomial distribution)。24西南科技大学生命科学与工程学院周海廷制作 例如,观察施用某种农药后蚜虫的死亡数,记“死”为0,“活”为1。如果每次观察5只,则观察的结果将有0(5只全死)、1(4死1活)、2(3死2活)、3(2死3活)、4(1死4活)、5(5只全活),共6种变量。由这6种变量的相应概率组成的分布,就是n=5时活虫数的二项分布。25西南科技大学生命科学与工程学院周海廷制作3.2.2 二项式分布的概率计算方二项式分布的概率计算方法法下面用一个例子来讲解这一问题。红花豌豆和白花豌豆杂交,F2代出现红花的概率为p=3/4,出现白花的概率为
13、q=1/4。如果将F1代种子成行种植,每行种4粒。问一行全是红花、三株红花、二株红花、一株红花、0红花的概率各是多少。 26西南科技大学生命科学与工程学院周海廷制作这实际上是以n=4,从p=3/4, q=1/4的二项总体中抽样构成二项分布的问题。为方便,以“1”代表出现红花的事件,“0”代表出现白花的事件。27西南科技大学生命科学与工程学院周海廷制作红花数组合数xf(x)4红3红2红1红0红28西南科技大学生命科学与工程学院周海廷制作上例各项的概率相当于(p+q)4的展开: (p+q)4=p4+4p3q+6p2q2+4pq3+q4同理,以样本容量为n进行的抽样,得到的概率分布为(p+q)n的展
14、开。每一项的系数为: )!( !knknCkn(0kn)29西南科技大学生命科学与工程学院周海廷制作计算二项分布任何一项概率的通式为: ynyynyynqpynynqpCyP)!( !)(例4.2 某种昆虫在某地区的死亡率为40%,即p=0.4,现对这种害虫用一种新药进行治疗试验,每次抽10头作为一组治疗。试问如新药无疗效,则在10头中死3头、2头、1头,以及全部愈好的概率为多少?30西南科技大学生命科学与工程学院周海廷制作21499. 0)6 . 0()4 . 0() 3(73310 CP8头愈好,2头死去的概率为:12093. 0)6 . 0()4 . 0()2(82210 CP7头愈好,
15、3头死去的概率为:31西南科技大学生命科学与工程学院周海廷制作9头愈好,1头死去的概率为:04031. 0)6 . 0()4 . 0() 1 (91110 CP10头全部愈好的概率为:00605. 0)6 . 0()4 . 0()0(100010 CP若计算10头中不超过2头死去的概率为多少?则应该应用累积概率,即:2016729. 012093. 004031. 000605. 0)2() 1 ()0()()2(PPPypF32西南科技大学生命科学与工程学院周海廷制作3.2.3 二项式分布的形状和参数二项式分布的形状和参数一、形状0 00.050.050.10.10.150.150.20.2
16、0.250.250.30.30.350.350.40.40 01 12 23 34 45 5P=0.35,n=5的概率分布图33西南科技大学生命科学与工程学院周海廷制作(p=0.5,n=5)的概率分布图0 00.050.050.10.10.150.150.20.20.250.250.30.30.350.350 01 12 23 34 45 534西南科技大学生命科学与工程学院周海廷制作当p=q时。二项分布呈对称形状,如pq,则表现偏斜形状。但从理论和实践检验,当n很大时即使pq,它也接近对称形状。所以这一理论分布是由n n和p p两个参数决定的。二、参数二、参数凡描述一个总体,平均数和方差(或
17、标准差)两个参数是重要的。二项总体,其平均数、方差2和标准差为: npq =np, 2=npq =35西南科技大学生命科学与工程学院周海廷制作3.2.4 多项式分布多项式分布若总体内包含几种特性或分类标志,可以将总体中的个体分为几类,例如在给某一人群使用一种新药,可能有好的疗效,有的没有疗效,而另有疗效为副作用的,象这种将变数资料分为3类或多类的总体称为多项总体,研究其随机变量的概率分布可使用多项式分布多项式分布(multinomial distribution)。36西南科技大学生命科学与工程学院周海廷制作设总体中共包含k项事件,它们的概率分别为:p1、p2、p3、pk,显然 p1+p2+p
18、3+pk=1。若从这个总体随机抽取n个个体,那么可能得到这k项的个数分别为 y1、y2、y3、yk,而y1 + y2 + y3 + yk =n。其事件的概率为:kykyyykkppppyyyynyyyyP.!.!),.,(321321321321这一概率分布称为多项式分布多项式分布。37西南科技大学生命科学与工程学院周海廷制作例4.3某药对病人有效的概率为1/2,对病人无效的概率为1/3,有副作用的概率为1/6,若随机抽取2个使用该药的病人,那么我们的结果可能包括这样几种事件:2个病人有副作用;一个无效、一个有副作用;两个无效;一个有效、一个有副作用;一个有效、一个无效;两个均有效。试计算出现
19、这些事件的概率。38西南科技大学生命科学与工程学院周海廷制作解:分别用y1、y2、y3分别代表用药有效的个体数、用药无效的个体数和用药有副作用的个体数。这些事件的概率的计算见下表:39西南科技大学生命科学与工程学院周海廷制作变量(y1、y2、y3)概率及其计算P(y1、y2、y3)(0,0,2)361)61()31()21(!2!0!0!2200(0,1,1)91)61()31()21(! 1 ! 1 !0!2110(0,2,0)91)61()31()21(!0!2!0!2020(1,0,1)61)61()31()21(! 1 !0! 1!2101(1,1,0)31)61()31()21(!0
20、! 1 ! 1!2011(2,0,0)41)61()31()21(!0!0!2!200240西南科技大学生命科学与工程学院周海廷制作3.2.5 泊松分布泊松分布二项分布的一种极限二项分布的一种极限分布分布应用二项分布时,有时会遇到一个概率p或q很小的值,例如小于0.1,另一方面n又相当大,这样二项分布必将为另一分布所接近,或者为一极限分布。这种分布称为泊松概率分布,简称泊松泊松分布分布(Poisson distribution)。如将np=m,则接近分布如下式:!)(yemyPmyy=0,1,2,41西南科技大学生命科学与工程学院周海廷制作凡在观察次数n (n相当大)中,某一事件出现的平均次数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 理论 分布 抽样
限制150内