第四讲 概率和概率分布精选文档.ppt
《第四讲 概率和概率分布精选文档.ppt》由会员分享,可在线阅读,更多相关《第四讲 概率和概率分布精选文档.ppt(122页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲第四讲 概率和概率分布概率和概率分布本讲稿第一页,共一百二十二页上一章内容回顾上一章内容回顾n n试验资料均具有集中性和离散性两种基本特征。试验资料均具有集中性和离散性两种基本特征。n n平均数是反映集中性的特征数,变异数是反映离散性平均数是反映集中性的特征数,变异数是反映离散性的特征数。的特征数。n n平均数包括算术平均数、中位数、众数和几何平均平均数包括算术平均数、中位数、众数和几何平均数。算术平均数具有离均差之和等于零和离均差平数。算术平均数具有离均差之和等于零和离均差平方和为最小的性质。方和为最小的性质。n n变异数包括极差、方差、标准差和变异系数。方差等于变异数包括极差、方差、
2、标准差和变异系数。方差等于观测值离均差的平方和除以自由度,可以反映出资料中观测值离均差的平方和除以自由度,可以反映出资料中每一个观测值的变异。标准差是方差的平方根,其单位每一个观测值的变异。标准差是方差的平方根,其单位与平均数相符;用标准差除以平均数即为变异系数,可与平均数相符;用标准差除以平均数即为变异系数,可以进行单位不同资料间变异程度的比较。以进行单位不同资料间变异程度的比较。本讲稿第二页,共一百二十二页n n前面两章,我们介绍了如何搜集和整理样本资料。但是,我们研究一组样本数据的最终目的不在于研究样本本身,而是根据样本提供的信息对其来自的总体的特征和分布规律作出尽可能精确和可靠的推断,
3、这称为统计推断。n n由于抽样误差的存在,统计推断的结论带有一定的不确定性,即它不可能是完全正确的。n n所以,我们在理解和运用统计推断的方法之前,必须熟悉不确定性的理论概率和概率分布。本讲稿第三页,共一百二十二页第一节第一节 概率的基本概念概率的基本概念一、概率论的一些基本术语1、试验:通常我们把根据某一研究目的,在一定条件对自然现象所进行的观察或试验统称为试验。例如,抛一枚硬币;掷一次骰子;观察随机挑选的6个新生婴儿中男婴的数目本讲稿第四页,共一百二十二页2、随机试验:试验之前无法预测出现哪一个结果的试验称为随机试验。例如,抛硬币;掷骰子;观察随机挑选的6个新生婴儿中男婴的数目;在一定条件
4、下生长的小麦随机挑选出一株测株高。注意:生物统计学里是以随机试验为研究对象的。本讲稿第五页,共一百二十二页3、基本事件:试验的每一个最基本的结果。一般用小写字母a,b,c,来表示4、事件:基本事件的集合。一般用大写字母A,B,C,来表示6、不可能事件:任何一次试验中,一定不会出现的结果。其概率为0,用表示。5、必然事件-对于一类事件来说,在同一组条件的实现之下必然要发生的,称为必然事件;其概率为1。本讲稿第六页,共一百二十二页例一,在掷一次骰子的试验中,有如下的一些可能发生的事件:基本事件有6个:1,2,3,4,5,6其它的事件有:事件A得到一个奇数1,3,5事件D得到一个不小于2的数2,3,
5、4,5,6事件B得到一个偶数2,4,6事件C得到最大的数6事件E得到数字0本讲稿第七页,共一百二十二页7、频率、频率频率的定义:设事件A在n次重复试验中发生了m次,其比值m/n称为事件A发生的频率,记为W(A)=m/n 显然事件A的频率是介于0和1之间的一个数 0 W(A)1 本讲稿第八页,共一百二十二页8、概率一个事件A的概率,记为P(A),是事件A发生的可能性的定量计量。概率的三个性质:概率的三个性质:(1 1)任何事件概率均满足)任何事件概率均满足 0 0P(A)1P(A)1(2 2)必然事件的概率为)必然事件的概率为1 1(3 3)不可能事件的概率为)不可能事件的概率为0 0,即,即P
6、(P()0 0注意:计算概率时,结果为注意:计算概率时,结果为5 5或或0.30.3时肯定是错误的。时肯定是错误的。概率(probability)-每一个事件出现的可能性称为该事件的概率。本讲稿第九页,共一百二十二页概率的求法两种途径:(1)统计方法(适用于进行了大量试验时):(适用于进行了大量试验时):假设试验共进行n次,事件A出现了m次,则事件A发生的频率是m/n。随着n的增大,频率m/n趋于一个常数p,那么p就是事件A发生的概率。例如:如何求一个人某年中被闪电击中的概率?例如:如何求一个人某年中被闪电击中的概率?中国中国1.3101.3109 9人中,在人中,在20082008年被闪电击
7、中的人数为年被闪电击中的人数为39003900人,人,则某人被闪电击中的概率为则某人被闪电击中的概率为3900/1.3103900/1.3109 9=310=310-6-6。本讲稿第十页,共一百二十二页(2)理论方法(适用于可以进行数学推算,在试验理论方法(适用于可以进行数学推算,在试验的每个基本事件等可能时):的每个基本事件等可能时):例如:例如:A A掷骰子得到一个奇数掷骰子得到一个奇数1,3,51,3,5的概率为的概率为P(A)=m/n=3/6=1/2P(A)=m/n=3/6=1/2本讲稿第十一页,共一百二十二页解:事件解:事件A A孩子性别为两男孩子性别为两男 男男男男 所有可能的基本
8、事件有:所有可能的基本事件有:男男男男 男女男女 女男女男 女女女女 所以所以P(A)=m/n=1/4P(A)=m/n=1/4两个孩子的家庭里,孩子性别为两男的概率是多少?两个孩子的家庭里,孩子性别为两男的概率是多少?同理,孩子性别为一男一女的概率是同理,孩子性别为一男一女的概率是2/4=1/22/4=1/2注意:在生物统计学里,我们着重于讨论理论方法。本讲稿第十二页,共一百二十二页二、事件间的关系二、事件间的关系1、和事件和事件2、积事件积事件 3、互斥事件互斥事件4、对立事件对立事件5、完全事件系完全事件系6、事件的独立性事件的独立性本讲稿第十三页,共一百二十二页 1、和事件和事件 事件事
9、件A和和B至少有一个发生而构成的新事件称为事件至少有一个发生而构成的新事件称为事件A和和B的的和事件和事件,记为,记为A+BA+B,读作,读作“或者或者A发生,或者发生,或者B发生发生”。例如,有一批种子,包含有能发芽的和不能发芽的。若例如,有一批种子,包含有能发芽的和不能发芽的。若A为为“取到能发芽种子取到能发芽种子”,B为为“取到不能发芽种子取到不能发芽种子”,则,则A+B为为“或者或者取到能发芽种子或者取到不能发芽种子取到能发芽种子或者取到不能发芽种子”。事件间的和事件可以推广到多个事件:事件事件间的和事件可以推广到多个事件:事件A1、A2、An至少至少有一发生而构成的新事件称为事件有一
10、发生而构成的新事件称为事件A1、A2、An的和事件,记为的和事件,记为A1+A2+An=本讲稿第十四页,共一百二十二页2、积事件积事件 事件事件A和和B同时发生所构成的新事件称为事件同时发生所构成的新事件称为事件A和和B的的积事件积事件,记,记作作ABAB,读作,读作“A和和B同时发生同时发生”。事件间的积事件也可以推广到多个事件:事件事件间的积事件也可以推广到多个事件:事件A1、A2、An同时发生所构成的新事件称为这同时发生所构成的新事件称为这n个事件的积事件,记作个事件的积事件,记作A1A2An=本讲稿第十五页,共一百二十二页3、互斥事件互斥事件 事件事件A和和B不可能同时发生,即不可能同
11、时发生,即AB为不可能事件,记作为不可能事件,记作AB=V,称事件,称事件A和和B互斥或互不相容互斥或互不相容。例如,有一袋种子,按种皮分黄色和白色。若记例如,有一袋种子,按种皮分黄色和白色。若记A为为“取到黄色取到黄色”,B为为“取到白色取到白色”,显然,显然A和和B不可能同时发生,即一粒种子不不可能同时发生,即一粒种子不可能既为黄色又为白色,说明事件可能既为黄色又为白色,说明事件A和和B互斥。互斥。这一定义也可以推广到这一定义也可以推广到n个事件。事件个事件。事件A1、A2、An不可能不可能同时发生所构成的新事件称为这同时发生所构成的新事件称为这n个事件互斥或互不相容,记作个事件互斥或互不
12、相容,记作A1A2An=V。本讲稿第十六页,共一百二十二页4、对立事件对立事件 事件事件A和和B不可能同时发生,但必发生其一,即不可能同时发生,但必发生其一,即A+B为必然为必然事件事件(记为记为A+B=U),AB为不可能事件为不可能事件(记为记为AB=V),则称事件),则称事件B为事件为事件A的的对立事件对立事件,并记,并记B为为 。例如,上面例子中例如,上面例子中A为为“取到黄色取到黄色”,B为为“取到白色取到白色”,A与与B不可能同时发生,但是,任意抽取一粒种子,其皮色不是黄色不可能同时发生,但是,任意抽取一粒种子,其皮色不是黄色就是白色,即就是白色,即A和和B必发生其一,因此,必发生其
13、一,因此,A和和B互为对立事件。互为对立事件。本讲稿第十七页,共一百二十二页5、完全事件系完全事件系 若事件若事件A1、A2、An两两互斥,且每次试验结果必发生其一,两两互斥,且每次试验结果必发生其一,则称则称A1、A2、An为为完全事件系完全事件系。例如,仅有三类花色:黄色、白色和红色,则取一朵花,例如,仅有三类花色:黄色、白色和红色,则取一朵花,“取到取到黄色黄色”、“取到白色取到白色”和和“取到红色取到红色”就构成完全事件系。就构成完全事件系。本讲稿第十八页,共一百二十二页6、事件的独立性事件的独立性 若事件若事件A发生与否不影响事件发生与否不影响事件B发生的可能性,则称事件发生的可能性
14、,则称事件A和事和事件件B相互独立相互独立。例如,事件例如,事件A为为“花的颜色为黄色花的颜色为黄色”,事件,事件B为为“产量高产量高”,显然如果花的颜色与产量无关显然如果花的颜色与产量无关,则事件则事件A与事件与事件B相互独立。相互独立。本讲稿第十九页,共一百二十二页三、计算事件概率的法则三、计算事件概率的法则1、互斥事件的加法互斥事件的加法 2、独立事件的乘法独立事件的乘法3、对立事件的概率对立事件的概率4、完全事件系的概率完全事件系的概率5、非独立事件的乘法非独立事件的乘法本讲稿第二十页,共一百二十二页1、互斥事件的加法互斥事件的加法 假定两互斥事件假定两互斥事件A和和B的概率分别为的概
15、率分别为P(A)和和P(B)。则事件。则事件A与与B的和事件的概率等于事件的和事件的概率等于事件A的概率与事件的概率与事件B的概率之和,即的概率之和,即P(A+B)=P(A)+P(B)。加法定理对于多个两两互斥的事件也成立:假定加法定理对于多个两两互斥的事件也成立:假定A1、A2、An n个事件彼此间均是两两互斥的事件,其概率依次为个事件彼此间均是两两互斥的事件,其概率依次为P(A1),P(A2),P(An),则,则A1,A2到到An和事件的概率和事件的概率P(A1+A2+An)等于等于P(A1),P(A2),P(An)之和,即之和,即P(A1+A2+An)=P(A1)+P(A2)+P(An)
16、。本讲稿第二十一页,共一百二十二页 例如,一捆花中红、黄、白花的概率分别为例如,一捆花中红、黄、白花的概率分别为0.2、0.3、0.5,那么我们随机抽取一朵非白色花的概率为,那么我们随机抽取一朵非白色花的概率为0.5(=0.2+0.3),这只是由加法定理得到的两个事件概率之和。这只是由加法定理得到的两个事件概率之和。本讲稿第二十二页,共一百二十二页2、独立事件的乘法独立事件的乘法 假定假定P(A)和和P(B)是两个独立事件是两个独立事件A与与B各自出现的概率,则事各自出现的概率,则事件件A与与B同时出现的概率等于两独立事件出现概率同时出现的概率等于两独立事件出现概率P(A)与与P(B)的的乘积
17、,即乘积,即P(AB)=P(A)P(B)乘法定理对于乘法定理对于n个相互独立的事件也成立。假定个相互独立的事件也成立。假定P(A1),P(A2),P(An)是是n个相互独立事件各自出现的概率,则该个相互独立事件各自出现的概率,则该n个事件同个事件同时出现的概率时出现的概率P(A1A2An)等于各自出现概率之乘积,即等于各自出现概率之乘积,即P(A1A2An)=P(A1)P(A2)P(An)。本讲稿第二十三页,共一百二十二页 现有现有4粒种子,其中粒种子,其中3粒为黄色、粒为黄色、1粒为白色,采用复置抽粒为白色,采用复置抽样。试求下列两事件的概率:样。试求下列两事件的概率:(A)第一次抽到黄色、
18、第二次抽到白色;第一次抽到黄色、第二次抽到白色;(B)两次都抽到黄色。两次都抽到黄色。由于采用复置抽样由于采用复置抽样(即每一次抽出观察结果后又放回再进行即每一次抽出观察结果后又放回再进行下一次抽样下一次抽样),所以第一次和第二次的抽样结果间是相互独立的。,所以第一次和第二次的抽样结果间是相互独立的。本讲稿第二十四页,共一百二十二页 采用概率的古典定义,可以求出抽到黄色种子的概率为采用概率的古典定义,可以求出抽到黄色种子的概率为0.75,抽到白色种子的概率为,抽到白色种子的概率为0.25。因此,有。因此,有P(A)=P(第一次抽到黄色种子第一次抽到黄色种子)P(第二次抽到白色种子第二次抽到白色
19、种子)=0.250.75=0.1875,P(B)=P(第一次黄色种子第一次黄色种子)P(第二次黄色种子第二次黄色种子)=0.750.75=0.5625。本讲稿第二十五页,共一百二十二页3、对立事件的概率、对立事件的概率 若事件若事件A的概率为的概率为P(A),那么其对立事件的概率为:,那么其对立事件的概率为:本讲稿第二十六页,共一百二十二页4、完全事件系的概率完全事件系的概率 完全事件系的概率为完全事件系的概率为1。例如例如“从从10个数字中随机抽得任何一个数字都可以个数字中随机抽得任何一个数字都可以”这样一个事件是完全事件系,其概率为这样一个事件是完全事件系,其概率为1。本讲稿第二十七页,共
20、一百二十二页5、非独立事件的乘法非独立事件的乘法 如果事件如果事件A和和B是非独立的,那么事件是非独立的,那么事件A与与B同时发生的概同时发生的概率为事件率为事件A的概率的概率P(A)乘以事件乘以事件A发生的情况下事件发生的情况下事件B发生的发生的概率概率P(B|A),即:即:P(AB)=P(A)P(B|A)本讲稿第二十八页,共一百二十二页第二节第二节 概率分布概率分布一、随机变量1、随机变量:就是随机试验中被测的变量。例如:例如:(1 1)测量一定条件下生长的小麦的株高。小麦株高是随机变量)测量一定条件下生长的小麦的株高。小麦株高是随机变量(2 2)从)从10001000只动物(雌雄各半)的
21、群体,放回式抽样,每只动物(雌雄各半)的群体,放回式抽样,每次抽取次抽取1010只,记录其中雄性的个数。设只,记录其中雄性的个数。设1010只动物中雄性只动物中雄性的个数为的个数为X X,则,则X X就是一个随机变量。就是一个随机变量。随机变量的取值有随机性。随机变量所有可能值的分布规律称为概率分布概率分布。本讲稿第二十九页,共一百二十二页随机变量随机变量能帮助我们深入理解总体和样本的概念,能帮助我们深入理解总体和样本的概念,使使总体和样本的关系更加明确总体和样本的关系更加明确。随机变量的引入使统。随机变量的引入使统计学的深入研究成为可能。计学的深入研究成为可能。n随机变量与总体和样本的关系总
22、体:随机变量可能取值的全体样本:随机变量的n个独立观察值例如在研究一定条件下生长的小麦的株高时,例如在研究一定条件下生长的小麦的株高时,总体是总体是所有所有在这种条件下生长的小麦的株高的全体,也就是在这种条件下生长的小麦的株高的全体,也就是小麦株小麦株高这个随机变量的所有可能的取值高这个随机变量的所有可能的取值。假如获得了。假如获得了200200株小株小麦株高数据的样本,麦株高数据的样本,样本也就是小麦株高这个随机变量样本也就是小麦株高这个随机变量的的200200次独立观测值次独立观测值。本讲稿第三十页,共一百二十二页随机变量一般用大写字母来表示,如X,Y,U等。变量的观测值一般用小写字母来表
23、示,如xi,yi,ui等表示随机变量X,Y,U的第i次观测值。本讲稿第三十一页,共一百二十二页 2、随机变量的类型(1)离散型变量:取值有限个或可数无穷个孤立的数离散型变量:取值有限个或可数无穷个孤立的数值。值。譬如:a,掷一次骰子得到的数 b,一只母鸡一周里下的蛋数(2)连续型变量:可能取值为某范围(或某区间)内的任连续型变量:可能取值为某范围(或某区间)内的任何值。可能取的值间不存在间隙。何值。可能取的值间不存在间隙。譬如:a,小麦株高 b,奶牛产奶量本讲稿第三十二页,共一百二十二页二、概率分布变量的概率分布是描述该变量的所有值的分布的规律,也就是变量对应的总体的分布。概率分布总体的值的分
24、布频数分布样本的值的分布本讲稿第三十三页,共一百二十二页 1、离散型随机变量的概率分布、离散型随机变量的概率分布 -当试验只有几个确定的结果,并可一一列出,变量当试验只有几个确定的结果,并可一一列出,变量y的取值的取值可用实数表示,且可用实数表示,且y取某一值时,其概率是确定的,这种类型的变量取某一值时,其概率是确定的,这种类型的变量称为离散型随机变量。称为离散型随机变量。将这种变量的所有可能取值及其对应概率一一列出所形成的分布称为将这种变量的所有可能取值及其对应概率一一列出所形成的分布称为离散型随机变量的概率分布:离散型随机变量的概率分布:概率概率变变变变量量量量y yi iy y1 1y
25、y2 2y y3 3y yn nP P1 1P P2 2P P3 3P Pn n也可用函数也可用函数f(y)表述,称为概率函数。表述,称为概率函数。本讲稿第三十四页,共一百二十二页 例:抛硬币试验,硬币落地后只有两种可能结果:币值面例:抛硬币试验,硬币落地后只有两种可能结果:币值面向上和国徽面向上,用数向上和国徽面向上,用数“1”表示表示“币值面向上币值面向上”,用数,用数“0”表示表示“国徽面向上国徽面向上”。把。把0,1作为变量作为变量y的取值。在讨论试验结的取值。在讨论试验结果时,就可以简单地把抛硬币试验用取值为果时,就可以简单地把抛硬币试验用取值为0,1的变量来表的变量来表示。示。P(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四讲 概率和概率分布精选文档 第四 概率 分布 精选 文档
限制150内