第三章概率与分布.doc





《第三章概率与分布.doc》由会员分享,可在线阅读,更多相关《第三章概率与分布.doc(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 概率与分布第一节 基础概率一、什么是随机现象客观现象随机现象随机事件的概率(即发生可能性的大小)就是随机事件隐蔽着的规律。二、概率的概念在一定条件下,随机现象可能出现多种结果。随机现象的结果以及这些结果的集合就称作随机事件,简称事件。为了使随机事件发生可能性的大小能进行比较,有必要确定概率的最大值和最小值是什么。为此,我们把不可能发生的事件称为不可能事件(记作),不可能事件发生的概率定为0:在一定条件下一定会发生的事件称作必然事件(记作S),必然事件发生的概率定为l:对于一般随机事件,由于它发生的可能性介于“必然”与“不可能”之间,因此它发生的概率介于0和1之间:0l例、某班有学生50
2、名,其中有15名女生。现从该班任抽20名学生,则“其中有10名女生”的事件为随机事件;“其中至少有5名男生”的事件为必然事件;“其中有18名女生”的事件为不可能事件。( 为什么? )三、概率的计算方法(一)频率法在相同条件下进行次试验或观察,随机事件出现的次数称作频数。频数与试验次数的比值,称作次试验或观察中事件E出现的频率,记作:=。频率具有如下性质:l、0l2、对于必然事件,频率=l; 对于不可能事件(),频率=0;3、频率具有双重性质:随机性和统计规律性。法国统计学家蒲丰(Buffon)和英国统计学家皮尔逊(KPearson)所做的大量投掷硬币的经典试验结果说明:当时,频率的稳定值反映了
3、随机事件自身固有的规律性。试验者掷币次数N出现“正面”频数n频率蒲丰皮尔逊皮尔逊4040120002400020486019120120.50690.50160.5005凭借日常生活经验可知:某事件出现的可能性(概率)越大,则实际观测结果的频率也越大,反之亦然。因此,常常把事件的概率定义为观察次数趋于无穷时相应频率的稳定值。即: = 在实际中,当概率不易求出时,往往就取充分大的频率作为概率的近似值。但应注意,频率是个试验值,具有随机性,它只能近似地反映事件出现的可能性大小。概率则是个理论值,其值是惟一的,能精确地反映事件出现可能性的大小。 (二)古典法在一定条件下, 随机现象具有多种可能的结果
4、。对随机现象的观察可近似地看做随机试验。随机试验若满足条件:(1)在相同条件下可以重复;(2)在每次试验前虽然不能预言会出现哪一种结果,但它共有多少种可能的结果是事先巳知的。我们就把随机试验中的每一种结果称作一个样本点(基本事件)。所有样本点的全体称作样本空间(S)。例、试验“投掷一颗骰子”的样本空间为:=E1、E2、E3、E4、E5、E6。 E1:出现“l”点 E2:出现“2”点 E3:出现“3”点E4:出现“4”点 E5:出现“5”点 E6:出现“6”点基本事件自身或由基本事件组成的集合就称为随机事件。它是样本空间的某个子集。若随机试验满足以下两个条件:(1)它的样本空间只有有限个样本点;
5、(2)每个样本点出现的可能性相同。则称这种随机试验为古典型随机试验,简称古典概型。对于古典概型,如果事件包含个样本点,则事件发生的概率为:也就是说,如果随机试验的各种可能结果在事前可以一一列举出来,设这种结果共有n个,且这几种结果的出现是等可能的,而所研究的事件包含有个上述的结果,则事件发生的概率为:例、投掷一颗骰子,求事件=“出现奇数点”的概率。()例、扔掷二枚均匀的硬币,求事件= “两枚都朝上”及B= “一枚朝上、一枚朝下”的概率。 ( )例、袋中装有6个白球,3个黑球。从中任取3个球,计算取出的3个球都是白球的概率。 ( )四、概率的运算(一)事件之间的关系l、事件的包含与相等如果事件A
6、发生必然导致事件B发生,则称事件B包含事件A。记作:AB或BA如,若用表示“优秀的公务员”,用表示“称职的公务员”,则事件A包含于事件B。如果AB,同时BA,那么,事件A与事件B相等,记作:A=B2、事件和事件A与事件B至少有一个发生所构成的事件C, 称作A与B的事件和, 记作:C=AB或C=AUB例如,若用表示“具有硕士学位”,用表示“具有博士学位”,用表示“具有本科以上学历”,则事件为事件A与事件B的事件和。3、事件积事件A与事件B同时发生所构成的事件C,称作A与B的事件积,记作:C=AB或C=AB例如,合格的领导干部必须德才兼备。若用表示“有德”, 用表示“有才”, 用表示“合格的领导干
7、部”,则事件为事件A与B的事件积。4、互不相容事件若事件A发生必然导致事件B不发生,反之亦然,则称事件A与事件B是互不相容的或互斥的。对于互不相容事件,有:AB(不可能事件)例如,事件“考核成绩优秀”和“考试成绩中等”是互不相容事件。5、对立事件 (逆事件)若事件A与事件B为互不相容事件,且在一次试验或观察中必有其一发生,则称事件A与事件B为对立事件。对于对立事件,有:AB(不可能事件)AB(必然事件)例如,抛掷一枚硬币中的“出现正面”和“出现反面”就是对立的事件。通常把A的对立事件记作。事件之间的关系如下图所示:图3-1-1 事件的关系(二)排列与组合1、乘法原理:一般地,如果完成一件事需要
8、个步骤,其中,做第一步有种不同的方法,做第二步有种不同的方法,做第步有种不同的方法,那么,完成这件事一共有 种不同的方法。2、加法原理:一般地,如果完成一件事有k类方法,第一类方法中有种不同做法,第二类方法中有种不同做法,第k类方法中有种不同的做法,则完成这件事共有 种不同的方法。3、排列考虑顺序(1)重复排列:从个各不相同的元素中任取一个,然后放回去,再取一个,再放回去,一共取出个。可能的取法为:例、某单位的医疗证号码为四位数,该单位最多有多少人? (2)非重复排列:从个各不相同的元素中任取个()。可能的取法为:例、一条航线上共有10个航空站,问该航线上有多少种不同的机票?109(3)全排列
9、:个各不相同的元素进行排列,可能的排列数为:4、组合问题不考虑顺序从个各不相同的元素中任取个()的排列数为: 性质:例、从1,2,3,4,5,6,7,8,9中任意选出3个数,使它们的和为偶数,则共有多少种不同的选法? 44 (三)概率的运算1、概率的加法公式(1)简化式若事件A与事件B互不相容,则 推论:如果个事件互不相容,则有:例、袋中装有6个白球,4个黑球。从中任取3个球,计算取出的3个球中至少有2个是白球的概率。解:设事件表示抽到的3个球中有i个白球(i=0,1,2,3),则 显然,与互不相容,根据概率的加法公式有:(2)一般式对于任意事件A与事件B,有:推论:如果事件A、B、C为三个任
10、意事件,则例、据统计,某校学生中父亲具有大学及以上文化程度的占35%,母亲具有大学及以上文化程度的占25%,父母双方都具有大学及以上文化程度的占15%,若从该校学生中任抽一名,问其父母亲中至少有一名具有大学及以上文化程度的概率是多少?解:设=“父亲具有大学及以上文化程度”,=“母亲具有大学及以上文化程度”,则父母亲中至少有一名具有大学及以上文化程度的概率为:35%25%15%45%2、概率的乘法公式若事件A与事件B相互独立,也就是说,如果事件A出现的概率与事件B是否出现是无关的,反之亦然。那么有: 推论:如果个事件相互独立,则有:第二节 随机变量及概率分布一、变量层次根据各种变量的取值及其数学
11、运算特性,可将变量分为1、定类变量最低层次的变量定类变量的取值只有类别属性之分,而无大小、程度之别。性别、民族、出生地、政治面貌等都是定类变量。2、定序变量定序变量的取值除了有类别属性之分外,还有等级、秩序之别。满意度(很满意、一般、不满意)、文化程度(文盲、小学、初中、高中、大学)、社会地位(上等、中等、下等)等都是常见的定序变量。3、定距变量定距变量的取值除有类别、次序属性之外,取值之间的距离还可用标准化的距离去量度。如心理学上的智商(IQ)。4、定比变量年龄、销售额、利润额等都是定比变量。5、变量层次的比较(1)根据数学运算特性,可以对变量层次作出对比,具体见下表 数学运算特性 变量层次
12、 , , ,定类变量定序变量定距变量定比变量(2)在各种实际变量中,只满足定距要求而不满足定比要求的变量并不多。真正的定距变量大概只有心理学上的智商(IQ)。因此,在实际研究中一般不再区分定距或定比,而是把它们当作一类,统称为定距变量。(3)变量的层次并不是惟一的。事实上,高层次的变量必然可以作为低层次的变量来使用。当然,降低变量的层次一般会使资料的信息使用不完全。二、概率分布随机事件及其概率回答的是随机现象中某一局部的结果。概率分布回答的是随机现象一共有多少种可能的结果,以及每种结果所伴随的概率是多少。要确定随机变量的概率分布,就要确定随机变量有哪些可能的取值,并确定随机变量取各个可能值的概
13、率大小。确定变量取值的基本原则是完备性与互不相容性(互斥性)。若变量的取值满足了完备性和互不相容性,那么,随机变量的各个取值和相应的概率对的集合即为随机变量的概率分布。 概率分布(理论分布) 频率分布(经验分布)随机变量根据其取值是否连续,可分为离散型随机变量和连续型随机变量。 (一)离散型随机变量的概率分布离散型随机变量的概率分布可作以下表达: i=1,2,它表示随机变量取值的概率为。至于具体是什么?等于多少?要根据随机现象的实际情况而定。但必须知道了全部值及其对应的概率值,概率分布才是确定的。可通过如下概率分布表的形式来直观地表示离散型随机变量的概率分布。 有了概率分布表,不仅可知道随机变
14、量的所有可能取值及其对应的概率,还可计算出随机变量落在某一区间内的概率或小于某一取值的概率等。例如,随机变量的取值在和之间的概率为:概率分布的性质:l、任一取值的概率都是非负的,即 0 (非负性)2、随机变量取遍所有取值,其相应概率总和为l,即 1 (完备性)例、12个零件中有9个为合格品,3个为次品。现用它们来装配机器,若取到次品,则不放回再另取一个,直到取到合格品为止。设“取到合格品以前取出的次品数”,试求的概率分布。解:由题目可知,X的可能取值为0,1,2,3;其相应概率为: P(X=0)=0.75 P(X=1)=0.2045P(X=2)=0.041 P(X=3)=0.0045 X的概率
15、分布为:X0123Pi0.750.20450.0410.0045思考题:1、扔掷二枚骰子,并记录其点数,求:(1)=“点数之和”的概率分布;(2)=“点数之差的绝对值”的概率分布。点数和 2 3 4 5 6 7 8 9 10 11 12 点数之差的绝对值 0 1 2 3 4 5 (二)连续型随机变量的概率分布对于连续型随机变量,有:0因此,应考虑落在某个区间的概率。连续型随机变量的分布密度或概率密度为: ()可见,若把频率看做概率的近似值,则概率密度就相当于频率密度。对于连续型随机变量,只要有了概率密度,就可以通过求解定积分来求出其落在任意两点之间的概率,即:概率密度函数具有以下性质:1、0
16、(非负性) 2、 (完备性) (三)分布函数除了用概率分布和概率密度来分别研究离散型变量和连续型随机变量的分布特征外,还可用一个统一的量来研究这两种不同类型的变量。这就是分布函数。分布函数定义为:P() ( 类似于向上累计频率 )它表示随机变量从到所研究的点的概率总和。对于离散型随机变量,若其概率分布是已知的,那么,按概率加法原理有:P()对于连续型随机变量,若已知它的概率密度,那么根据微积分的知识可得:P()分布函数和概率分布是一一对应的关系。第三节 数学期望和方差一、数学期望(总体均值)随机变量的集中趋势若离散型随机变量的概率分布为: 则的数学期望E()为:E() ( )若连续型随机变量的
17、概率密度为,则的数学期望E()为:E()通过数学期望,可以对不同分布进行比较。例、有甲、乙两名选手,根据已往经验,他们夺取奖牌的概率如下表所示:甲: (名次)1 2 3P0.3 0.3 0.4乙:(名次)1 2 3P0.2 0.5 0.3 E(1)=10.320.430.3 =2.1 E(2)=10.220.530.3=2.1 两人的平均水平是一样的。数学期望的性质:(l) 常数的数学期望等于该常数本身,即E()。(2) 随机变量与常数之和的期望,等于随机变量的期望与该常数之和。E()E()(3) 常数与随机变量乘积的数学期望,等于这个常数与随机变量期望的乘积。E()E()(4) 综合以上两点
18、有:E(b)E()b(5) 两个随机变量之和的数学期望,等于它们的数学期望之和。E()=E()十E()推广:有限个随机变量之和的数学期望,等于它们的数学期望之和。(6) 两个独立随机变量乘积的数学期望,等于它们的数学期望之积。E()=E()E()推广:有限个独立随机变量乘积的数学期望,等于它们的数学期望的乘积。E()=E(1)E(2)E(n) 二、方差与标准差随机变量的离散趋势离散型随机变量的方差D()为:D()( )连续型随机变量的方差D()为:D()根据方差和标准差的定义可知:方差和标准差永远都是正值。方差和标准差都反映了随机变量的可能值偏离数学期望的程度。方差值越小,密集的程度越高,变量
19、的分布越集中;反之,方差值较大,则分散程度越高,变量的分布越分散。计算方差除了使用基本公式D()外,还常常使用简化的公式:方差的性质:(1)常数的方差永远为零,即D()0(2)随机变量与常数之和的方差等于随机变量的方差。D()D()(3)常数与随机变量乘积的方差等于该常数的平方与随机变量方差的乘积。 (4)两个独立随机变量之和的方差等于它们的方差和。D()=D()十D()推广:有限个独立随机变量之和的方差等于它们的方差和。D(i)=D(i)第四节 常用的离散型分布一、二项分布(一)二点分布只有两类取值的二分变量观察一次的分布为了便于处理,实际中常把二分变量的两种结果分别用代码来表示,习惯上用0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三章 概率与分布 第三 概率 分布

限制150内