统计学第五章概率分布与抽样分布课件.ppt
《统计学第五章概率分布与抽样分布课件.ppt》由会员分享,可在线阅读,更多相关《统计学第五章概率分布与抽样分布课件.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学第五章概率分统计学第五章概率分布与抽样分布布与抽样分布第1页,此课件共85页哦学习目标学习目标1.了解随机事件及概率分布了解随机事件及概率分布2.理解抽样分布的意义理解抽样分布的意义3.了解抽样分布的形成过程了解抽样分布的形成过程4.理解中心极限定理理解中心极限定理5.理解抽样分布的性质理解抽样分布的性质第2页,此课件共85页哦第一节 随机事件与概率分布第3页,此课件共85页哦一、随机试验与随机事件一、随机试验与随机事件1.必然现象(确定性现象)必然现象(确定性现象)u变化结果是事先可以确定的,一定的条件必然导致变化结果是事先可以确定的,一定的条件必然导致某一结果某一结果u这种关系通常可
2、以用公式或定律来表示这种关系通常可以用公式或定律来表示2.随机现象随机现象 (有不确定性,但不等同于偶然现象)(有不确定性,但不等同于偶然现象)u在相同条件下可能发生也可能不发生的现象在相同条件下可能发生也可能不发生的现象u个别观察个别观察的结果完全是的结果完全是偶然偶然的、随机会而定的、随机会而定u大量观察大量观察的结果会呈现出某种的结果会呈现出某种规律规律性性 (随机性中寓含着规律性)(随机性中寓含着规律性)统计规律性统计规律性十五的夜晚十五的夜晚能看见月亮能看见月亮?十五的月亮比初十圆!第4页,此课件共85页哦随机试验随机试验1.严格意义上的随机试验满足三个条件:严格意义上的随机试验满足
3、三个条件:u试验可以在相同的条件下重复进行;试验可以在相同的条件下重复进行;u每次试验的每次试验的可能结果可能结果不止一个,但试验的所有可能结果在不止一个,但试验的所有可能结果在试验之前试验之前是是明确明确可知的;可知的;u每次试验只能观察到可能结果中的一个,但在试验结束每次试验只能观察到可能结果中的一个,但在试验结束之前不能肯定哪一个结果会出现。之前不能肯定哪一个结果会出现。2.广义的随机试验是指对随机现象的观察(或实验)广义的随机试验是指对随机现象的观察(或实验)u实际应用中多数试验不能同时满足上述条件,常常从广义角度来实际应用中多数试验不能同时满足上述条件,常常从广义角度来理解。理解。第
4、5页,此课件共85页哦随机事件(事件)随机事件(事件)1.随机事件(简称事件)随机事件(简称事件)u随机试验的每一个可能结果随机试验的每一个可能结果u常用大写英文字母常用大写英文字母A、B、来表示、来表示2.基本事件(样本点)基本事件(样本点)中国足球队胜、负、平中国足球队胜、负、平u不可能再分成为两个或更多事件的事件:不可能再分成为两个或更多事件的事件:3.样本空间(样本空间()u在一项随机试验中,每一个基本事件称为一个样本点,而所在一项随机试验中,每一个基本事件称为一个样本点,而所有样本点构成这项试验的样本空间。有样本点构成这项试验的样本空间。显然,显然,样本空间样本空间等同于集合论中的等
5、同于集合论中的全集全集,基本事件基本事件对应于全集中的对应于全集中的元元素素,满足某些规定性质的,满足某些规定性质的随机事件随机事件就是集合论中的一个就是集合论中的一个子集子集。第6页,此课件共85页哦随机事件(续)随机事件(续)1.随机事件的两种特例随机事件的两种特例u必然事件必然事件l在一定条件下,每次试验都必然发生的事件在一定条件下,每次试验都必然发生的事件l必然事件发生的概率为必然事件发生的概率为1 u 不可能事件不可能事件l在一定条件下,每次试验都必然不会发生的事件在一定条件下,每次试验都必然不会发生的事件l不可能事件是一个空集(不可能事件是一个空集()第7页,此课件共85页哦二、随
6、机事件的概率二、随机事件的概率1.概率概率u用来用来度量度量随机事件发生的随机事件发生的可能性可能性大小的大小的数值数值u必然事件的概率为必然事件的概率为1,表示为,表示为P()=1u不可能事件发生的可能性是零,不可能事件发生的可能性是零,P()=0u随机事件随机事件A的概率介于的概率介于0和和1之间,之间,0P(A)1第8页,此课件共85页哦概率的概率的统计统计定义定义当试验次数当试验次数 n 很大时很大时,事件,事件A发生频率发生频率m/n 稳稳定地在某一常数定地在某一常数 p 上下波动,而且这种波动的幅度上下波动,而且这种波动的幅度一般会随着试验次数增加而缩小,则定义一般会随着试验次数增
7、加而缩小,则定义 p 为事件为事件A发生的概率发生的概率当当n相当大时,可用事件发生的频率相当大时,可用事件发生的频率m/n作为其作为其概率的一个近似值概率的一个近似值计算概率的统计方法(频率方法)计算概率的统计方法(频率方法):贝努利概型:贝努利概型第9页,此课件共85页哦事件的概率事件的概率例例如如,投投掷掷一一枚枚硬硬币币,出出现现正正面面和和反反面面的的频频率率,随随着着投投掷掷次次数数 n 的的增增大大,出出现现正正面面和和反反面面的的频频率率稳稳定定在在1/2左右左右试验的次数试验的次数正面正面 /试验次数试验次数1.001.000.000.000.250.250.500.500.
8、750.750 0252550507575100100125125实验次数正面正面/实验次数111.00 210.50 310.33 410.25 520.40 630.50 740.57 850.63 960.67 1070.70 1180.73 1290.75 1390.69 1490.64 1590.60 16100.63 17100.59 18100.56 19110.58 20120.60 21130.62 22140.64 23150.65 24160.67 25160.64 第10页,此课件共85页哦历史上有很多人都曾经做过抛硬币试验:历史上有很多人都曾经做过抛硬币试验:试验者试
9、验次数正面出现的频率蒲丰40400.5069K.皮尔逊120000.5016K.皮尔逊240000.5005罗曼诺夫斯基806400.4979第11页,此课件共85页哦三、随机变量的概念三、随机变量的概念1.随机变量随机变量表示随机试验结果的变量表示随机试验结果的变量u取值是随机的,事先不能确定取哪一个值取值是随机的,事先不能确定取哪一个值 u一个取值对应随机试验的一个可能结果一个取值对应随机试验的一个可能结果u用大写字母如用大写字母如X、Y、Z.来表示,具体取值则来表示,具体取值则用相应的小写字母如用相应的小写字母如x、y、z来表示来表示 2.根据取值特点的不同,可分为根据取值特点的不同,可
10、分为:u离散型离散型随机变量随机变量取值可以一一列举取值可以一一列举u连续型连续型随机变量随机变量取值不能一一列举取值不能一一列举第12页,此课件共85页哦离散型随机变量离散型随机变量1.随随机机变变量量 X 取取有有限限个个值值或或所所有有取取值值都都可可以以逐逐个个列列举举出出来来 X1,X2,2.以确定的概率取这些不同的值以确定的概率取这些不同的值3.离散型随机变量的一些例子离散型随机变量的一些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2,1000,1,2,0,1,2,男性为0,女性为1第13页,此
11、课件共85页哦连续型随机变量连续型随机变量1.随机变量随机变量 X 取无限个值取无限个值2.所所有有可可能能取取值值不不可可以以逐逐个个列列举举出出来来,而而是是取取数数轴轴上上某某一一区区间内的任意点间内的任意点3.连续型随机变量的一些例子连续型随机变量的一些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X 00 X 100X 0第14页,此课件共85页哦四、随机变量的概率分布四、随机变量的概率分布 1.1.离散型随机变量的概率分布离散型随机变量的概率分布离散型随机变量的概率分布离散型随机变量的概率分布 2.2
12、.连续型随机变量的概率密度连续型随机变量的概率密度连续型随机变量的概率密度连续型随机变量的概率密度 3.3.分布函数分布函数分布函数分布函数n不同的随机试验,其不同的随机试验,其样本空间样本空间的具体构成的具体构成千差万别千差万别。n但是,实质上,如果把具体内容抽象掉,将随机事件数量化,就会发现但是,实质上,如果把具体内容抽象掉,将随机事件数量化,就会发现许多随机试验中概率的计算具有某种许多随机试验中概率的计算具有某种共同性共同性,遵循某一种概率分布模型。,遵循某一种概率分布模型。n只要能只要能找到找到这些这些概率分布模型概率分布模型,就会为我们计算概率和研究同类随机现象的规,就会为我们计算概
13、率和研究同类随机现象的规律性提供方便。律性提供方便。因此,随机变量及其概率分布是因此,随机变量及其概率分布是描述随机现象描述随机现象的重要工具。的重要工具。第15页,此课件共85页哦概率函数概率函数 P(X=xi)=pi离散型概率分布的表示:离散型概率分布的表示:1.离散型随机变量的概率分布离散型随机变量的概率分布1.离散变量离散变量X的的概率分布概率分布离散型随机变量离散型随机变量X的每一个可能的取值的每一个可能的取值xi 与其概率与其概率 pi(i=1,2,3,n)之间所确立的对应关系称为这个离散型随机变量的)之间所确立的对应关系称为这个离散型随机变量的分布。分布。2.概率分布具有如下两个
14、基本性质概率分布具有如下两个基本性质:(1)pi0,i=1,2,n;(2)X=xix1x2xnP(X=xi)=pip1p2pn第16页,此课件共85页哦离散型随机变量的概率分布离散型随机变量的概率分布(实例)(实例)【例例】如如规规定定打打靶靶中中域域得得2分分,中中域域得得1分分,中中域域及及中中域域外外得得0分分。今今某某射射手手每每100次次射射击击,平平均均有有30次次中中域域,60次次中中域域,10次次中中及及中中域域外外。则则考考察察每每次次射射击击得得分分为为0,1,2这这一一离离散散型型随随机机变变量量,求其概率分布。求其概率分布。第17页,此课件共85页哦射击得分的概率分布表
15、示:射击得分的概率分布表示:分布图分布图0.60.300 1 2 xP(x)图图3-5 例例3-9的概率分布的概率分布X=xi0 1 2P(X=xi)pi 0.1 0.6 0.3第18页,此课件共85页哦2.连续型随机变量的概率密度连续型随机变量的概率密度 1.对于连续型随机变量,我们关心的往往不是它取某个特定值的概率,而是该对于连续型随机变量,我们关心的往往不是它取某个特定值的概率,而是该随机变量落在一定区间内的随机变量落在一定区间内的概率;概率;2.连续型随机变量的概率分布只能表示为:连续型随机变量的概率分布只能表示为:u数学函数数学函数概率密度函数概率密度函数f(x)和分布函数和分布函数
16、F(x)u图图 形形概率密度曲线和分布函数曲线概率密度曲线和分布函数曲线3.概率密度函数概率密度函数f(x)的函数值不是概率;的函数值不是概率;而而x轴以上、概率密度轴以上、概率密度曲线曲线下方下方面面积积才才表示概率。表示概率。f(x)xab 随机随机变变量量X在一定区在一定区间间(a,b)上的概率)上的概率为为:第19页,此课件共85页哦什什 么么 是是 概概 率率 密密 度度?第20页,此课件共85页哦连续数据的概率分布:连续数据的概率分布:表 零件尺寸的分组表按零件尺寸分组频数(个)105110110115115120120125125130130135135140358141064合
17、计50第21页,此课件共85页哦频数直方图频数直方图频频频频频频数数数数数数(个个个个个个)151512129 96 63 3105105110110 115115 120120 125125 130130 135135 140140 零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸图图图图 零件尺寸分布频数的直方图零件尺寸分布频数的直方图零件尺寸分布频数的直方图零件尺寸分布频数的直方图问题:曲线下面积为问题:曲线下面积为 1 吗?吗?第22页,此课件共85页哦连续数据的概率分布:连续数据的概率分布:表 零件按尺寸数据的分组表按零件尺寸分组频数(个)频率10511011011511512012
18、01251251301301351351403581410640.060.100.160.280.200.120.08合计501频率频率=频数频数/总数总数第23页,此课件共85页哦频率直方图频率直方图频频频频频频率率率率率率 0.32 0.32 0.24 0.240.180.180.120.120.060.06105105110110 115115 120120 125125 130130 135135 140140 零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸图图图图 零件尺寸分布频率的直方图零件尺寸分布频率的直方图零件尺寸分布频率的直方图零件尺寸分布频率的直方图问题:曲线下面积为问题
19、:曲线下面积为 1 吗?吗?第24页,此课件共85页哦连续数据的概率分布:连续数据的概率分布:表 零件按尺寸数据的分组表按零件尺寸分组频数(个)频率频率密度1051101101151151201201251251301301351351403581410640.060.100.160.280.200.120.080.0120.0200.0320.0560.0400.0240.016合计501-频率密度频率密度=频率频率/组距组距第25页,此课件共85页哦频率密度直方图频率密度直方图频频频频频频率率率率率率密密密密密密度度度度度度 0.060 0.060 0.048 0.0480.0360.03
20、60.0240.0240.0120.012105105110110 115115 120120 125125 130130 135135 140140 零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸零件尺寸图图图图 零件尺寸分布频率密度的直方图零件尺寸分布频率密度的直方图零件尺寸分布频率密度的直方图零件尺寸分布频率密度的直方图问题:曲线下面积为问题:曲线下面积为 1 吗?吗?第26页,此课件共85页哦频数直方图频数直方图频率直方图频率直方图频率密度直方图频率密度直方图1.在频数分布直方图中,如果按各组的频率密度来测定各直条的高,则第在频数分布直方图中,如果按各组的频率密度来测定各直条的高,则第i个直
21、条个直条的面积等于该组的频率,所有直条的面积之和等于的面积等于该组的频率,所有直条的面积之和等于1。2.与直方图的直条高为频率密度相仿,曲线上某一点的纵坐标为随机变量在相应横坐与直方图的直条高为频率密度相仿,曲线上某一点的纵坐标为随机变量在相应横坐标附近的一个狭小区间内(在这个狭小区间的宽度趋近于零的过程中)取值概率的标附近的一个狭小区间内(在这个狭小区间的宽度趋近于零的过程中)取值概率的概率密度(即概率概率密度(即概率/区间宽度)。所以,这条曲线叫做随机变量的(分布)区间宽度)。所以,这条曲线叫做随机变量的(分布)密度曲线。密度曲线。3.今后可以看到,今后可以看到,概率密度曲线可以用适当的数
22、学解析式来描述概率密度曲线可以用适当的数学解析式来描述。4.我们把我们把密度曲线以及相应的数据解析式所表达的数学函数关系称作随机变量的(分密度曲线以及相应的数据解析式所表达的数学函数关系称作随机变量的(分布)密度函数布)密度函数。密度函数刻画了连续型随机变量的分布规律。密度函数刻画了连续型随机变量的分布规律。5.相对于由频率直方图来描述的随机变量的经验分布来讲,相对于由频率直方图来描述的随机变量的经验分布来讲,由密度函数所刻画的由密度函数所刻画的连续型随机变量的概率分布规律连续型随机变量的概率分布规律称为它的称为它的理论分布理论分布。第27页,此课件共85页哦连续型随机变量的分布连续型随机变量
23、的分布1.综上所述,连续型随机变量综上所述,连续型随机变量X的一系列取值区间和随机变量在该的一系列取值区间和随机变量在该区间取值的概率之间确立的对应关系,称作这个区间取值的概率之间确立的对应关系,称作这个连续型随机变连续型随机变量的分布量的分布。2.连续型随机变量的分布可以用密度函数来描述,随机变量连续型随机变量的分布可以用密度函数来描述,随机变量X的密度函数的密度函数记作记作f(x)。3.频数分布直方图是用各组的频率密度作直条的高来画图的。当分组频数分布直方图是用各组的频率密度作直条的高来画图的。当分组数无穷多,而组距(即直条的底边长趋近于数无穷多,而组距(即直条的底边长趋近于0时,直方图演
24、变成平滑时,直方图演变成平滑的曲线。这时,直条的高就成为的曲线。这时,直条的高就成为f(x)。4.连续型随机变量连续型随机变量X在某一数值区间在某一数值区间 a,b 内取值的概率等于竖立在该内取值的概率等于竖立在该区间上的、以密度曲线为上底的曲边梯形的面积。区间上的、以密度曲线为上底的曲边梯形的面积。记作:记作:第28页,此课件共85页哦概率密度概率密度f(x)的性质的性质(1)f(x)0。概率密度是非负函数。概率密度是非负函数。(2)即:所有区域上取值的概率总和为即:所有区域上取值的概率总和为1。u只要只要满满足上述两条性足上述两条性质质,即可,即可认为认为是一个概率密度。是一个概率密度。f
25、(x)xab 随机随机变变量量X在一定区在一定区间间(a,b)上的概率)上的概率为为:1.密度曲线是把分布加以密度曲线是把分布加以理想化理想化之后产生的图形,对于描绘大量观测之后产生的图形,对于描绘大量观测值的时候最为有用。值的时候最为有用。2.密度曲线的结构是利用曲线底下的面积表示落在该区的观测值的比例。密度曲线的结构是利用曲线底下的面积表示落在该区的观测值的比例。因此,因此,必须选择适当的尺度,必须选择适当的尺度,使得曲线底下的面积恰恰是使得曲线底下的面积恰恰是1,这,这样就得到一个密度曲线。样就得到一个密度曲线。第29页,此课件共85页哦3.分布函数分布函数1.适用于两类随机变量概率分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第五 概率 分布 抽样 课件
限制150内