第四章抽样分布与参数估计21204.pptx
《第四章抽样分布与参数估计21204.pptx》由会员分享,可在线阅读,更多相关《第四章抽样分布与参数估计21204.pptx(99页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 抽样分布与参数估计抽样分布与参数估计n第一节第一节 频率、概率与概率分布频率、概率与概率分布n第二节第二节 抽样分布抽样分布n第三节第三节 总体参数估计总体参数估计n第四节第四节 抽样设计抽样设计1第一节第一节 频率、概率与概率分布频率、概率与概率分布n一、随机事件与概率一、随机事件与概率n(一)随机试验与事件(一)随机试验与事件n随机现象的特点是:在条件不变的情况下,一系列随机现象的特点是:在条件不变的情况下,一系列的试验或观测会得到不同的结果,并且在试验或观的试验或观测会得到不同的结果,并且在试验或观测前不能预见何种结果将出现。对随机现象的试验测前不能预见何种结果将出现。对随
2、机现象的试验或观测称为随机试验,它必须满足以下的性质:或观测称为随机试验,它必须满足以下的性质:n(1)每次试验的可能结果不是唯一的;)每次试验的可能结果不是唯一的;n(2)每次试验之前不能确定何种结果会出现;)每次试验之前不能确定何种结果会出现;n(3)试验可在相同条件下重复进行。)试验可在相同条件下重复进行。2n在随机试验中,可能出现也可能不出现的结在随机试验中,可能出现也可能不出现的结果,称之为随机事件,简称事件。试验的结果,称之为随机事件,简称事件。试验的结果可能是一个简单事件,也可能是一个复杂果可能是一个简单事件,也可能是一个复杂事件。简单事件就是不可以再分解的事件,事件。简单事件就
3、是不可以再分解的事件,又称为基本事件。复杂事件是由简单事件组又称为基本事件。复杂事件是由简单事件组合而成的事件。基本事件还可称为样本点,合而成的事件。基本事件还可称为样本点,设试验有设试验有n个基本事件,分别记为个基本事件,分别记为 (i=1,2,,n)。集合。集合=1,2,n称称为样本空间,为样本空间,中的元素就是样本点。中的元素就是样本点。3n例:投掷一粒均匀的六面体骰子,出现的点例:投掷一粒均匀的六面体骰子,出现的点数有可能是数有可能是1、2、3、4、5、6共六种。这六共六种。这六种结果是基本结果,不可以再分解成更简单种结果是基本结果,不可以再分解成更简单的结果了,所以的结果了,所以=1
4、,2,3,4,5,6为该为该试验的样本空间。试验的样本空间。“出现点数是奇数出现点数是奇数”这一这一事件就不是简单事件,它是由基本事件事件就不是简单事件,它是由基本事件1,3和和5组合而成的。我们通常用大写字母组合而成的。我们通常用大写字母A,B,C,来表示随机事件,例如,设来表示随机事件,例如,设A表表示示“出现点数是奇数出现点数是奇数”,则,则A=1,3,5;设;设B表示表示“出现点数是偶数出现点数是偶数”,则,则B=2,4,6。4n(二)概率(二)概率n1.概率的定义概率的定义n概率就是指随机事件发生的可能性,或称为机率,概率就是指随机事件发生的可能性,或称为机率,是对随机事件发生可能性
5、的度量。是对随机事件发生可能性的度量。进行进行n次重复试次重复试验,随机事件验,随机事件A发生的次数是发生的次数是m次,发生的频率是次,发生的频率是m/n,当试验的次数,当试验的次数n很大时,如果频率在某一数值很大时,如果频率在某一数值p附近摆动,而且随着试验次数附近摆动,而且随着试验次数n的不断增加,频率的不断增加,频率的摆动幅度越来越小,则称的摆动幅度越来越小,则称p为事件为事件A发生的概率,发生的概率,记为:记为:P(A)=p。在古典概型场合。在古典概型场合,即基本事件发生即基本事件发生的概率都一样的场合的概率都一样的场合:5n例:设一个袋子中装有白球例:设一个袋子中装有白球2个,黑球个
6、,黑球3个。个。(1)从中随机摸出从中随机摸出1只球,问刚好是白球的概只球,问刚好是白球的概率有多大?率有多大?(2)从中随机摸出从中随机摸出2只球,一问只球,一问2只球都是白球的概率有多大只球都是白球的概率有多大?二问二问2只球一白只球一白一黑的概率有多大一黑的概率有多大?三问三问2只球都是黑球的概只球都是黑球的概率有多大率有多大?n 解:解:(1)由于摸出的任何由于摸出的任何1只球都形成一个基只球都形成一个基本事件,所以样本点总数为本事件,所以样本点总数为n=5。用。用A表示摸表示摸出的是白球事件,则出的是白球事件,则A由两个基本点组成,即由两个基本点组成,即A=白球,白球白球,白球,有利
7、场合数,有利场合数m=2。因此,。因此,刚好摸出白球的概率为刚好摸出白球的概率为P(A)=m/n=2/5=0.46n(2)由于摸出由于摸出2只球才成一个基本事件,所以只球才成一个基本事件,所以样本点总数为样本点总数为 故故nP(A)=P(2只球都是白球只球都是白球)=1/=1/10nP(B)=P(2只球一白一黑只球一白一黑)=23/10=6/10nP(C)=P(2只球都是黑球只球都是黑球)=3/10nNOTE:P(A+B+C)=17n2.概率的基本性质概率的基本性质n性质性质1 1P(A)0。n性质性质2 P()=1。n性质性质3 若事件若事件A与事件与事件B互不相容,即互不相容,即AB=,则
8、则P(AB)=P(A)+P(B)。n推论推论1 不可能事件的概率为不可能事件的概率为0,即:,即:P()=0。n推论推论2 P()=1-P(A),表示表示A的对立事件,即的对立事件,即它们二者必有一事件发生但又不能同时发生。它们二者必有一事件发生但又不能同时发生。8n例:袋中装有例:袋中装有4只黑球和只黑球和1只白球,每次从袋中随机只白球,每次从袋中随机地摸出地摸出1只球,并换入只球,并换入1只黑球。连续进行,问第三只黑球。连续进行,问第三次摸到黑球的概率是多少?次摸到黑球的概率是多少?n 解解:记记A为为“第三次摸到黑球第三次摸到黑球”,则,则 为为“第三次第三次摸到白球摸到白球”。先计算。
9、先计算P()。n由于袋中只有由于袋中只有1只白球,如果某一次摸到了白球,换只白球,如果某一次摸到了白球,换入了黑球,则袋中只有黑球了。所以相当于第一、入了黑球,则袋中只有黑球了。所以相当于第一、第二次都是摸到黑球,第三次摸到白球。注意这是第二次都是摸到黑球,第三次摸到白球。注意这是一种有放回的摸球,样本点总数为一种有放回的摸球,样本点总数为53,有利场合数,有利场合数是是421。故:。故:P()=,n 所以所以 9n3.事件的独立性事件的独立性n定义定义 对事件对事件A与与B,若,若p(AB)=p(B)p(A),则称它们,则称它们是统计独立的,简称相互独立。是统计独立的,简称相互独立。n例:已
10、知袋中有例:已知袋中有6只红球只红球,4只白球。从袋中有放回地只白球。从袋中有放回地取两次球取两次球,每次都取每次都取1球。设球。设 表示第表示第i次取到红球。次取到红球。那么,那么,n因此,因此,也就是说,也就是说,B1,B2相互独立。从题目条件看,这一结论是显然的。相互独立。从题目条件看,这一结论是显然的。10二、随机变量二、随机变量n随机变量随机变量X是定义在样本空间是定义在样本空间 =1,2,n上上的一个函数,这个函数的取值随试验的结果不同而的一个函数,这个函数的取值随试验的结果不同而变化。这个函数还要求满足条件:对任意的实数变化。这个函数还要求满足条件:对任意的实数x,Xx是随机事件
11、。如果随机变量所有可能的取值是是随机事件。如果随机变量所有可能的取值是有限的,或可排成一列的,这种随机变量称为离散有限的,或可排成一列的,这种随机变量称为离散型随机变量;另一种情况是随机变量的取值范围是型随机变量;另一种情况是随机变量的取值范围是一个区间或整个数轴,这种随机变量称为连续型随一个区间或整个数轴,这种随机变量称为连续型随机变量。机变量。n1.离散型随机变量的概率分布离散型随机变量的概率分布 n设离散型随机变量设离散型随机变量X的所有可能取值为的所有可能取值为x1,x2,,xn,,相应的概率为,相应的概率为p(x1),p(x2),p(xn),。用。用表格统一表示出来是:表格统一表示出
12、来是:11X x1 x2 xn P p(x1)p(x2)p(xn)n这称为离散型随机变量这称为离散型随机变量X的概率分布。的概率分布。n性质:性质:(1)0p(xi)1 (i=1,2,);n(2)n定义定义:离散型随机变量离散型随机变量X的期望值为的期望值为 n n性质:性质:n其中其中X1,X2都是随机变量,都是随机变量,是任意常数。是任意常数。12n定义定义:离散型随机变量离散型随机变量X的方差为的方差为n方差的平方根方差的平方根称为标准差。称为标准差。n方差方差2或标准差或标准差反映随机变量反映随机变量X相对其期望相对其期望值的值的n离散程度,离散程度,2或或越小越小,说明期望值的代表性
13、说明期望值的代表性越好;越好;2或或越大,说明期望值的代表性越差。越大,说明期望值的代表性越差。n性质:对于任意的性质:对于任意的,D(X)=2 D(X)成立成立13n贝努里试验贝努里试验 与二项分布与二项分布n有时我们只对试验中某事件有时我们只对试验中某事件A是否出现感兴趣,如果是否出现感兴趣,如果A发生,我们称发生,我们称“成功成功”,否则称,否则称“失败失败”。像这样。像这样只有两种结果的试验称为贝努里试验。设只有两种结果的试验称为贝努里试验。设A出现的概出现的概率为率为p,我们独立地重复进行,我们独立地重复进行n次贝努里试验,称为次贝努里试验,称为n重贝努里试验重贝努里试验.以以Bk表
14、示表示n重贝努里试验中事件重贝努里试验中事件A正正好出现好出现k次这一事件,则次这一事件,则 (k=0,1,2,,n)n该分布称为二项分布该分布称为二项分布(q=1-p).nNOTE:14n2.连续型随机变量的概率分布连续型随机变量的概率分布 n设设X是是R.V.,x 是一实数是一实数.记记nF(x)=P(Xx)。该函数就是随机变量。该函数就是随机变量X的分布的分布函数。分布函数的导数称为密度函数,记作函数。分布函数的导数称为密度函数,记作p(x)。n 性质性质 n(1)p(x)0n(2)n(3)a bxP(axb)15n定义定义:连续型随机变量连续型随机变量X的期望值为的期望值为 n 方差为
15、方差为 n 性质性质:D(X)=2 D(X)16n正态分布正态分布 n如果连续型随机变量如果连续型随机变量X的密度函数为的密度函数为 n则称随机变量则称随机变量X服从均值为服从均值为,方差为,方差为2的正态分布,的正态分布,记为记为XN(,2)。n如果一个正态分布的如果一个正态分布的=0,=1,则称该正态布为标,则称该正态布为标准正态分布,相应的随机变量称为标准正态随机变准正态分布,相应的随机变量称为标准正态随机变量,用量,用Z表示,即表示,即ZN(0,1),相应的分布密度函数,相应的分布密度函数为为17n一般正态分布一般正态分布 与标准正态分布与标准正态分布 的关系的关系:n若随机变量若随机
16、变量X服从正态分布服从正态分布N(,2),则随,则随机机n变量变量 Z=服从标准正态分布,即服从标准正态分布,即ZN(0,1)。18n例:某大学英语考试成绩服从正态分布,已知平均成绩为例:某大学英语考试成绩服从正态分布,已知平均成绩为70分,标准差为分,标准差为10分。求该大学英语成绩在分。求该大学英语成绩在6075分的概率。分的概率。19第二节第二节 抽样分布抽样分布n一、抽样的基本概念一、抽样的基本概念n二、抽样分布二、抽样分布n(一)重复抽样分布(一)重复抽样分布n(二)不重复抽样分布(二)不重复抽样分布n三、大数定理与中心极限定理三、大数定理与中心极限定理20一、抽样的基本概念一、抽样
17、的基本概念n抽样涉及的基本概念有:抽样涉及的基本概念有:n总体与样本总体与样本(见第一章见第一章)n样本容量与样本个数样本容量与样本个数n总体参数与样本统计量总体参数与样本统计量n重复抽样与不重复抽样重复抽样与不重复抽样n这些概念是统计学特有的,体现了统计学的这些概念是统计学特有的,体现了统计学的基本思想与方法。基本思想与方法。21总体和样本(参见第总体和样本(参见第1章)章)n1.总体:又称全及总体、母体,指所要研究对总体:又称全及总体、母体,指所要研究对象的全体,由许多客观存在的具有某种共同象的全体,由许多客观存在的具有某种共同性质的单位构成。总体单位数用性质的单位构成。总体单位数用 N
18、表示。表示。n2.样本:又称子样,来自总体,是从总体中按样本:又称子样,来自总体,是从总体中按随机原则抽选出来的部分,由抽选的单位构随机原则抽选出来的部分,由抽选的单位构成。样本单位数用成。样本单位数用 n 表示。表示。n3.总体是唯一的、确定的,而样本是不确定的、总体是唯一的、确定的,而样本是不确定的、可变的、随机的。可变的、随机的。22样本容量与样本个数样本容量与样本个数n样本容量:一个样本中所包含的单位数,用样本容量:一个样本中所包含的单位数,用n表示。表示。n样本个数:又称样本可能数目,指从一个总样本个数:又称样本可能数目,指从一个总体中所可能抽取的样本的个数。对于有限总体中所可能抽取
19、的样本的个数。对于有限总体,样本个数可以计算出来。样本个数的多体,样本个数可以计算出来。样本个数的多少与抽样方法有关。少与抽样方法有关。(这个概念只是对有限总这个概念只是对有限总体有意义,对无限总体没有意义!体有意义,对无限总体没有意义!)23总体参数和样本统计量总体参数和样本统计量n总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。总体参数:反映总体数量特征的指标。其数值是唯一的、确定的。n样本统计量:根据样本分布计算的指标。是随机变量。样本统计量:根据样本分布计算的指标。是随机变量。平均数平均数标准差、方差标准差、方差成数成数参数参数 、2p统计量统计量S、S2P 总体总体 样本样
20、本24重复重复(置置)抽样与不重复抽样与不重复(置置)抽样抽样n重置抽样与不重置抽样(各有重置抽样与不重置抽样(各有3个特点个特点P90)n重复抽样:例如从重复抽样:例如从A、B、C、D、E五个字母五个字母中随机抽取两个作为样本。中随机抽取两个作为样本。N=5,n=2n考虑顺序时:样本个数考虑顺序时:样本个数=Nn=52=25n不考虑顺序时:样本个数不考虑顺序时:样本个数=25重复重复(置置)抽样与不重复抽样与不重复(置置)抽样抽样n不重复抽样:不重复抽样:n例如从例如从A、B、C、D、E五个字母中随机抽取两个作为样本。五个字母中随机抽取两个作为样本。N=5,n=2n考虑顺序时:样本个数考虑顺
21、序时:样本个数n不考虑顺序时:样本个数不考虑顺序时:样本个数26二、抽样分布二、抽样分布n抽样分布的概念:由样本统计量的全部可能抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)数列。(主要求出样本平均数的期望与方差)n包括以下内容包括以下内容n重置抽样分布重置抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布n不重置抽样分布不重置抽样分布n样本平均数的分布样本平均数的分布n样本成数的分布样本成数的分布27重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布n某班
22、组某班组5个工人的日工个工人的日工资为资为34、38、42、46、50元。元。n =42n 2=32n现用重置抽样的方法从现用重置抽样的方法从5人中随机抽人中随机抽2个构成样个构成样本。共有本。共有52=25个样本。个样本。如右图。如右图。28n验证了以下两个结论:验证了以下两个结论:n抽样平均数的标准差反抽样平均数的标准差反映所有的样本平均数与映所有的样本平均数与总体平均数的平均误差,总体平均数的平均误差,称为抽样平均误差,用称为抽样平均误差,用 表示。表示。重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布29重置抽样分布重置抽样分布-样本平均数的分布样本平均数的分布n由概率论知,
23、如果总体是正态分布的,则样由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布本平均数的抽样分布是如下正态分布n这是一个非常重要的结论,有广泛的应用。这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。)(请参见中心极限定理。)30重置抽样分布重置抽样分布-样本成数的分布样本成数的分布n总体成数总体成数p是指具有某种特征的单位在总体中的比重。成数是一个特殊平是指具有某种特征的单位在总体中的比重。成数是一个特殊平均数,设总体单位总数目是均数,设总体单位总数目是N,总体中有该特征的单位数是,总体中有该特征的单位数是N1。设。设x是是0、1变量(总体单位有该特征,则变量(总
24、体单位有该特征,则x取取1,否则取,否则取0),则有:),则有:n现从总体中抽出现从总体中抽出n个单位,如果其中有相应特征的单位数是个单位,如果其中有相应特征的单位数是n1,则样本成,则样本成数是:数是:nP也是一个随机变量,利用样本平均数的分布性质结论,即有:也是一个随机变量,利用样本平均数的分布性质结论,即有:31不重置抽样分布不重置抽样分布n样本均值的分布性质:样本均值的分布性质:n样本成数的分布性质样本成数的分布性质32抽样分布总结抽样分布总结样本平均数的分布样本平均数的分布样本成数的分布样本成数的分布重复抽重复抽样样不重复不重复抽样抽样33三、大数定理与中心极限定理三、大数定理与中心
25、极限定理n大数定理大数定理当样本容量当样本容量n 充分大时,可以用充分大时,可以用样本平均估计总体平均。样本平均估计总体平均。当试验次数当试验次数n充分大时,可以用充分大时,可以用频率代替概率。频率代替概率。大数定理的意义:个别现象受偶然因素影响,但是,对大数定理的意义:个别现象受偶然因素影响,但是,对总体的大量观察后进行平均,就能使偶然因素的影响相总体的大量观察后进行平均,就能使偶然因素的影响相互抵消,从而使总体平均数稳定下来,反映出事物变化互抵消,从而使总体平均数稳定下来,反映出事物变化的一般规律,这就是大数定理的意义。的一般规律,这就是大数定理的意义。34中心极限定理中心极限定理 n正态
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 抽样 分布 参数估计 21204
限制150内