第六章样本及抽样分布1.ppt
《第六章样本及抽样分布1.ppt》由会员分享,可在线阅读,更多相关《第六章样本及抽样分布1.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章第六章 样本及抽样分布样本及抽样分布内容提要内容提要一总体与样本一总体与样本二二 样本分布函数样本分布函数三统计量三统计量四抽样分布四抽样分布基本要求基本要求1理解总体理解总体,个体个体,简单随机样本和统计量的概念。简单随机样本和统计量的概念。2掌握样本均值掌握样本均值,样本方差的计算。样本方差的计算。3.了解了解 x2分布分布,t 分布分布,F 分布的定义和性质分布的定义和性质,了解分位点的概了解分位点的概 念并会查表计算。念并会查表计算。4.掌握正态总体的样本均值和样本方差的分布。掌握正态总体的样本均值和样本方差的分布。5.了解直方图的作法。了解直方图的作法。本章重点本章重点:常用统
2、计量的概念及其分布。常用统计量的概念及其分布。6.1 总体与样本总体与样本一一.总体与个体总体与个体.总体总体:被研究的对象的全体被研究的对象的全体例如:考察某工厂生产的电视机显象管的质量例如:考察某工厂生产的电视机显象管的质量,即考察显象管的即考察显象管的 寿命。寿命。其中其中,总体总体:该厂生产的所有显象管的寿命;该厂生产的所有显象管的寿命;个体个体:每个显象管的寿命。每个显象管的寿命。2组成总体的各个元素组成总体的各个元素由于受到人力由于受到人力,物力等的限制物力等的限制,特别是测定显象管的寿命是一特别是测定显象管的寿命是一个破坏性试验个破坏性试验,即当得知显象管寿命时即当得知显象管寿命
3、时,该显象管的使用价值也消该显象管的使用价值也消失了失了,于是我们采用从总体中抽取若干个体于是我们采用从总体中抽取若干个体,由局部了解整体情况。由局部了解整体情况。一般一般,代表总体的指标代表总体的指标(如显象管寿命如显象管寿命)是一个随机变量是一个随机变量X,所以总体就是指某个随机变量所以总体就是指某个随机变量X 可能取值的全体。可能取值的全体。二样本二样本1抽样抽样:从总体中抽取若干个体的过程。从总体中抽取若干个体的过程。2样本样本:从总体中抽取若干个体从总体中抽取若干个体,观察得随机变量的一组试验观察得随机变量的一组试验 数据数据(观测值观测值),样本中所含个体的数量称为样本容量。样本中
4、所含个体的数量称为样本容量。从总体中抽取样本从总体中抽取样本,一般假设满足下述条件:一般假设满足下述条件:(1)随机性随机性:使总体中的每一个个体有同等机会被抽取到;使总体中的每一个个体有同等机会被抽取到;(2)独立性独立性:每次抽样的结果既不影响其他各次抽样的结果每次抽样的结果既不影响其他各次抽样的结果,也不受其他各次结果的影响;也不受其他各次结果的影响;3.简单随机样本:由随机的简单随机样本:由随机的,独立的抽样方法得到的样本独立的抽样方法得到的样本,这种这种随机的随机的,独立的抽样方法称为简单随机抽样。独立的抽样方法称为简单随机抽样。注注:今后凡是提到抽样与样本今后凡是提到抽样与样本,都
5、是简单随机抽样与简单随都是简单随机抽样与简单随 机样本。机样本。由于从总体中抽取容量为由于从总体中抽取容量为n的样本的样本,即是对代表总体的随即是对代表总体的随机变量机变量X随机的随机的,独立的进行独立的进行n次试验次试验,每次试验结果可以看作每次试验结果可以看作一个随机变量一个随机变量,n 次试验结果就是次试验结果就是n个随机变量个随机变量 X1,X2,X n,它们相互独立且与总体它们相互独立且与总体X同分布。同分布。将样本将样本X1,X2,X n看作一个看作一个n维随机变量维随机变量(X1,X2,X n),则:则:(1)当总体当总体X是离散型随机变量时是离散型随机变量时,设设 ,则则(2)
6、(X1,X2,X n)分布律为:分布律为:(2)当总体当总体X是连续型随机变量时是连续型随机变量时,且概率密度为且概率密度为 ,则则 (X1,X2,X n)概率密度为:概率密度为:测试题A一一.填空题。填空题。1.X1,X2,X n 是总体是总体X的简单随机样本的条件是的简单随机样本的条件是)。2.设设X1,X2,X n是来自是来自 分布的样本分布的样本,为未知参数为未知参数,则则 的分布率为的分布率为 ,设设n=10时样本的一组观测值为时样本的一组观测值为 (1,2,4,3,3,4,5,6,4,8),则样本均值为则样本均值为 ,方差为方差为 。3.样本样本(Y1,Y2,Y3)是来自于正态总体
7、是来自于正态总体N(0,1),又又 则的联合概率密度为则的联合概率密度为 。1.设设X1,X2,X n是来自均匀分布总体是来自均匀分布总体U(a,b)的样本的样本,求样本求样本 (X1,X2,X n)的联合概率密度。的联合概率密度。二二.计算题。计算题。测试题B一填空题。一填空题。1.设随机变量设随机变量X服从正态分布服从正态分布,若若2.X1,X2,X n可以看作一组简单随机变量可以看作一组简单随机变量,则它应满足的条件则它应满足的条件 。2.设设X1,X2,X n是来自是来自01分布的样本分布的样本,且且 ,p 为未知参数为未知参数,则则(X1,X2,X n)的分布率为的分布率为 ,。3.
8、已知样本容量为已知样本容量为8的一个样本值为的一个样本值为(0,1,0,1,1,0,1,1),则样本的则样本的 均值为均值为 _ 。(其中样本来自于其中样本来自于01分布的总体分布的总体 且且 )二计算题。二计算题。1.设设 X1,X2,X n 是来自正态总体是来自正态总体 的样本的样本,求求2.样本样本X1,X2,X n的联合概率密度。的联合概率密度。1.)X1,X2,X n 相互独立相互独立2.)X1,X2,X n 与总体与总体 X 同分布。同分布。测试题测试题A答案:答案:一填空题。一填空题。2.3.二计算题。二计算题。解解:因为因为X1,X2,X n来自均匀分布总体来自均匀分布总体U(
9、a,b),则则X1,X2,X n相互独立相互独立.所以所以 测试题测试题B答案答案:一填空题。一填空题。1.1)满足满足X1,X2,X n独立且同分布独立且同分布2.2)2.3.5/8二计算题。二计算题。解解:因为因为X1,X2,X n来自均匀分布总体来自均匀分布总体 ,则则X1,X2,X n相互独立相互独立.且且 所以所以 观测值x(1)X(2)X(l)总计频数n1n2n l频率f1f2f l6.2 样本分布函数与直方图一一.样本分布函数样本分布函数从总体中抽取容量为从总体中抽取容量为n的样本的样本,得到得到n个观测值个观测值,当当n较大时较大时,相同的观测值可能重复出现若干次相同的观测值可
10、能重复出现若干次,整理后得到样本频率分布表整理后得到样本频率分布表:1总体分布函数总体分布函数:总体总体X的分布函数的分布函数其中:其中:2样本分布函数样本分布函数定义定义:设函数设函数 则称则称 为样本分布函数或经验分布函数。为样本分布函数或经验分布函数。其中其中 是对小于或等于是对小于或等于 的一切的一切 的频率的频率 求和。求和。3.样本分布函数的性质样本分布函数的性质(1)(2)是非减函数是非减函数(3)(4)在每个观测值在每个观测值 处是右连续的处是右连续的,点点 是是(5)的跳跃间断点的跳跃间断点,在点在点 的跃度就是频率的跃度就是频率样本分布函数样本分布函数 的图形如下:的图形如
11、下:对于任意实数对于任意实数x,由样本分布函数定义知由样本分布函数定义知,表示事件表示事件 的频率的频率,由伯努利大数定理知由伯努利大数定理知,当当 时时,对于对于 ,有有二二.直方图直方图当总体当总体X是连续型随机变量时是连续型随机变量时,可用直方图来处理数据可用直方图来处理数据,即即作出样本的频率直方图。作出样本的频率直方图。(1)找出样本观测值找出样本观测值x1,x2,x n中的最小值与最大值中的最小值与最大值,分别分别(2)记为记为 与与 .即即步骤:步骤:(2)适当选取略小于适当选取略小于 的数的数a 与略大于与略大于 的数的数 b,得到适当的得到适当的 作图区间作图区间a,b,并在
12、区间并在区间a,b中插入分点中插入分点 则得到子区间则得到子区间(3)以以n i 表示落入第表示落入第i个小区间个小区间 内样本观测值的频数内样本观测值的频数(4)为频率为频率.(4)在直角坐标系内在直角坐标系内,以各个小区间为底以各个小区间为底,以以 为高作小为高作小(5)矩形矩形,即使各个小矩形的面积即使各个小矩形的面积 等于样本观测值落等于样本观测值落在该在该(6)子区间内的频率子区间内的频率.所有小矩形的面积之和为所有小矩形的面积之和为1。通常如此步骤作出的所有小矩形就构成了直方图。通常如此步骤作出的所有小矩形就构成了直方图。注意:注意:(1)各个区间长度可以相等各个区间长度可以相等,
13、也可以不等。也可以不等。(2)由大数定理知由大数定理知,当样本容量当样本容量n充分大时充分大时,毛坯重量毛坯重量185 187192195200202205 206频数频数11111211毛坯重量毛坯重量207 208210214215216218 227频数频数21112121并按区间并按区间183.5,192.5),219.5,228.5)分成分成5组组,列出毛坯列出毛坯重量的频率分布表重量的频率分布表,并作直方图。并作直方图。解:我们把数据的分布区间确定为解:我们把数据的分布区间确定为183.5,228.5,并等分为并等分为5 个子区间个子区间:183.5,192.5),192.5,20
14、1.5),201.5,210.5)210.5,219.5),219.5,228.5)。例例1.测得测得20个毛坯重量个毛坯重量(单位单位:g)列成简单表如下:列成简单表如下:毛坯重量毛坯重量频数频数频率频率183.5,192.5)30.15192.5,201.5)20.1201.5,210.5)80.4210.5,219.5)60.3219.5,228.5)10.05总计总计201由此得到毛坯重量的频率分布表如下:由此得到毛坯重量的频率分布表如下:直方图如下:直方图如下:6.3 统计量一统计量一统计量1.定义定义:设设X1,X2,X n是来自总体是来自总体X的一个样本的一个样本,若样本函若样本
15、函2.数数g(X1,X2,X n)中不含任何未知量中不含任何未知量,则称这类样本函则称这类样本函数数3.为统计量。为统计量。注:注:统计量是完全由样本确定的量统计量是完全由样本确定的量,是样本的函数。是样本的函数。例如:例如:,其中其中 已知已知,未知未知.为总体的一个样本为总体的一个样本,则则 是一个统计量是一个统计量,不是统计量。不是统计量。2常用统计量及其观测值常用统计量及其观测值(1)样本均值样本均值:观测值为观测值为:(2)样本方差样本方差:观测值为观测值为:(3)样本标准差样本标准差:观测值为观测值为:(4)样本样本k阶原点矩阶原点矩:其观测值为其观测值为:(5)样本样本k阶中心矩
16、阶中心矩:其观测值为其观测值为:显然显然,样本一阶中心矩恒等于零。样本一阶中心矩恒等于零。例例1.已知已知X1,X2,X n 是来自总体是来自总体X的一组样本的一组样本,且总体且总体X的的 k阶矩阶矩 存在存在,记为记为 ,试证试证:证明证明:由于由于X1,X2,X n 独立且与独立且与X同分布同分布,所以所以X1k,X2k,X n k独立且与独立且与X k同分布同分布.于是于是由辛钦大数定理知由辛钦大数定理知:对于对于 ,有有即即:证毕。证毕。由例由例1结论及依概率收敛的序列的性质知结论及依概率收敛的序列的性质知:对于连续函对于连续函数数 g,有有此为下章矩估计法的理论依据。此为下章矩估计法
17、的理论依据。例例2.设设 及及 为两个样本观察值为两个样本观察值,它们有它们有 如下关系如下关系:a,b为常数为常数,求样本求样本 平均值平均值 与与 ,样本方差样本方差 与与 之间的关系。之间的关系。解解:由由 ,得得又又即即:又又 例例3.若样本观测值若样本观测值 的频数分别为的频数分别为 ,试写出计算样本均值试写出计算样本均值 与样本方差与样本方差 的公式的公式,其中其中若写出样本二阶中心矩若写出样本二阶中心矩,显见当充分显见当充分大时,大时,和和 是近似相等的。是近似相等的。解解:测试题A1.设设 是来自总体的样本是来自总体的样本,则有则有()。2.(A)(B)3.(C)(D)都不对都
18、不对2.设设 是来自总体是来自总体 的样本的样本,其中其中 ,为未为未 知参数知参数,问下列诸量哪个是统计量问下列诸量哪个是统计量,哪个不是统计量哪个不是统计量?(1)(2)(3)(4)(5)3.已知样本观测值为已知样本观测值为:15.8,24.2,14.5,17.4,13.2,20.8,17.9,19.1,21.0,18.5,16.4,22.6;计算样本均值计算样本均值,样本方差及样本二样本方差及样本二阶中心矩的观测值。阶中心矩的观测值。测试题B1.设设 取自总体取自总体X的样本的样本,为已知为已知,2.为未知为未知,则下列随机变量中不是统计量则下列随机变量中不是统计量()。(A)(B)(C
19、)(D)2.设设(-2,-1,3,3,4)是容量为是容量为5的一个样本观测值的一个样本观测值,试求经验分试求经验分 布函数布函数3.设从总体中抽取两组样本设从总体中抽取两组样本,其样本容量分别为其样本容量分别为n1和和n2,设两设两 组的样本均值分别为组的样本均值分别为 和和 ,样本方差分别为样本方差分别为 和和 ,把把 两组样本合并成一组容量为两组样本合并成一组容量为 的联合样本。的联合样本。证明证明:(1)联合样本的样本均值为联合样本的样本均值为:(2)联合样本的方差联合样本的方差测试题A答案1.D2.统计量统计量:(3)(5);非统计量非统计量:(1)(2)(4)3解解:即其观测值即其观
20、测值测试题B答案1.C2.解解:3.证明证明:设两组样本为设两组样本为:则则合并后的样本均值为合并后的样本均值为:样本方差:样本方差:6.4 抽样分布统计量是样本的函数统计量是样本的函数,它也是一个随机变量。它也是一个随机变量。统计量的分布称为抽样分布。统计量的分布称为抽样分布。一一.三个重要分布三个重要分布1.x2 分布分布设设X1,X2,X n 是来自正态总体是来自正态总体N(0,1)的样本的样本,则称统则称统计量计量 服从自由度为服从自由度为n的的x2分布分布,记为记为 。此处自由度指此处自由度指 包含的独立变量的个数。包含的独立变量的个数。(1)分布的概率密度为分布的概率密度为:f(y
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六章 样本及抽样分布1 第六 样本 抽样 分布
限制150内