统计学之抽样分布38821.pptx
《统计学之抽样分布38821.pptx》由会员分享,可在线阅读,更多相关《统计学之抽样分布38821.pptx(89页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 抽样分布抽样分布 从这一章开始便进入推断统计学的学习内容,它从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:要的信息非常困难。如:选民人数:每个候选人的支持率是多少?选民人数:每个候选人的支持率是多少?产品:不合格率是多少?产品:不合格率是多少?环境:污染程度如何?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。市场:品种、价格、质量状况、购买力等情况的了解。在这一章
2、里,你将会了解到样本是怎样抽取的,在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。体参数做估计。3/28/20231主要内容主要内容 4.1 抽样的一般问题抽样的一般问题4.2 三种不同性质的分布三种不同性质的分布4.3 一个总体参数推断时样本统计量一个总体参数推断时样本统计量 的抽样分布的抽样分布4.4 两个总体参数推断时样本统计量两个总体参数推断时样本统计量 的抽样分布的抽样分布4.5 其他抽样方法其他抽样方法3/28/202324.1 抽样的一般问题抽样的一般问题w4.1.1 一个例子一个
3、例子w4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念w4.1.3 简单随机抽样简单随机抽样3/28/202334.1.1 一个例子一个例子 本例中存栏肉猪本例中存栏肉猪1000010000头组成的集合,则称为头组成的集合,则称为总体总体,它是指,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用了研究目标时,它具有惟一性。一般总体的单位总数用N N表示,表示,称作称作总体容量总体容量。本例中所抽出的。本例中所抽出的100100头肉猪组成的集合,则称为头肉猪组成的集合,则称为
4、样本样本,它是指在统计抽样中按照,它是指在统计抽样中按照“随机原则随机原则”从总体从总体N(10000)N(10000)中抽出的部分单位中抽出的部分单位(每个单位称作样本单位每个单位称作样本单位)所组成的整体,又所组成的整体,又称子样。一般样本的单位总数用称子样。一般样本的单位总数用n(100)n(100)表示,称作表示,称作样本容量样本容量。样本不具惟一性,它的可能个数与样本不具惟一性,它的可能个数与N N、n n及抽样方法有关。通常及抽样方法有关。通常n30n30称为称为小样本小样本,n30n30称为称为大样本大样本,在抽样调查中取大或小样,在抽样调查中取大或小样本会直接影响到抽样分布的特
5、征。本会直接影响到抽样分布的特征。例例 某养猪厂共有存栏肉猪某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均头,现欲了解这批肉猪平均每头毛重每头毛重(设为设为 ),如果将每头肉猪过称去获取数据将是不,如果将每头肉猪过称去获取数据将是不合算的。我们可以按照合算的。我们可以按照“随机原则随机原则”从中抽出从中抽出100头称重量,头称重量,计算这计算这100头的平均每头毛重,以达到我们期望的目的。头的平均每头毛重,以达到我们期望的目的。3/28/202341、总体和样本、总体和样本 总体:研究对象全体,又称母体。容量用总体:研究对象全体,又称母体。容量用N表示。表示。具备惟一性。具备惟一性。样
6、本:按随机原则从总体中抽出的部分单位的全体,样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用被抽出的每个单位称样本单位。样本容量用n表示。表示。样本不具惟一性。样本不具惟一性。当当n30时,为小样本。时,为小样本。当当n30时,为大样本。时,为大样本。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202352、总体参数和样本统计量、总体参数和样本统计量 根据全及总体各单位变量值计算的反映全及总体根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总某数量特征的综合指标,由于总体唯一确定,故称总体参数。体参
7、数。如上例中的如上例中的 根据样本各单位变量值计算的反映样本某方面数根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。本统计量,它是一个随机变量。如上例中的抽出如上例中的抽出100头肉猪的平均每头毛重头肉猪的平均每头毛重4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202363、重复抽样与不重复抽样、重复抽样与不重复抽样从总体中抽取样本有两种方法:重复抽样和不重复抽样。从总体中抽取样本有两种方法:重复抽样和不重复抽样。重复抽样重复抽样,抽样安排,抽样安排-对每次被
8、抽到的单位经登记后再放回对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。立的试验。不重复抽样不重复抽样,抽样安排,抽样安排-对被抽到的单位登记后不再放回总对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计
9、中称这样的抽样为相互不独立的试验。统计中称这样的抽样为相互不独立的试验。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202374.1.3 简单随机抽样简单随机抽样 简单随机抽样也称为简单随机抽样也称为纯随机抽样纯随机抽样。它是对总体单位。它是对总体单位不做任何分类或排队,直接从总体中按不做任何分类或排队,直接从总体中按“随机原则随机原则”抽抽取样本单位的调查方式。取样本单位的调查方式。为了便于抽取样本单位,一般在明确抽样框的条件为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签式或利用下,对总体的每个单位都要编号,然后用抽签式或利用随机数
10、字表进行抽取。随机数字表进行抽取。例如:例如:N=500 n=10 编码从编码从1-500号号 在随机数表中随意选取二个数字,假如得到在随机数表中随意选取二个数字,假如得到4行,行,43列。则选取的号码从这个被选中的数开始,由于列。则选取的号码从这个被选中的数开始,由于500是是个三位数,则小于个三位数,则小于500的连续三位数即为中选号码,见的连续三位数即为中选号码,见表中所示。表中所示。3/28/202384.1.3 简单随机抽样简单随机抽样3/28/202394.2 三种不同性质的分布三种不同性质的分布4.2.1 几种常见分布几种常见分布4.2.2 总体分布总体分布4.2.3 样本分布样
11、本分布4.2.4 抽样分布抽样分布4.2.5 样本推断总体的理论依据样本推断总体的理论依据这些内容与前面内容这些内容与前面内容有什么关系有什么关系?3/28/202310一、分布的含义一、分布的含义w1、在随机试验中,若、在随机试验中,若X随着试验结果的不同随着试验结果的不同而随机地取各种不同的数值,并且对取每一而随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,个数值或某一范围内的值都有相应的概率,则称则称X为一个为一个随机变量随机变量。w2、随机变量取一切可能值或范围与其相应随机变量取一切可能值或范围与其相应概率间一一对应的关系,称为概率间一一对应的关系,称为概率分
12、布概率分布(probability distribution,(probability distribution,简称分布简称分布)。w3 3、概率分布是关于总体的概念,有了概率概率分布是关于总体的概念,有了概率分布就等于知道了总体。分布就等于知道了总体。w4、概率分布可以用各种图或表来表示,一、概率分布可以用各种图或表来表示,一些可以用公式来表示。些可以用公式来表示。4.2.1 几种常见几种常见分布分布3/28/202311二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布w定义3/28/202312w正态分布的密度函数图形是一条以均值为中心正态分布的密度函数图形是一条以均值为中心
13、的对称钟型曲线的对称钟型曲线 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202313w正态分布密度函数 的数学性质 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202314w标准正态分布及其重要意义标准正态分布及其重要意义 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202315w标准化法标准化法二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202316w标准化法的几何意义标准化法的几何意义 w标准化变换实质上是作了一个坐标轴的平移和标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分
14、布的平均数尺度变换,使正态分布的平均数 ,标准,标准差差 。二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202317w正态分布表及上侧分位数正态分布表及上侧分位数 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202318w 准则 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202319准则示意图准则示意图二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202320w正态分布的重要意义正态分布的重要意义 在随机理论中,正态分布是最重要的一种分布在随机理论中,正态分布是最重要的一种分布,理由如下:理
15、由如下:w 它是最常见的一种分布,现实中许多随机变它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。量服从或近似服从正态分布。w 在一定的条件下,正态分布是其他分布的近在一定的条件下,正态分布是其他分布的近似分布。似分布。w 许多有用的分布,特别是小样本的精确分布许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。是由正态分布推导出来的。二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202321三、小样本三、小样本(n30)的精确分布的精确分布w1、2分布w2、t分布w3、F分布均由正态分布导出的分布4.2.1 几种常见几种常见分布分布3/28/
16、2023221、2分布分布(2 distribution)(1)推导说明推导说明由由阿阿贝贝(Abbe)于于1863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)和和卡卡皮皮尔尔逊逊(KPearson)分分别别于于1875年年和和1900年推导出来。年推导出来。设设 ,则,则构构造造 ,则则 Yi 服服从从自自由由度度为为1的的 2分分布布,即即当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023231、2分布分布(2)性质和特点)性质和特点由由于于
17、2 分分布布变变量量为为正正态态变变量量的的平平方方和和,故故分分布布的的变变量量值值始终为正。始终为正。可可加加性性:若若U和和V为为两两个个独独立立的的服服从从 2分分布布的的随随机机变变量量,U 2(n1),V 2(n2),则则U+V这这一一随随机机变变量量服服从从自自由由度为度为n1+n2的的 2分布。分布。n个个独独立立正正态态变变量量平平方方和和称称为为有有n个个自自由由度度的的 2-分分布布,记记为为 2(n)。2-分布为一族分布分布为一族分布,成员由自由度区分。成员由自由度区分。分分布布的的形形状状取取决决于于其其自自由由度度n的的大大小小,通通常常为为不不对对称称的的正正偏分
18、布,但随着自由度的增大逐渐趋于对称。偏分布,但随着自由度的增大逐渐趋于对称。期望为期望为E(2)=n,方差为,方差为D(2)=2n(n为自由度为自由度)4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023241 1、2分布分布(3)图示)图示 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2=(n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=
19、10=10n n=20=20 总体总体4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023251 1、2分布分布(4)2分布的分布的上上 分位点分位点 分位点分位点 设设X 2(n),若对于,若对于:0 1,存在存在,满足满足则称则称为为分布的分布的上上 分位点。分位点。4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202326 由统计学家哥赛特(由统计学家哥赛特(W.S.Gosset)于)于1908年提出,并以其笔名命名。年提出,并以其笔名命名。2 2、t-分布分布(t-distribu
20、tion)(1)t分布的构造及性质分布的构造及性质4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布构造:构造:构造:构造:若若 N(0,1),2(n),与与 独立,则独立,则 t(n)t(n)称为自由度为称为自由度为称为自由度为称为自由度为n n的的的的t t分布。分布。分布。分布。基本性质:基本性质:基本性质:基本性质:(1)(1)f(t)f(t)关于关于关于关于t=0(t=0(纵轴纵轴纵轴纵轴)对称。对称。对称。对称。(2)(2)f(t)f(t)的极限为的极限为的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即的密度函数,即的密度函数
21、,即3/28/202327t(n)(n)分布的图形为分布的图形为2 2、t-分布分布(t-distribution)(2)t分布的图示分布的图示4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202328w 对于给定的对于给定的:0 t)=的点的点t 为为t(n)分布的上分布的上 分位点分位点。2 2、t-分布分布(t-distribution)(3)t分布的上分布的上 分位点分位点4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202329由由统统计计学学家家费费希希尔尔(R.A.Fisher
22、)提提出出的的,以以其其姓姓氏的第一个字母来命名氏的第一个字母来命名构构造造:设设若若U为为服服从从自自由由度度为为n1的的 2分分布布,即即U 2(n1),V为为服服从从自自由由度度为为n2的的 2分分布布,即即V 2(n2),且,且U和和V相互独立,则相互独立,则 称称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为3 3、F分布分布(F distribution)(1)F分布的构造分布的构造4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202330F分布(图示)不同自由度的不同自由度的F分布分布F F F(1,10)1,
23、10)(5,10)(5,10)(10,10)(10,10)3 3、F分布分布(F distribution)(2)F分布的图示分布的图示4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202331wF分布的分位点:分布的分位点:w对于对于:0 1,若满足条件:若满足条件:PF F(n1,n2)=,则称则称F(n1,n2)为为 F(n1,n2)的的 上上 分位点分位点3 3、F分布分布(F distribution)(3)F分布的上分布的上 分位点分位点4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/2
24、8/2023321)总体中各元素的观察值所形成的相对频数)总体中各元素的观察值所形成的相对频数(频率)分布(频率)分布 2)分布通常是未知的(因为几乎得不到总图)分布通常是未知的(因为几乎得不到总图所有观察值)所有观察值)3)可以根据理论分析假定它服从某种分布)可以根据理论分析假定它服从某种分布 总体总体总体总体4.2.2 总体总体分布分布3/28/2023331)一个样本中各观察值形成的相对频数)一个样本中各观察值形成的相对频数(频率)分布(频率)分布 2)也称经验分布)也称经验分布 3)当样本容量)当样本容量n逐渐增大时,样本分布逐逐渐增大时,样本分布逐渐接近总体的分布渐接近总体的分布 样
25、样样样本本本本4.2.3 样本样本分布分布3/28/2023341 1、统计量与参数、统计量与参数1 1)在抽样推断中,无论是总体还是样本,都可以用)在抽样推断中,无论是总体还是样本,都可以用平平均数、比例均数、比例(或成数或成数)、标准差和方差、标准差和方差等指标来描述等指标来描述它们的特征。当它们用来描述样本的特征时,称为它们的特征。当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为总样本统计量;当它们用来描述总体特征时,称为总体参数。体参数。2 2)样本统计量样本统计量是样本的函数,依据不同的样本计算出是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 分布 38821
限制150内