欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学之抽样分布38821.pptx

    • 资源ID:83284951       资源大小:898.87KB        全文页数:89页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学之抽样分布38821.pptx

    第四章第四章 抽样分布抽样分布 从这一章开始便进入推断统计学的学习内容,它从这一章开始便进入推断统计学的学习内容,它会节省人们的时间和财物来达到认识对象的最佳限度。会节省人们的时间和财物来达到认识对象的最佳限度。现实世界包含的素材集合非常庞大,从中提取需现实世界包含的素材集合非常庞大,从中提取需要的信息非常困难。如:要的信息非常困难。如:选民人数:每个候选人的支持率是多少?选民人数:每个候选人的支持率是多少?产品:不合格率是多少?产品:不合格率是多少?环境:污染程度如何?环境:污染程度如何?市场:品种、价格、质量状况、购买力等情况的了解。市场:品种、价格、质量状况、购买力等情况的了解。在这一章里,你将会了解到样本是怎样抽取的,在这一章里,你将会了解到样本是怎样抽取的,样本统计量是怎样分布的,如何根据样本统计量对总样本统计量是怎样分布的,如何根据样本统计量对总体参数做估计。体参数做估计。3/28/20231主要内容主要内容 4.1 抽样的一般问题抽样的一般问题4.2 三种不同性质的分布三种不同性质的分布4.3 一个总体参数推断时样本统计量一个总体参数推断时样本统计量 的抽样分布的抽样分布4.4 两个总体参数推断时样本统计量两个总体参数推断时样本统计量 的抽样分布的抽样分布4.5 其他抽样方法其他抽样方法3/28/202324.1 抽样的一般问题抽样的一般问题w4.1.1 一个例子一个例子w4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念w4.1.3 简单随机抽样简单随机抽样3/28/202334.1.1 一个例子一个例子 本例中存栏肉猪本例中存栏肉猪1000010000头组成的集合,则称为头组成的集合,则称为总体总体,它是指,它是指在统计抽样中所要了解的研究对象全体,又称为母体,当确定在统计抽样中所要了解的研究对象全体,又称为母体,当确定了研究目标时,它具有惟一性。一般总体的单位总数用了研究目标时,它具有惟一性。一般总体的单位总数用N N表示,表示,称作称作总体容量总体容量。本例中所抽出的。本例中所抽出的100100头肉猪组成的集合,则称为头肉猪组成的集合,则称为样本样本,它是指在统计抽样中按照,它是指在统计抽样中按照“随机原则随机原则”从总体从总体N(10000)N(10000)中抽出的部分单位中抽出的部分单位(每个单位称作样本单位每个单位称作样本单位)所组成的整体,又所组成的整体,又称子样。一般样本的单位总数用称子样。一般样本的单位总数用n(100)n(100)表示,称作表示,称作样本容量样本容量。样本不具惟一性,它的可能个数与样本不具惟一性,它的可能个数与N N、n n及抽样方法有关。通常及抽样方法有关。通常n30n30称为称为小样本小样本,n30n30称为称为大样本大样本,在抽样调查中取大或小样,在抽样调查中取大或小样本会直接影响到抽样分布的特征。本会直接影响到抽样分布的特征。例例 某养猪厂共有存栏肉猪某养猪厂共有存栏肉猪10000头,现欲了解这批肉猪平均头,现欲了解这批肉猪平均每头毛重每头毛重(设为设为 ),如果将每头肉猪过称去获取数据将是不,如果将每头肉猪过称去获取数据将是不合算的。我们可以按照合算的。我们可以按照“随机原则随机原则”从中抽出从中抽出100头称重量,头称重量,计算这计算这100头的平均每头毛重,以达到我们期望的目的。头的平均每头毛重,以达到我们期望的目的。3/28/202341、总体和样本、总体和样本 总体:研究对象全体,又称母体。容量用总体:研究对象全体,又称母体。容量用N表示。表示。具备惟一性。具备惟一性。样本:按随机原则从总体中抽出的部分单位的全体,样本:按随机原则从总体中抽出的部分单位的全体,被抽出的每个单位称样本单位。样本容量用被抽出的每个单位称样本单位。样本容量用n表示。表示。样本不具惟一性。样本不具惟一性。当当n30时,为小样本。时,为小样本。当当n30时,为大样本。时,为大样本。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202352、总体参数和样本统计量、总体参数和样本统计量 根据全及总体各单位变量值计算的反映全及总体根据全及总体各单位变量值计算的反映全及总体某数量特征的综合指标,由于总体唯一确定,故称总某数量特征的综合指标,由于总体唯一确定,故称总体参数。体参数。如上例中的如上例中的 根据样本各单位变量值计算的反映样本某方面数根据样本各单位变量值计算的反映样本某方面数量特征的综合指标,由于样本不具惟一性,故称为样量特征的综合指标,由于样本不具惟一性,故称为样本统计量,它是一个随机变量。本统计量,它是一个随机变量。如上例中的抽出如上例中的抽出100头肉猪的平均每头毛重头肉猪的平均每头毛重4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202363、重复抽样与不重复抽样、重复抽样与不重复抽样从总体中抽取样本有两种方法:重复抽样和不重复抽样。从总体中抽取样本有两种方法:重复抽样和不重复抽样。重复抽样重复抽样,抽样安排,抽样安排-对每次被抽到的单位经登记后再放回对每次被抽到的单位经登记后再放回总体,重新参与下一次抽选的抽样方法。在每次的抽取中样总体,重新参与下一次抽选的抽样方法。在每次的抽取中样本单位被抽中的概率都相等,统计中称这样的抽样为相互独本单位被抽中的概率都相等,统计中称这样的抽样为相互独立的试验。立的试验。不重复抽样不重复抽样,抽样安排,抽样安排-对被抽到的单位登记后不再放回总对被抽到的单位登记后不再放回总体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条体的抽样方法。不重复抽样与重复抽样比较,每次抽样的条件是不同的,前一次的抽取结果会对后一次的抽取产生影响件是不同的,前一次的抽取结果会对后一次的抽取产生影响,统计中称这样的抽样为相互不独立的试验。统计中称这样的抽样为相互不独立的试验。4.1.2 统计抽样的几个基本概念统计抽样的几个基本概念3/28/202374.1.3 简单随机抽样简单随机抽样 简单随机抽样也称为简单随机抽样也称为纯随机抽样纯随机抽样。它是对总体单位。它是对总体单位不做任何分类或排队,直接从总体中按不做任何分类或排队,直接从总体中按“随机原则随机原则”抽抽取样本单位的调查方式。取样本单位的调查方式。为了便于抽取样本单位,一般在明确抽样框的条件为了便于抽取样本单位,一般在明确抽样框的条件下,对总体的每个单位都要编号,然后用抽签式或利用下,对总体的每个单位都要编号,然后用抽签式或利用随机数字表进行抽取。随机数字表进行抽取。例如:例如:N=500 n=10 编码从编码从1-500号号 在随机数表中随意选取二个数字,假如得到在随机数表中随意选取二个数字,假如得到4行,行,43列。则选取的号码从这个被选中的数开始,由于列。则选取的号码从这个被选中的数开始,由于500是是个三位数,则小于个三位数,则小于500的连续三位数即为中选号码,见的连续三位数即为中选号码,见表中所示。表中所示。3/28/202384.1.3 简单随机抽样简单随机抽样3/28/202394.2 三种不同性质的分布三种不同性质的分布4.2.1 几种常见分布几种常见分布4.2.2 总体分布总体分布4.2.3 样本分布样本分布4.2.4 抽样分布抽样分布4.2.5 样本推断总体的理论依据样本推断总体的理论依据这些内容与前面内容这些内容与前面内容有什么关系有什么关系?3/28/202310一、分布的含义一、分布的含义w1、在随机试验中,若、在随机试验中,若X随着试验结果的不同随着试验结果的不同而随机地取各种不同的数值,并且对取每一而随机地取各种不同的数值,并且对取每一个数值或某一范围内的值都有相应的概率,个数值或某一范围内的值都有相应的概率,则称则称X为一个为一个随机变量随机变量。w2、随机变量取一切可能值或范围与其相应随机变量取一切可能值或范围与其相应概率间一一对应的关系,称为概率间一一对应的关系,称为概率分布概率分布(probability distribution,(probability distribution,简称分布简称分布)。w3 3、概率分布是关于总体的概念,有了概率概率分布是关于总体的概念,有了概率分布就等于知道了总体。分布就等于知道了总体。w4、概率分布可以用各种图或表来表示,一、概率分布可以用各种图或表来表示,一些可以用公式来表示。些可以用公式来表示。4.2.1 几种常见几种常见分布分布3/28/202311二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布w定义3/28/202312w正态分布的密度函数图形是一条以均值为中心正态分布的密度函数图形是一条以均值为中心的对称钟型曲线的对称钟型曲线 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202313w正态分布密度函数 的数学性质 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202314w标准正态分布及其重要意义标准正态分布及其重要意义 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202315w标准化法标准化法二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202316w标准化法的几何意义标准化法的几何意义 w标准化变换实质上是作了一个坐标轴的平移和标准化变换实质上是作了一个坐标轴的平移和尺度变换,使正态分布的平均数尺度变换,使正态分布的平均数 ,标准,标准差差 。二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202317w正态分布表及上侧分位数正态分布表及上侧分位数 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202318w 准则 二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202319准则示意图准则示意图二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202320w正态分布的重要意义正态分布的重要意义 在随机理论中,正态分布是最重要的一种分布在随机理论中,正态分布是最重要的一种分布,理由如下:理由如下:w 它是最常见的一种分布,现实中许多随机变它是最常见的一种分布,现实中许多随机变量服从或近似服从正态分布。量服从或近似服从正态分布。w 在一定的条件下,正态分布是其他分布的近在一定的条件下,正态分布是其他分布的近似分布。似分布。w 许多有用的分布,特别是小样本的精确分布许多有用的分布,特别是小样本的精确分布是由正态分布推导出来的。是由正态分布推导出来的。二、正态分布二、正态分布4.2.1 几种常见几种常见分布分布3/28/202321三、小样本三、小样本(n30)的精确分布的精确分布w1、2分布w2、t分布w3、F分布均由正态分布导出的分布4.2.1 几种常见几种常见分布分布3/28/2023221、2分布分布(2 distribution)(1)推导说明推导说明由由阿阿贝贝(Abbe)于于1863年年首首先先给给出出,后后来来由由海海尔尔墨墨特特(Hermert)和和卡卡皮皮尔尔逊逊(KPearson)分分别别于于1875年年和和1900年推导出来。年推导出来。设设 ,则,则构构造造 ,则则 Yi 服服从从自自由由度度为为1的的 2分分布布,即即当总体当总体 ,从中抽取容量为,从中抽取容量为n的样本,则的样本,则4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023231、2分布分布(2)性质和特点)性质和特点由由于于 2 分分布布变变量量为为正正态态变变量量的的平平方方和和,故故分分布布的的变变量量值值始终为正。始终为正。可可加加性性:若若U和和V为为两两个个独独立立的的服服从从 2分分布布的的随随机机变变量量,U 2(n1),V 2(n2),则则U+V这这一一随随机机变变量量服服从从自自由由度为度为n1+n2的的 2分布。分布。n个个独独立立正正态态变变量量平平方方和和称称为为有有n个个自自由由度度的的 2-分分布布,记记为为 2(n)。2-分布为一族分布分布为一族分布,成员由自由度区分。成员由自由度区分。分分布布的的形形状状取取决决于于其其自自由由度度n的的大大小小,通通常常为为不不对对称称的的正正偏分布,但随着自由度的增大逐渐趋于对称。偏分布,但随着自由度的增大逐渐趋于对称。期望为期望为E(2)=n,方差为,方差为D(2)=2n(n为自由度为自由度)4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023241 1、2分布分布(3)图示)图示 选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差s2计算卡方值计算卡方值 2=(n-1)s2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布 2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023251 1、2分布分布(4)2分布的分布的上上 分位点分位点 分位点分位点 设设X 2(n),若对于,若对于:0 1,存在存在,满足满足则称则称为为分布的分布的上上 分位点。分位点。4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202326 由统计学家哥赛特(由统计学家哥赛特(W.S.Gosset)于)于1908年提出,并以其笔名命名。年提出,并以其笔名命名。2 2、t-分布分布(t-distribution)(1)t分布的构造及性质分布的构造及性质4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布构造:构造:构造:构造:若若 N(0,1),2(n),与与 独立,则独立,则 t(n)t(n)称为自由度为称为自由度为称为自由度为称为自由度为n n的的的的t t分布。分布。分布。分布。基本性质:基本性质:基本性质:基本性质:(1)(1)f(t)f(t)关于关于关于关于t=0(t=0(纵轴纵轴纵轴纵轴)对称。对称。对称。对称。(2)(2)f(t)f(t)的极限为的极限为的极限为的极限为N(0N(0,1)1)的密度函数,即的密度函数,即的密度函数,即的密度函数,即3/28/202327t(n)(n)分布的图形为分布的图形为2 2、t-分布分布(t-distribution)(2)t分布的图示分布的图示4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202328w 对于给定的对于给定的:0 t)=的点的点t 为为t(n)分布的上分布的上 分位点分位点。2 2、t-分布分布(t-distribution)(3)t分布的上分布的上 分位点分位点4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202329由由统统计计学学家家费费希希尔尔(R.A.Fisher)提提出出的的,以以其其姓姓氏的第一个字母来命名氏的第一个字母来命名构构造造:设设若若U为为服服从从自自由由度度为为n1的的 2分分布布,即即U 2(n1),V为为服服从从自自由由度度为为n2的的 2分分布布,即即V 2(n2),且,且U和和V相互独立,则相互独立,则 称称F为服从自由度为服从自由度n1和和n2的的F分布,记为分布,记为3 3、F分布分布(F distribution)(1)F分布的构造分布的构造4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202330F分布(图示)不同自由度的不同自由度的F分布分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)3 3、F分布分布(F distribution)(2)F分布的图示分布的图示4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/202331wF分布的分位点:分布的分位点:w对于对于:0 1,若满足条件:若满足条件:PF F(n1,n2)=,则称则称F(n1,n2)为为 F(n1,n2)的的 上上 分位点分位点3 3、F分布分布(F distribution)(3)F分布的上分布的上 分位点分位点4.2.1 几种常见几种常见分布分布 三、三、小样本小样本(n30)的精确分布的精确分布3/28/2023321)总体中各元素的观察值所形成的相对频数)总体中各元素的观察值所形成的相对频数(频率)分布(频率)分布 2)分布通常是未知的(因为几乎得不到总图)分布通常是未知的(因为几乎得不到总图所有观察值)所有观察值)3)可以根据理论分析假定它服从某种分布)可以根据理论分析假定它服从某种分布 总体总体总体总体4.2.2 总体总体分布分布3/28/2023331)一个样本中各观察值形成的相对频数)一个样本中各观察值形成的相对频数(频率)分布(频率)分布 2)也称经验分布)也称经验分布 3)当样本容量)当样本容量n逐渐增大时,样本分布逐逐渐增大时,样本分布逐渐接近总体的分布渐接近总体的分布 样样样样本本本本4.2.3 样本样本分布分布3/28/2023341 1、统计量与参数、统计量与参数1 1)在抽样推断中,无论是总体还是样本,都可以用)在抽样推断中,无论是总体还是样本,都可以用平平均数、比例均数、比例(或成数或成数)、标准差和方差、标准差和方差等指标来描述等指标来描述它们的特征。当它们用来描述样本的特征时,称为它们的特征。当它们用来描述样本的特征时,称为样本统计量;当它们用来描述总体特征时,称为总样本统计量;当它们用来描述总体特征时,称为总体参数。体参数。2 2)样本统计量样本统计量是样本的函数,依据不同的样本计算出是样本的函数,依据不同的样本计算出来的值是不同的,所以统计量是随机变量,如样本来的值是不同的,所以统计量是随机变量,如样本均值均值,样本比例,样本方差等样本比例,样本方差等4.2.4 抽样抽样分布分布3/28/2023352、抽样分布的含义、抽样分布的含义1)含义:含义:样本统计量的概率分布,样本统计量的概率分布,是一种理论分布,是一种理论分布,在重复选取容量为在重复选取容量为n n的样本时,由该统计量的所有可能的样本时,由该统计量的所有可能取值形成的相对频数分布。取值形成的相对频数分布。2)构造抽样分布包括以下几个步骤:构造抽样分布包括以下几个步骤:(1)从容量为)从容量为N的有限总体中随机抽出容量为的有限总体中随机抽出容量为n的的所有可能样本;所有可能样本;(2)算出每个样本的统计量数值;)算出每个样本的统计量数值;(3)算出与每个样本统计量数值相对应的概率,)算出与每个样本统计量数值相对应的概率,作频数分布表。作频数分布表。4.2.4 抽样抽样分布分布3/28/2023363、总体分布、样本均值的抽样分布、总体分布、样本均值的抽样分布(例题分析例题分析)【例例】设设一一个个总总体体,含含有有4个个元元素素(个个体体),即即总总体体单单位位数数N=4。4 个个个个体体分分别别为为x1=1,x2=2,x3=3,x4=4。总体分布、总体均值、总体方差如下。总体分布、总体均值、总体方差如下。总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差4.2.4 抽样抽样分布分布3/28/202337 现现从从总总体体中中抽抽取取n2的的简简单单随随机机样样本本,在在重重复复抽抽样样条件下,共有条件下,共有42=16个样本。所有样本的结果为个样本。所有样本的结果为 3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)4.2.4 抽样抽样分布分布3/28/202338x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.0 2.52.5 计计算算出出各各样样本本的的均均值值,如如下下表表,并并给给出出样样本均值的抽样分布本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值个样本的均值 (x )4.2.4 抽样抽样分布分布3/28/202339样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.5 2=1.25 的分布形式与原有的分布形式与原有的分布形式与原有的分布形式与原有总体的分布总体的分布总体的分布总体的分布和和和和样本容量样本容量样本容量样本容量n n的大小的大小的大小的大小等因素有关等因素有关等因素有关等因素有关总体分布总体分布总体分布总体分布 1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x4.2.4 抽样抽样分布分布3/28/2023404、抽样分布的意义、抽样分布的意义 因因为为样样本本均均值值因因为为样样本本均均值值 是是一一个个是是一一个个随随机机变变量量随随机机变变量量,因因此此,与与其其他他,因因此此,与与其其他他随随机机变变量量一一样样,随随机机变变量量一一样样,具具有有平平均均数数(期期望望)、方方差差和和概概率率具具有有平平均均数数(期期望望)、方方差差和和概概率率分分布布分分布布。因因为为。因因为为 的的各各种种可可能能取取值值是是不不同同简简单单随随机机抽抽样样的的的的各各种种可可能能取取值值是是不不同同简简单单随随机机抽抽样样的的结结果果,所所以以结结果果,所所以以 的的概概率率分分布布称称为为的的概概率率分分布布称称为为 的的抽抽样样分分布布。对对于于这这的的抽抽样样分分布布。对对于于这这个个抽抽样样分分布布及及其其特特征征的的了了解解,可可以以使使我我们们能能够够对对样样本本个个抽抽样样分分布布及及其其特特征征的的了了解解,可可以以使使我我们们能能够够对对样样本本均均 值值均均 值值 与与 总总 体体 均均 值值与与 总总 体体 均均 值值 的的 接接 近近 程程 度度 进进 行行 概概 率率 描描 述述。的的 接接 近近 程程 度度 进进 行行 概概 率率 描描 述述。4.2.4 抽样抽样分布分布 意义:意义:抽样分布一方面描述了样本的随机性,提抽样分布一方面描述了样本的随机性,提供了供了样本统计量长远而稳定的信息样本统计量长远而稳定的信息即变化规律;另一即变化规律;另一方面建立了方面建立了样本与总体的联系,是进行推断的理论基样本与总体的联系,是进行推断的理论基础,也是抽样推断科学性的重要依据础,也是抽样推断科学性的重要依据。3/28/202341一、大数定律一、大数定律w1、是关于均值具有稳定性的一类定律。、是关于均值具有稳定性的一类定律。w2、以切比雪夫大数定律为例。、以切比雪夫大数定律为例。w 设随机变量设随机变量 相互独立,且具有相同的有限数学期望相互独立,且具有相同的有限数学期望和方差:和方差:w w则对于任意正数则对于任意正数 ,都有,都有w3、若把(、若把()看作是来自期望为)看作是来自期望为 、方差为、方差为2 总体的一总体的一个容量为个容量为n的样本,随着的样本,随着n的充分增大,样本均值依概率收敛于总体的充分增大,样本均值依概率收敛于总体均值。均值。w4、大数定律为统计量估计参数提供了理论上的依据。即统计量推断、大数定律为统计量估计参数提供了理论上的依据。即统计量推断参数是可行的。但大数定律没有提供统计量推断参数时误差的计算参数是可行的。但大数定律没有提供统计量推断参数时误差的计算方法。方法。4.2.5 样本推断总体的理论依据样本推断总体的理论依据3/28/202342二、中心极限定理二、中心极限定理 (central limit theorem)当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布1.1.中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为,方方差差为为 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n的的样样本本,当当n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从样分布近似服从均值为均值为、方差为、方差为2/n的的正态分布。正态分布。一个任意分一个任意分布的总体布的总体x x4.2.5 样本推断总体的理论依据样本推断总体的理论依据3/28/2023432.2.x x 的分的分的分的分布趋于正布趋于正布趋于正布趋于正态分布的态分布的态分布的态分布的过程过程过程过程4.2.5 样本推断总体的理论依据样本推断总体的理论依据3/28/2023443.中心极限定理的重要意义中心极限定理的重要意义w1 1)确定了正态分布在各种分布中的首要地位。)确定了正态分布在各种分布中的首要地位。也回答了正态分布是最重要、最常见的分布。也回答了正态分布是最重要、最常见的分布。w2 2)揭示了正态分布的形成机制。如果某一个)揭示了正态分布的形成机制。如果某一个量的变化受到许多种随机因素的影响,这种影量的变化受到许多种随机因素的影响,这种影响的总后果是各个因素的迭加,而且,这些因响的总后果是各个因素的迭加,而且,这些因素中没有任何一个是起主导作用的,那么,这素中没有任何一个是起主导作用的,那么,这个量就是一个服从正态分布的随机变量。个量就是一个服从正态分布的随机变量。w3 3)提供了推断误差的计算思想方法,特别是)提供了推断误差的计算思想方法,特别是大样本处理方法。但没有提供小样本下推断误大样本处理方法。但没有提供小样本下推断误差的计算方法。差的计算方法。4.2.5 样本推断总体的理论依据样本推断总体的理论依据3/28/2023454.3 一个总体参数推断时样本统计量一个总体参数推断时样本统计量的抽样分布的抽样分布w4.3.1 样本均值的抽样分布样本均值的抽样分布w4.3.2 样本比例的抽样分布样本比例的抽样分布w4.3.3 样本方差的抽样分布样本方差的抽样分布3/28/2023461、样本均值抽样分布的含义、样本均值抽样分布的含义1)在重复选取容量为)在重复选取容量为n的样本时,由的样本时,由样本均值样本均值的所有可能取值的所有可能取值形成的形成的相对频数分布相对频数分布2)一种理论概率分布)一种理论概率分布3)是推断总体均值)是推断总体均值 的理论基础的理论基础4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/2023472、样本均值抽样分布的形式样本均值抽样分布的形式(1)总体分布为正态分布总体分布为正态分布 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16 当当总总体体服服从从正正态态分分布布N(,2)时时,来来自自该该总总体体的的所所有有容容量量为为n的的样样本本的的均均值值 x也也服服从从正正态态分分布布,x 的的数学期望为数学期望为,方差为,方差为2/n。即。即 xN(,2/n)4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/2023482、样本均值抽样分布的形式样本均值抽样分布的形式(2)总体分布为非正态分布)总体分布为非正态分布(n30,大,大样本情形本情形)当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2的的一一个个非非正正态态分分布布总总体体中中抽抽取取容容量量为为n的的样样本本,当当n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近似服从近似服从均值为均值为、方差为、方差为2/n的的正态分布正态分布一个任意分一个任意分布的总体布的总体x x4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/2023491、总体分布为非正态分布且为小样本(n30)2、样本均值的分布为非正非正态分布分布2、样本均值抽样分布的形式样本均值抽样分布的形式(3)总体分布为非正态分布总体分布为非正态分布(n30,小小样本情形本情形)4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/202350总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布2、样本均值抽样分布的形式样本均值抽样分布的形式(4)小结)小结4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/2023511)样本均值的数学期望样本均值的数学期望2)样本均值的方差样本均值的方差(方差的概率意义在于刻画了方差的概率意义在于刻画了随机变量取值的分散程度。方差越小,随机变随机变量取值的分散程度。方差越小,随机变量的取值越集中在期望值附近。量的取值越集中在期望值附近。)重复抽样重复抽样不重复抽样不重复抽样3、样本均值抽样分布的特征、样本均值抽样分布的特征设总体共有设总体共有N个元素,其均值为个元素,其均值为,方差为,方差为2,从,从中抽取容量为中抽取容量为n的样本,则的样本,则 4.3.1 样本均值的抽样分布样本均值的抽样分布3/28/2023521)总体(或样本)中具有某种属性的单位与全)总体(或样本)中具有某种属性的单位与全部单位总数之比部单位总数之比 不同性别的人与全部人数之比不同性别的人与全部人数之比合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2)总体比例可表示为)总体比例可表示为3)样本比例可表示为)样本比例可表示为 4.3.2 样本比例(成数)的抽样分布样本比例(成数)的抽样分布1、比例(成数)的含义、比例(成数)的含义3/28/2023531)在重复选取容量为在重复选取容量为n的样本时,由样本比例的的样本时,由样本比例的所有可能取值形成的相对频数分布。所有可能取值形成的相对频数分布。2)一种理论概率分布。一种理论概率分布。3)当样本容量很大时(当样本容量很大时(np5和和n(1-p)5),样本),样本比例的抽样分布可用比例的抽样分布可用正态分布正态分布近似。近似。4)推断总体比例推断总体比例 的理论基础。的理论基础。4.3.2 样本比例的抽样分布样本比例的抽样分布2、样本比例抽样分布的含义及形式、样本比例抽样分布的含义及形式3/28/2023541)样本比例的数学期望样本比例的数学期望2)样本比例的方差样本比例的方差重复抽样重复抽样不重复抽样不重复抽样4.3.2 样本比例的抽样分布样本比例的抽样分布3、样本比例抽样分布的特征、样本比例抽样分布的特征3/28/202355调查误差调查误差调查误差调查误差登记性误差登记性误差登记性误差登记性误差代表性误差代表性误差代表性误差代表性误差系统性误差(偏差)系统性误差(偏差)系统性误差(偏差)系统性误差(偏差)抽样平均误差抽样平均误差实际误差实际误差实际误差实际误差 抽样误差抽样误差抽样误差抽样误差主要是指在用样本数据进行推断时所产生主要是指在用样本数据进行推断时所产生主要是指在用样本数据进行推断时所产生主要是指在用样本数据进行推断时所产生的随机误差。统计推断中的抽样误差通常是指的随机误差。统计推断中的抽样误差通常是指的随机误差。统计推断中的抽样误差通常是指的随机误差。统计推断中的抽样误差通常是指抽样平均抽样平均误差误差,它是抽样调查所固有的,是对抽样推断精确度的,它是抽样调查所固有的,是对抽样推断精确度的,它是抽样调查所固有的,是对抽样推断精确度的,它是抽样调查所固有的,是对抽样推断精确度的量度。量度。量度。量度。4.3.2 样本比例的抽样分布样本比例的抽样分布4、抽样误差抽样误差(1)调查误差的分类)调查误差的分类抽样极限误差抽样极限误差抽样极限误差抽样极限误差抽样误差抽样误差(随机误差)(随机误差)(随机误差)(随机误差)3/28/2023564.3.2 样本比例的抽样分布样本比例的抽样分布(2)统计量的标准误()统计量的标准误()定义:样本统计量的抽样分布的样本统计量的抽样分布的样本统计量的抽样分布的样本统计量的抽样分布的标准差,测度所有样本统计量标准差,测度所有样本统计量标准差,测度所有样本统计量标准差,测度所有样本统计量的离散程度,也称的离散程度,也称的离散程度,也称的离散程度,也称标准误差标准误差标准误差标准误差或或或或抽样平均误差。抽样平均误差。抽样平均误差。抽样平均误差。A:样本均值 的抽样误差B:样本成数P的抽样误差4、抽样误差抽样误差3/28/202357 样本平均数 的抽样平均误差A、重复抽样、重复抽样4、抽样误差抽样误差(3)标准误差的计算)标准误差的计算4.3.2 样本比例的抽样分布样本比例的抽样分布3/28/202358B、不重复抽样、不重复抽样4、抽样误差抽样误差(3)标准误差的计算)标准误差的计算4.3.2 样本比例的抽样分布样本比例的抽样分布3/28/202359不重复抽样有限总体重复抽样或无限总体有限总体中为校正因子,一般可简写为一般当抽样比小于等于一般当抽样比小于等于一般当抽样比小于等于一般当抽样比小于等于5 5时,校正因子可忽略不计。时,校正因子可忽略不计。时,校正因子可忽略不计。时,校正因子可忽略不计。标准误差就是样本统计量的抽样分布的标准差,标准误差就是样本统计量的抽样分布的标准差,标准误差就是样本统计量的抽样分布的标准差,标准误差就是样本统计量的抽样分布的标准差,也称抽样平均误差,其也称抽样平均误差,其也称抽样平均误差,其也称抽样平均误差,其计算公式计算公式计算公式计算公式如下:如下:如下:如下:4.3.2 样本比例的抽样分布样本比例的抽样分布4、抽样误差抽样误差(3)标准误差的计算)标准误差的计算3/28/202360 当计算标准误时涉及的当计算标准误时涉及的总体参数未知总体参数未知时,用样本时,用样本统计量代替计算的标准误,称为估计的标准误。统计量代替计算的标准误,称为估计的标准误。以样本均值的抽样分布为例,当总体标准差以样本均值的抽样分布为例,当总体标准差 未未知时,知时,可用样本标准差可用样本标准差s代替代替,则在重复抽样条,则在重复抽样条件下,样本均值的估计标准误为:件下,样本均值的估计标准误为:标准差=标准误=估计标准误=抽样误差?4.3.2 样本比例的抽样分布样本比例的抽样分布4、抽样误差抽样误差(4)估计的标准误)估计的标准误(standard error of estimation)3/28/202361q总体各单位的差异程度(即标准差总体各单位的差异程度(即标准差的大小):的大小):越大,抽样误差越大;越大,抽样误差越大;q样本单位数的多少:样本单位数的多少:越大,抽样误越大,抽样误差越小;差越小;q抽样方法:抽样方法:不重复抽样的抽样误差不重复抽样的抽样误差比重复抽样的抽样误差小;比重复抽样的抽样误差小;q抽样组织方式:抽样组织方式:简单随机抽样的误简单随机抽样的误差最大。差最大。4.3.2 样本比例的抽样分布样本比例的抽样分布4、抽样误差抽样误差(5)影响抽样误差的因素)影响抽样误差的因素3/28/202362621.在在重重复复选选取取容容量量为为n的的样样本本时时,由由样样本本方方差差的的所有可能取值所有可能取值形成的相对频数分布形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值对于来自正态总体的简单随机样本,则比值 的抽样

    注意事项

    本文(统计学之抽样分布38821.pptx)为本站会员(muj****520)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开