抽样分布PPT讲稿.ppt
《抽样分布PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《抽样分布PPT讲稿.ppt(120页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样分布第1页,共120页,编辑于2022年,星期日学习目标学习目标1.了解抽样中的概率抽样方法了解抽样中的概率抽样方法2.理解抽样分布的意义理解抽样分布的意义3.了解抽样分布的形成过程了解抽样分布的形成过程4.理解中心极限定理和大数定理理解中心极限定理和大数定理5.理解抽样分布的性质理解抽样分布的性质第2页,共120页,编辑于2022年,星期日l6.1.1 抽样推断抽样推断 6.1.2 抽样的方法抽样的方法 6.1.3 样本容量和样本个数样本容量和样本个数 6.1.4 参数和样本统计量参数和样本统计量 6.15 抽样框抽样框 6.1.6 抽样的组织形式抽样的组织形式 6.1.7 抽样误差抽样
2、误差 6.1 抽样的基本概念抽样的基本概念第3页,共120页,编辑于2022年,星期日 从研究现象总体的所有单位中,按照从研究现象总体的所有单位中,按照随随机原则机原则抽取部分单位作为样本,然后以抽取部分单位作为样本,然后以样本的观测结果对总体的数量特征作出样本的观测结果对总体的数量特征作出具有具有一定可靠程度和精度一定可靠程度和精度的估计或推断的估计或推断的一种统计调查方法。的一种统计调查方法。抽样推断的含义抽样推断的含义总体总体随机样本随机样本随机样本随机样本 第4页,共120页,编辑于2022年,星期日1.在调查单位的抽取上遵循随机原则在调查单位的抽取上遵循随机原则抽样推断方法的抽样推断
3、方法的特点特点2.以样本的数量特征去推断总体的数量特征以样本的数量特征去推断总体的数量特征3.存在抽样误差,可计算并加以控制存在抽样误差,可计算并加以控制第5页,共120页,编辑于2022年,星期日l一、了解不能或难以采用全面调查的总一、了解不能或难以采用全面调查的总体的数量特征体的数量特征l二、与全面调查相结合,修正和补充全二、与全面调查相结合,修正和补充全面调查面调查l三、在生产过程中进行质量控制三、在生产过程中进行质量控制l四、可以对总体的某种假设进行检验四、可以对总体的某种假设进行检验抽样推断的抽样推断的作用作用第6页,共120页,编辑于2022年,星期日l(一)参数估计l(二)假设检
4、验抽样推断的内容抽样推断的内容第7页,共120页,编辑于2022年,星期日6.1.2 抽样的方法抽样的方法抽样的方法抽样的方法重复抽样重复抽样不重复抽样不重复抽样第8页,共120页,编辑于2022年,星期日l重复抽样:也叫回置抽样。特点:每个单位在每次抽中机会一样。l不重复抽样:也叫不回置抽样。特点:每个单位在每次抽中机会不一样;每个单位最多只能被抽中一次。l不重复抽样的抽样平均误差小于重复抽样的抽样平均误差。第9页,共120页,编辑于2022年,星期日6.1.3 样本容量和样本个数样本容量和样本个数样本容量:样本中的单位数,通常用字样本容量:样本中的单位数,通常用字母母n表示。表示。通常,通
5、常,n30的样本称为大样本,的样本称为大样本,n30的样的样本称为小样本。本称为小样本。样本个数:从总体中可能抽得的样本的样本个数:从总体中可能抽得的样本的数目数目第10页,共120页,编辑于2022年,星期日样本的可能数目样本的可能数目从总体N中随机抽取n个样本单位共有多少种可能的抽选结果与抽样方法和是否考虑顺序有关。有以下四种组合:重复抽样考虑顺序重复抽样考虑顺序 不重复抽样考虑顺序不重复抽样考虑顺序3.不重复抽样不考虑顺序不重复抽样不考虑顺序4 重复抽样不考虑顺序(不常用)重复抽样不考虑顺序(不常用)第11页,共120页,编辑于2022年,星期日 重复抽样考虑顺序的可能样本数目:重复抽样
6、考虑顺序的可能样本数目:不重复抽样考虑顺序的可能样本数目:不重复抽样考虑顺序的可能样本数目:共共n个个3 不重复抽样不考虑顺序的可能样本数目:不重复抽样不考虑顺序的可能样本数目:第12页,共120页,编辑于2022年,星期日6.1.4 参数和统计量参数和统计量l参数参数(parameter)(parameter)来描述总体数量特征的指标,又称总体指标。即对总体特征的数量描述。参数已知,总体的分布特征就已知。所关心的参数主要有总体均值()、标准差()、总体比例(P/)等用 表示参数的特点:参数的数值是客观存在的,总体一定,参数就唯一确定,但却是未知的。第13页,共120页,编辑于2022年,星期
7、日l统计量统计量(statistic)(statistic)又称样本指标或估计量,是根据样本数据计算出来的一些量,用以推断总体参数(总体指标)的综合指标。特点:是随样本不同而不同的随机变量,不含未知参随机变量,不含未知参数。数。所关心的样本统计量有:样本均值(x)、样本标准差(s)、样本比例(p)等用 表示第14页,共120页,编辑于2022年,星期日平均数平均数标准差标准差比例比例参数参数 统计量统计量 xsp 总体总体总体总体 样本样本样本样本第15页,共120页,编辑于2022年,星期日6.15抽样框l抽样框:全部抽样单位的名单框架。抽样框的好坏通常会直接影响到抽样调查的随机性和调查效果
8、。有如下几种抽样框形式:l名单抽样框:列出全部总体单位的名录一览表。如职工名单,企业名单。l区域抽样框:按地理位置将总体范围划分为若干小区,以小区为单位进行抽样。如市住房调查划分为街道、区片。l时间抽样框:将总体全部单位按时间顺序排列,每隔一定时间抽样。如流水线抽样进行产品质检。第16页,共120页,编辑于2022年,星期日6.1.6 抽样的组织形式抽样的组织形式 一、简单随机抽样一、简单随机抽样 二、分层抽样二、分层抽样 三、系统抽样三、系统抽样 四、整群抽样四、整群抽样 五、多阶段抽样五、多阶段抽样第17页,共120页,编辑于2022年,星期日对总体单位逐一编号,然后按随机原对总体单位逐一
9、编号,然后按随机原则直接从总体中抽出若干单位构成样本则直接从总体中抽出若干单位构成样本应用应用仅适用于规模不大、内部各单位仅适用于规模不大、内部各单位标志值差异较小的总体标志值差异较小的总体是最简单、最基本、最符合随机原则,是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式但同时也是抽样误差最大的抽样组织形式简单随机抽样简单随机抽样(simple random sampling)抽签、随机数字表法抽签、随机数字表法第18页,共120页,编辑于2022年,星期日59079 46755 72348 69595 53408 92708 67110 68260 79820 9112
10、3 48391 76486 60421 69414 37271 89276 07577 43880 08133 0989867072 33693 81976 68018 89363 39340 93294 82290 95922 9632986050 07331 89994 36265 62934 47361 25352 61467 51683 4383384426 40439 57595 37715 16639 06343 00144 98294 64512 19201 注意注意:必须先对总体中的每一个单位进行编码或编号,确定抽样框。简单随机抽样适合于调查标志在各单位分布较均匀的总体,一般情
11、况下,简单随机抽样的效果相对差些。第19页,共120页,编辑于2022年,星期日将总体全部单位分类,形成若干个类型组,将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。然后从各类型中分别抽取样本单位组成样本。总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取最优抽取最优抽取能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标分层抽样分层抽样(stratified sampling)第20页,共120页,编辑于2022年,星期日注意注意:1、随机性、随
12、机性2、分层抽样要求事先对总体有较多的了解。、分层抽样要求事先对总体有较多的了解。3、分层抽样对层而言是全面调查,对层内单位而言是非、分层抽样对层而言是全面调查,对层内单位而言是非全面调查。全面调查。4、能避免明显的偏高或偏低情况。、能避免明显的偏高或偏低情况。5、适合于调查标志在各单位间的分布差异大的总体。、适合于调查标志在各单位间的分布差异大的总体。第21页,共120页,编辑于2022年,星期日等距抽样等距抽样/机械抽样机械抽样将总体单位按某一标志排序,而后按一将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。定的间隔抽取样本单位。随机起点随机起点随机起点随机起点半距起点半距起点对称
13、起点对称起点对称起点对称起点(总体单位按某一标志排序)(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样;按有;按有;按有;按有关标志排队,其抽样效果相当于关标志排队,其抽样效果相当于关标志排队,其抽样效果相当于关标志排队,其抽样效果相当于类型抽样类型抽样类型抽样类型抽样。系统抽样系统抽样(systematic sampling)第22页,共120页,编辑于2022年,星期日 将总体全部单位分为若干将总体全部单位分为若干“群群”,然后然后随机抽取一部分随机抽取一部分“
14、群群”,被抽中群体的所有被抽中群体的所有单位构成样本单位构成样本例:总体群数例:总体群数R=16 样本群数样本群数r=4ABCDEFGHIJKLMNOPLHPD样本容量样本容量简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差整群抽样整群抽样(cluster sampling)第23页,共120页,编辑于2022年,星期日 指分两个或两个以上的阶段来完成抽取指分两个或两个以上的阶段来完成抽取
15、样本单位的过程样本单位的过程例:在某省例:在某省100多万农户抽取多万农户抽取1000户调查农户户调查农户生产性投资情况。生产性投资情况。第一阶段:从该省所有县中抽取第一阶段:从该省所有县中抽取5个县个县第二阶段:从被抽中的第二阶段:从被抽中的5个县中各抽个县中各抽4个乡个乡 第三阶段:从被抽中的第三阶段:从被抽中的20个乡中各抽个乡中各抽5个村个村 第四阶段:从被抽中的第四阶段:从被抽中的100个村中各抽个村中各抽10户户样本样本n=10010=1000(户户)多阶段抽样多阶段抽样第24页,共120页,编辑于2022年,星期日q调查对象的性质特点调查对象的性质特点q对调查对象的了解程度对调查
16、对象的了解程度q抽样误差的大小抽样误差的大小q人力、财力和物力等条件的限制人力、财力和物力等条件的限制在实际工作中,选择适当的抽样组织在实际工作中,选择适当的抽样组织方式主要应考虑:方式主要应考虑:抽样组织方式的选择抽样组织方式的选择第25页,共120页,编辑于2022年,星期日抽抽抽抽样样样样中中中中的的的的误误误误差差差差登登登登记记记记性性性性误误误误差差差差,也叫调查误差也叫调查误差也叫调查误差也叫调查误差代表性误差代表性误差代表性误差代表性误差系统性误差系统性误差系统性误差系统性误差偶然性误差偶然性误差偶然性误差偶然性误差偏差偏差偏差偏差抽样误差抽样误差抽样误差抽样误差抽样中的误差抽
17、样中的误差(抽样误差的计算在后边讲)(抽样误差的计算在后边讲)第26页,共120页,编辑于2022年,星期日6.2 抽样分布基本理论抽样分布基本理论6.2.1 中心极限定理中心极限定理 6.2.2 正态分布的再生定理正态分布的再生定理 6.2.3 大数定律大数定律 6.2.4 三种不同性质的分布三种不同性质的分布 6.2.5 常见的几种抽样分布常见的几种抽样分布 第27页,共120页,编辑于2022年,星期日中中中中心心心心极极极极限限限限定定定定理理理理:设从均值为,方差为 2的一个任意总体中采取重复抽样抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分
18、布不论总体服从何种分布,只要其数学期望和方差存在,对这一总体进行重复抽样时,当样本量n充分大,就趋于正态分布该定理为均值的抽样推断奠定了理论基础。6.2.1中心极限定理中心极限定理第28页,共120页,编辑于2022年,星期日中心极限定理当样本容量足够当样本容量足够大时大时(n 30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布一个任意一个任意分布的总分布的总体体x x第29页,共120页,编辑于2022年,星期日中心极限定理 x x 的的分分布布趋趋于于正正态态分分布布的的过程过程第30页,共120页,编辑于2022年,星期日6.2.2正态分布的再生定理 =50=5
19、0=50 =10=10X X X总体分布总体分布总体分布总体分布n=4抽样分布抽样分布抽样分布抽样分布xn n=16=16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的数学期望为,方差为2/n。即xN(,2/n)第31页,共120页,编辑于2022年,星期日例题分析 例例某酒店电梯中质量标志注明最大载重为某酒店电梯中质量标志注明最大载重为18人,人,1350kg。假定已知该酒店旅客及其携带行李的平均重量为假定已知该酒店旅客及其携带行李的平均重量为70kg,标,标准差为准差为6kg。试问随机进入电梯。试问随机进入电梯18人,总重量超重的概人,总重量超
20、重的概率是多少?率是多少?第32页,共120页,编辑于2022年,星期日例题分析 例例 一个汽车电池的制造商声称其最好的电池寿一个汽车电池的制造商声称其最好的电池寿命的分布均值为命的分布均值为54个月,标准差为个月,标准差为6个月。假设某个月。假设某一消费组织决定购买一消费组织决定购买50个这种电池作为样本来检个这种电池作为样本来检验电池的寿命,以核实这一声明。验电池的寿命,以核实这一声明。(1)假设这个制造商所言真实,试描述这)假设这个制造商所言真实,试描述这50个电池样本的平均寿命的抽样分布个电池样本的平均寿命的抽样分布 (2)假设这个制造商所言真实,则消费组织)假设这个制造商所言真实,则
21、消费组织的样本寿命均值小于或等于的样本寿命均值小于或等于52个月的概率是多个月的概率是多少?少?第33页,共120页,编辑于2022年,星期日第34页,共120页,编辑于2022年,星期日6.2.3 大数定律大数定律 1.1.独立同分布大数定律独立同分布大数定律独立同分布大数定律独立同分布大数定律 2.2.贝努里大数定律贝努里大数定律贝努里大数定律贝努里大数定律 o大数定律是阐述大量同类随机现象的平均结果o的稳定性的一系列定理的总称。第35页,共120页,编辑于2022年,星期日独立同分布大数定律独立同分布大数定律l设X1,X2,是独立同分布的随机变量序列,且存在有限的数学期望E(Xi)和方差
22、D(Xi)2(i=1,2,),则对任意小的正数,有:第36页,共120页,编辑于2022年,星期日大数定律(续)大数定律(续)l该大数定律表明:当n充分大时,相互独立且服从同一分布的一系列随机变量取值的算术平均数,与其数学期望的偏差小于任意小的正数概率接近于1。l该定理给出了平均值具有稳定性的科平均值具有稳定性的科学描述,从而为使用样本均值去估计学描述,从而为使用样本均值去估计总体均值总体均值(数学期望)提供了理论依据。第37页,共120页,编辑于2022年,星期日贝努里大数定律贝努里大数定律l设m是n次独立重复试验中事件A发生的次数,p是每次试验中事件A发生的概率,则对任意的 0,有:l它表
23、明,当重复试验次数n充分大时,事件A发生的频率m/n依概率收敛于事件A发生的概率阐明了频率具有稳定性,提供了用频率估计概率的频率具有稳定性,提供了用频率估计概率的理论依据理论依据。第38页,共120页,编辑于2022年,星期日总体分布l总体中各元素的观察值所形成的分布 l分布通常是未知的l可以假定它服从某种分布 6.2.4 三种不同性质的分布三种不同性质的分布总体总体第39页,共120页,编辑于2022年,星期日1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布样样本本第40页,共120页,编辑于2022年,星期日1.抽样分
24、布是来自容量相同容量相同的所有所有可能样本的概率分布,是一种理论分布抽取容量为 n n 的样本时,由该统计量的所有可能取值形成的概率分布 2.样本统计量(如样本统计量(如样本均值,样本比例,样本方差等)是随机变量,样本不同,样本统计量的计算值是不同的。3.抽样分布反映样本统计量的分布特征,是进行推断的理论基础,揭示样本统计量和总体参数之间的关系,估计抽样误差,是抽样推断科学性的重要依据 抽样分布抽样分布第41页,共120页,编辑于2022年,星期日抽样分布的形成过程抽样分布的形成过程总体总体计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量计算样本统计量如:样本均值、如:样
25、本均值、如:样本均值、比例、方差比例、方差比例、方差样样本本第42页,共120页,编辑于2022年,星期日6.2.5 常见的几种抽样分布常见的几种抽样分布lXN(,2)正态分布(略)正态分布(略)l 2分布分布lt分布分布lF分布分布第43页,共120页,编辑于2022年,星期日正态分布正态分布(normal distribution)1.由C.F.高斯(Carl Friedrich Gauss,17771855)作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3.许多现象都可以由正态分布来描述 4.可用于近似离散型随机变量的计算例如:二项分布5.经典统计推断的基础x
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 分布 PPT 讲稿
限制150内