统计学抽样与抽样分布讲稿.ppt
《统计学抽样与抽样分布讲稿.ppt》由会员分享,可在线阅读,更多相关《统计学抽样与抽样分布讲稿.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于统计学抽样与抽样分布第一页,讲稿共六十七页哦24.1 抽样的基础知识一、几个概念二、抽样误差三、常用的抽样方法第二页,讲稿共六十七页哦3一、几个概念(一)全及总体与总体指标(一)全及总体与总体指标全全及及总总体体。简简称称总总体体(Population)(Population),是是指指所所要要研研究究的的对对象象的的全全体体,它它是是由由所所研研究究范范围围内内具具有有某某种种共共同同性性质质的的全全部部单单位所组成的集合体。总体单位总数用位所组成的集合体。总体单位总数用N N表示。(举例)表示。(举例)总总体体指指标标(参参数数)。在在抽抽样样估估计计中中,用用来来反反映映总总体体数数
2、量量特特征的指标称为总体指标,也叫总体参数。征的指标称为总体指标,也叫总体参数。研研究究目目的的一一经经确确定定,总总体体也也唯唯一一地地确确定定了了,所所以以总总体体指指标标的的数数值值是是客客观观存存在在的的、确确定定的的,但但又又是是未未知知的的,需需要要用样本资料去估计用样本资料去估计。第三页,讲稿共六十七页哦总体和参数(续)通常所要估计的总体指标有通常所要估计的总体指标有变量总体变量总体属性总体属性总体总体平均数总体平均数 (或记为或记为)总体比例(成数)总体比例(成数)总体标准差总体标准差或方差或方差 总体比例标准差总体比例标准差P P或方差或方差P P 总体标志总量总体标志总量
3、()()总总体体中中具具有有某某一一属属性性的的单单位位总总数数(NP)(NP)等。等。第四页,讲稿共六十七页哦5一、几个概念(二)样本总体与样本指标(二)样本总体与样本指标样样本本总总体体。简简称称样样本本(SampleSample),它它是是按按照照随随机机原原则则,从从总总体中抽取的部分总体单位的集合体体中抽取的部分总体单位的集合体 。样样本本容容量量:样样本本中中所所包包含含的的个个体体的的数数量量,一一般般用用n n表表示示。在在实实际际工工作作中中,人人们们通通常常把把n30n30的的样样本本称称为为大大样样本本,而而把把n30nn)分层抽样把异质性较强的总体分成一个个同质性较强的
4、子总体,再抽取不同的子总体中的样本分别代表该子总体,所有的样本进而代表总体。等距抽样把总体的单位进行排序,然后按照固定的抽样距离抽取样本。第一个样本采用简单随机抽样的办法抽取。整群抽样抽样的单位不是单个的个体,而是成群的个体。多阶段抽样把抽样过程分为几个阶段进行。适用于总体规模特别大,或者总体分布的范围特别广时 第二十二页,讲稿共六十七页哦非概率抽样也叫非随机抽样,是指从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。重点调查、典型调查、配额抽样(是按照一定标准或一定条件分配样本单位数量,然后由调查者在规定的数额内主观地抽取样本)、方便抽样(指调查者按其方便任意选取
5、样本。如商场柜台售货员拿着厂家的调查表对顾客的调查)等就属于非随机抽样。优优点点:及时了解总体大致情况,总结经验教训,在进行大规模抽样调查之前的试点。缺缺点点:非随机抽样容易产生倾向性误差,并且误差不能计算和控制,也就无法说明调查结果的可靠程度。第二十三页,讲稿共六十七页哦概率抽样与非概率抽样抽样类型抽样类型概率抽样非概率抽样简单随机抽样分层随机抽样整群抽样系统抽样方便抽样判断抽样其他非概率抽样多阶段抽样第二十四页,讲稿共六十七页哦重复抽样与非重复抽样重复抽样,又称回置抽样,是指从总体的N个单位中,每次抽取一个单位后,再将其放回总体中参加下一次抽选,连续抽n次,即得到一个样本。特点:样本是由n
6、次相互独立的连续试验构成的,每次试验是在完全相同的条件下进行,每个单位中选的机会在各次都完全相等。“重抽”(考虑顺序)可能的样本数目(从总体中可能抽取的样本个数,用M表示)为:Nn个。第二十五页,讲稿共六十七页哦重复抽样与非重复抽样不重复抽样,也叫不回置抽样,是指抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。特点特点:样本由n次连续抽取的结果构成,实际上等于一次同时从总体中抽取n个样本单位。n次抽取结果不是独立的 可能的样本数目(考虑顺序):N(N-1)(N-2)(N-n+1)个。第二十六页,讲稿共六十七页哦重复抽样与非重复抽样设设有有4 4名名学学生生的的月月消消费费支
7、支出出分分别别为为:240240,280280,360360,400400元元。我我们们分分别别用用A A、B B、C C、D D替替代代。若若从从中中抽抽取取两两个个单位构成样本,则全部可能的样本数目为:单位构成样本,则全部可能的样本数目为:重复:重复:4 42 2=16=16个。它们是个。它们是 AA AB AC AD;BA BB BC BD AA AB AC AD;BA BB BC BD CA CB CC CD;DA DB DC DD CA CB CC CD;DA DB DC DD不重复:不重复:43=1243=12。它们是。它们是 AB AC AD;BA BC BDAB AC AD;B
8、A BC BD CA CB CD;DA DB DC CA CB CD;DA DB DC 第二十七页,讲稿共六十七页哦抽样误差统统计计调调查查误误差差,是是指指调调查查所所得得结结果果与与总总体体真真实实数数值值之之间的差异间的差异。登记性误差登记性误差。是任何一种统计调查都可能产生。是任何一种统计调查都可能产生。代表性误差代表性误差n系系统统性性误误差差:是是由由于于非非随随机机因因素素引引起起的的 样样本本代代表表性性不不足足而而产产生生的的误误差差,表表现现为为样样本本估估计计量量的的值值系系统统性性偏偏高高或或偏偏低,故也称偏差;低,故也称偏差;n随机误差随机误差:又称偶然性误差,是指:
9、又称偶然性误差,是指遵循随机原则抽样,遵循随机原则抽样,但由于样本各单位的结构不足以代表总体各单位的但由于样本各单位的结构不足以代表总体各单位的结构而引起的样本估计量与总体参数之间的误差结构而引起的样本估计量与总体参数之间的误差。这。这就是抽样估计中所谓的抽样误差就是抽样估计中所谓的抽样误差 。第二十八页,讲稿共六十七页哦29二、抽样误差实实际际应应用用中中,有有三三个个密密切切联联系系而而又又相相互互区区别别的的抽抽样误差的概念样误差的概念 实际抽样误差实际抽样误差 抽样平均误差抽样平均误差 抽样极限误差抽样极限误差第二十九页,讲稿共六十七页哦30二、抽样误差(二)抽样平均误差(抽样标准误(
10、二)抽样平均误差(抽样标准误)抽抽样样平平均均误误差差是是反反映映抽抽样样误误差差一一般般水水平平的的指指标标(因因为为抽抽样样误误差差是是一一个个随随机机变变量量,它它的的数数值值随随着着可可能能抽抽取取的的样样本本不不同同而而或或大大或或小小,为为了了总总的的衡衡量量样样本本代代表表性性的的高高低低,就就需需要要计计算算抽抽样样误误差差的的一一般般水水平平)。通通常常用用样样本本估估计计量量的的标标准准差差来反映来反映所有可能样本估计值与其中心值的平均离散程度。所有可能样本估计值与其中心值的平均离散程度。第三十页,讲稿共六十七页哦31二、抽样误差(二)抽样平均误差(二)抽样平均误差n抽样平
11、均误差可衡量样本对总体的代表性大小抽样平均误差可衡量样本对总体的代表性大小。即。即:抽样平均误越小,则样本估计抽样平均误越小,则样本估计量的分布就越集中在总体参数的附近,平均来说,样本估计值与总体参数之间的抽样量的分布就越集中在总体参数的附近,平均来说,样本估计值与总体参数之间的抽样误差越小,样本对总体的代表性越大。误差越小,样本对总体的代表性越大。第三十一页,讲稿共六十七页哦32抽样平均误的计算公式抽样平均误的计算公式在在总总体体方方差差 已已知知,总总体体单单位位总总数数为为N N,样样本本容容量量为为n n,简单随机抽样条件下,抽样平均误的计算公式为,简单随机抽样条件下,抽样平均误的计算
12、公式为:重复抽样重复抽样 不重复抽样不重复抽样估计均值估计均值估计成数估计成数第三十二页,讲稿共六十七页哦33二、抽样误差(三)抽样极限误差(三)抽样极限误差抽抽样样极极限限误误差差是是指指一一定定概概率率下下抽抽样样误误差差的的可可能能范范围围,也也称称为为允许误差允许误差。用。用表示,由定义知其表达式:表示,由定义知其表达式:在一定概率下,在一定概率下,上上式式表表示示,在在一一定定概概率率下下可可认认为为样样本本估估计计量量与与相相应应的的总总体体参数的误差的绝对值不超过参数的误差的绝对值不超过 。第三十三页,讲稿共六十七页哦34抽样极限误差抽样极限误差用用 、分分别别表表示示平平均均数
13、数和和比比率率(成成数数)的的抽抽样样极极限限误误差差,则则在一定概率下有:在一定概率下有:估计均值的置信区间:估计均值的置信区间:估计成数(比例)的置信区间:估计成数(比例)的置信区间:第三十四页,讲稿共六十七页哦35对抽样极限误差的解释:抽样极限误差抽样极限误差是抽样误差的是抽样误差的可能范围可能范围,而不是完全肯定的范围。,而不是完全肯定的范围。所以,这一可能范围的大小是与其估计的可靠程度的大小(即概所以,这一可能范围的大小是与其估计的可靠程度的大小(即概率)紧密联系的。在抽样估计中,这个概率叫置信度,习惯上也率)紧密联系的。在抽样估计中,这个概率叫置信度,习惯上也称为可靠程度、把握程度
14、或概率保证程度等,用称为可靠程度、把握程度或概率保证程度等,用1-1-表示。表示。显显然在其他条件不变的情况下,抽样极限误差越大,相应的置信然在其他条件不变的情况下,抽样极限误差越大,相应的置信度也就越大。度也就越大。第三十五页,讲稿共六十七页哦36抽样误差率:抽样误差率:与抽样极限误差相关的两个概念是与抽样极限误差相关的两个概念是:抽样误差率和抽样估计精度抽样误差率和抽样估计精度抽样误差率抽样误差率=(抽样极限误差(抽样极限误差/估计量)估计量)100%100%抽样估计精度抽样估计精度=100%-=100%-抽样误差率抽样误差率第三十六页,讲稿共六十七页哦37估计精度(准确性)与可靠程度的关
15、系:估估计计精精度度与与估估计计的的可可靠靠程程度度是是矛矛盾盾的的。也也就就是是说说,如如果果精精度度很很高高,则则会会由由于于估估计计区区间间太太窄窄而而使使错错误误估估计计的的可可能能性性大大增增,从从而而大大大大降降低低估估计计的的可可靠靠程程度度,使使估估计计结结果果没没有有多多大大的的作作用用;如如果果置置信信度度很很高高,则则意意味味着着允允许许误误差差范范围围较较大大,而而使使估估计计精精度度太太低低 ,这这时时尽尽管管估估计计的的可可靠靠程程度度接接近近或或等等于于100%100%,但但抽抽样样估计本身也会失去意义。估计本身也会失去意义。实实际际中中,只只能能依依据据具具体体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 抽样 分布 讲稿
限制150内