抽样理论及总体参数的估计精选PPT.ppt
《抽样理论及总体参数的估计精选PPT.ppt》由会员分享,可在线阅读,更多相关《抽样理论及总体参数的估计精选PPT.ppt(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样理论及总体参数的估计第1页,讲稿共113张,创作于星期一第一节随机抽样的基本概念与方法v一、随机抽样的基本概念总体(Population)-要研究的事物或现象的总体。个体(Itemunit)-组成总体的每个元素(成员)。总体容量(Populationsize)-一个总体中所含个体的数量。样本(Sample)-从总体中抽取的部分个体第2页,讲稿共113张,创作于星期一样本容量(Samplesize)-样本中所含个体的数量。抽样(Sampling)-为推断总体的某些重要特征,需要从总体中按一定抽样技术抽取若干个体的过程。统计量(Statistic)-由样本构造,用来估计总体参数的函数。统计
2、量是样本的函数,只依赖于样本;统计量不含任何参数。样本均值、样本方差等都是统计量。第3页,讲稿共113张,创作于星期一v二、随机抽样方法v(1)简单随机抽样(Simplerandomsampling)v完全随机地选取样本,要求有一个完美的抽样框或有总体中每一个个体的详尽名单。可以采取抽签或随机数字表的办法实现。v(2)分层抽样(Reducedsampling)v先将总体分成不同的“层”,然后,在每一“层”内进行简单随机抽样。可防止简单随机抽样造成的样本构成与总体构成不成比例的现象。第4页,讲稿共113张,创作于星期一(3)整群抽样(ClusterSampling)在整群抽样中,总体首先被分成称
3、作群的独立的元素组,总体中的每一元素属于且仅属于某一群。抽取一个以群为元素的简单随机样本,样本中的所有元素组成样本。在理想状态下,每一群是整个总体小范围内的代表。(4)系统抽样(Systematicsampling)又称等距抽样。从前k个元素中随机选一个,然后在样本框中每隔一定距离抽取一个。第5页,讲稿共113张,创作于星期一第二节抽样分布v一、抽样分布的基本概念1、总体分布、总体分布2、样本分布样本分布3、抽样分布抽样分布1.总体中各元素的观察值所形成的分布2.分布通常是未知的3.可以假定它服从某种分布第6页,讲稿共113张,创作于星期一总体总体第7页,讲稿共113张,创作于星期一1.一个样
4、本中各观察值的分布2.也称经验分布3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布第8页,讲稿共113张,创作于星期一样本样本第9页,讲稿共113张,创作于星期一从随机变量从随机变量X中,随机抽取中,随机抽取n个样本元素:个样本元素:x1、x2 xn 则则f(f(x1、x2 xn)的统计量分布的统计量分布随机变量是随机变量是 样本统计量样本统计量样本均值样本均值,样本比例,样本方差等样本比例,样本方差等结果来自容量相同的所有可能样本结果来自容量相同的所有可能样本提供了样本统计量长远而稳定的信息,是进行推断的理提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要
5、依据论基础,也是抽样推断科学性的重要依据 第10页,讲稿共113张,创作于星期一第11页,讲稿共113张,创作于星期一样本平均数的抽样分布v1、样本均值X分布的含义v采用随机抽样的方法,从总体中抽取大小为n的一个样本,计算出它的平均值X1,然后将这些个体放回总体去,再抽取n个个体,又可以计算出平均值X2,再将n个个体放回去,再抽取n个个体,如此可以计算出无限个X,这些样本均值X所有可能值的概率分布叫均值X的抽样分布.第12页,讲稿共113张,创作于星期一设X1,X2,Xn为某总体中抽取的随机样本,X1,X2,Xn为相互独立,且与总体有相同分布的随机变量.(1)当总体为正态分布N(,2)时,X的
6、抽样分布仍为正态分布,当越来越大时,X的离散程度越来越小,即用X估计越准确。第13页,讲稿共113张,创作于星期一(2)当总体的分布不是正态分布时,只要样本容量足够大时,样本均值的分布总是近似正态分布,此时要求总体方差2有限。假定总体均值为,方差为2第14页,讲稿共113张,创作于星期一一个正态总体一个正态总体 X N(2)的情形的情形方差方差 2已知已知,的置信区间的置信区间推导推导 由选取枢轴量 第15页,讲稿共113张,创作于星期一由确定解得 的置信度为 的置信区间为第16页,讲稿共113张,创作于星期一方差方差 2未知未知,的置信区间的置信区间 由确定故 的置信区间为推导推导 选取枢轴
7、量公式(2)第17页,讲稿共113张,创作于星期一第三节总体参数的估计概括地说:经常需要对总体进行估计的两个数字特征是:总体的均值和方差。如果将总体的均值和方差视为数轴上的两个点,这种估计称为点估计。如果要求估计总体的均值或方差将落在某一段数值区间,这种估计称为区间估计。第18页,讲稿共113张,创作于星期一第三节总体参数的估计v一、点估计1.点估计点估计 点点估估计计:当总体参数不清楚时,用一个特定值(一般用样本统计量)对其进行估计,称为点估计。第19页,讲稿共113张,创作于星期一用样本平均数估计总体平均数用样本平均数估计总体平均数样本平均数是总体均值的良好估计。公式:第20页,讲稿共11
8、3张,创作于星期一用样本方差估计总体方差用样本方差估计总体方差同理,用样本标准差估计总体标准差第21页,讲稿共113张,创作于星期一1、一个好的样本统计量估计总体参数的要求一个好的样本统计量估计总体参数的要求v无偏性是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。v一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。即:当N时,X,S2n-12。第22页,讲稿共113张,创作于星期一v有效性是指当总体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。v充分性是指一个容量为n
9、的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。第23页,讲稿共113张,创作于星期一二、区间估计 区间估计:区间估计:是指用数轴上的一段距离表示未知参数可能落入的范围。第24页,讲稿共113张,创作于星期一2、一个好的样本统计量估计总体参数的要求、一个好的样本统计量估计总体参数的要求v无偏性是指如果用多个样本的统计量作为总体参数的估计值时,有的偏大,有的偏小,而偏差的平均数为0,这时,这个统计量就是无偏估计量。v一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。即:当N时,X,S2n-12。第25页,讲稿共113张,创作于星期一v有效性是指当总
10、体参数的无偏估计不止一个统计量时,无偏估计变异性小者有效性高,变异大者有效性低。v充分性是指一个容量为n的样本统计量,是否充分地反映了全部n个数据所反映总体的信息,这就是充分性。第26页,讲稿共113张,创作于星期一二、区间估计第27页,讲稿共113张,创作于星期一1、总体均数的区间估计第28页,讲稿共113张,创作于星期一有关区间估计的几个概念有关区间估计的几个概念 置信区间置信区间置信区间置信区间:区间估计是求所谓置信区间的方法。置信区间就:区间估计是求所谓置信区间的方法。置信区间就:区间估计是求所谓置信区间的方法。置信区间就:区间估计是求所谓置信区间的方法。置信区间就是我们为了增加参数被
11、估计到的信心而在点估计两边设置是我们为了增加参数被估计到的信心而在点估计两边设置是我们为了增加参数被估计到的信心而在点估计两边设置是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。的估计区间。的估计区间。的估计区间。显著性水平显著性水平 :用置信区间来估计的不可靠程度。:用置信区间来估计的不可靠程度。区间估计的任务是,在点估计值的两侧设置一个区区间估计的任务是,在点估计值的两侧设置一个区间,使得总体参数被估计到的概率大大增加。可靠性和间,使得总体参数被估计到的概率大大增加。可靠性和精确性精确性(即信度和效度即信度和效度)在区间估计中是相互矛盾的两在区间估计中是相互矛盾的两个方面。个
12、方面。第29页,讲稿共113张,创作于星期一 置信度置信度置信度置信度(水平)(水平)(水平)(水平):用置信区间估计的可靠性(把握度):用置信区间估计的可靠性(把握度):用置信区间估计的可靠性(把握度):用置信区间估计的可靠性(把握度)4 4抽样平均误差抽样平均误差抽样平均误差抽样平均误差 与与与与概率度概率度概率度概率度 Z Z 抽样平均误差抽样平均误差抽样平均误差抽样平均误差 :样本均值抽样分布的标准差。反映在:样本均值抽样分布的标准差。反映在:样本均值抽样分布的标准差。反映在:样本均值抽样分布的标准差。反映在参数周围抽样平均值的平均变异程度。参数周围抽样平均值的平均变异程度。参数周围抽
13、样平均值的平均变异程度。参数周围抽样平均值的平均变异程度。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。越大,样本均值越分散。第30页,讲稿共113张,创作于星期一 显著性水平、置信水平、概率度显著性水平、置信水平、概率度之间的关系:之间的关系:之间的关系:之间的关系:=0.10时,时,=0.90,Z/2=1.65 =0.05 =0.05时,时,=0.95,Z Z/2=1.96=1.96 =0.01时,时,时,时,=0.99=0.99,Z Z/2=2.58第31页,讲稿共113张,创作于星期一 从点估计值开始,向两侧展开一定倍数的抽样平从点估计值开始,向两侧展开一定倍数的抽
14、样平从点估计值开始,向两侧展开一定倍数的抽样平从点估计值开始,向两侧展开一定倍数的抽样平均误差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之均误差,并估计总体参数很可能就包含在这个区间之内。内。内。内。第32页,讲稿共113张,创作于星期一设 为待估参数,是一给定的数,(030)或小样本(n30)时v(2)当总体已知,总体虽不呈正态分布,大样本(n30)时,样本平均数可以转换成标准记分。两种类型两种类型第39页,讲稿共113张,创作于星期一如果一个随机变量如果一个随机变量Z服从标准正态分布服从标准正态分布(=
15、0,2=1的正态分布的正态分布),那么那么 P-1.96Z1.96=0.95 P-2.58Z30)时,样本平均数可以转换成t值。第55页,讲稿共113张,创作于星期一方差方差 2未知未知,的置信区间的置信区间 由确定故 的置信区间为推导推导 选取枢轴量公式公式(2)(2)第56页,讲稿共113张,创作于星期一求标准误求标准误计算标准误的公式为:样本n30则仍用正态分布。第57页,讲稿共113张,创作于星期一平均数标准误的估计量有三种算法:平均数标准误的估计量有三种算法:第58页,讲稿共113张,创作于星期一条件为:总体为正态分布,XN(,2),当总体方差2未知时,求总体平均值的置信区间步骤:v
16、由样本容量为n的随机变量X的值X1,X2,X3,Xn求出X,S,自由度df=n-1;v求出SEx=S/n-1;v确定显著性水平,查t值分布表,找出临界值;第59页,讲稿共113张,创作于星期一v由于Pt=0.95,将公式t=(X-)/SEx代入上式,得:P(X-)/SEx=0.95整理得:PX-SExX+SEx=0.95分别求出:X-Sn-1/n和X+Sn-1/nv求出总体平均值的置信区间:X-SEx,X+SEx第60页,讲稿共113张,创作于星期一课堂练习课堂练习例1:对某校学生的智商水平进行抽样测查,共测量了20名学生,所得智商分数如下:90,92,94,95,97,98,99,101,1
17、01,102,103,104,105,105,106,110,115,120,88,85。问该校学生平均智商分数在什么范围内?给出平均数和标准差:X=Xi/n=100.5S2n-1=(Xi-X)2/(n-1)=76第61页,讲稿共113张,创作于星期一v总体平均数95%置信区间为:总体平均数总体平均数99%置信区间为:置信区间为:第62页,讲稿共113张,创作于星期一课堂练习v某校对高中一年级学生进行英语水平测试,测试后从中抽取的9个考生的成绩为83、91、62、50、74、68、70、65、85,试对该年级考生的该次考试成绩均值作区间估计(取=0.05)第63页,讲稿共113张,创作于星期一
18、第64页,讲稿共113张,创作于星期一2 2、小样本,且为正态总体、小样本,且为正态总体、小样本,且为正态总体、小样本,且为正态总体 ,总体均值的区间估计,总体均值的区间估计,总体均值的区间估计,总体均值的区间估计(用用用用 分布分布分布分布)第65页,讲稿共113张,创作于星期一 例例例例 在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为在一个正态总体中抽取一个容量为2525的样本,其均值的样本,其均值的样本,其均值的样本,其均值为为为为5252,标准差为,标准差为,标准差为,标准差为1212,求置信水平为,求置信水平为,求置信水平为,求置信水平为9
19、595的总体均值的置信区的总体均值的置信区的总体均值的置信区的总体均值的置信区间。间。间。间。解解解解 根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用根据题意,总体方差未知,且为小样本,故用 分布统计量。由分布统计量。由分布统计量。由分布统计量。由9595置信水平查置信水平查置信水平查置信水平查 分布表得概率度分布表得概率度分布表得概率度分布表得概率度 (24)(24)2.0642.064 代入公式得代入公式得代入公式得代入公式得 522.064 522.064 525.06525.06 因此,置信水平因此,置信水平因此
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 理论 总体 参数 估计 精选 PPT
限制150内