第8章抽样推断.pptx
《第8章抽样推断.pptx》由会员分享,可在线阅读,更多相关《第8章抽样推断.pptx(145页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、一、抽样推断 1、抽样推断的定义 抽样推断是指依随机的原则,从总体中抽取一部分单位组成样本,并据样本资料计算样本特征值,再据样本特征值对总体特征值做出具有一定可靠程度的估计,以达到认识总体数量特征的目的。注意如下几点:部分与全部。随机原则。部分特征与全部特征的关系。对总体的认识。第1页/共145页2、抽样推断的作用特点抽样推断是现代统计学的中心内容,抽样调查也是现代社会调查的主要的调查方法之一。抽样推断的作用不仅是解决了无法进行全面调查问题,还可以节省调查成本。抽样推断最明显的特点是对抽样产生的误差可以事先计算并可加以控制。第2页/共145页3、抽样推断的主要内容 抽样推断的目的并不在于了解样
2、本的数量特征,而是要借助样本的数量特征,来估计和检验总体分布的数量特征及某些未知因素。其主要内容:1)随机抽样 随机抽样是指按随机的原则从总体中抽取部分单位,构成样本的过程。2)统计估计 统计估计是根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。3)假设检验 假设检验是指根据经验或不成熟的认识,在的总体的有关分布函数、分布参数或数字特征等信息作出某种假设的前提下,为了确定该假设的正确性,而自总体中随机抽取部分单位,利用部分与总体间的关系来对所提出的假设作出判断,以决定是否接受该假设的过程。第3页/共145页二、有关抽样的基本概念(一)样本容量与样本个数
3、1.样本容量。样本是从总体中抽出的部分单位的集合,这个集合的大小称为样本容量,一般用n表示,它表明一个样本中所包含的单位数。一般地,样本单位数大于30个的样本称为大样本,不超过30个的样本称为小样本。2.样本个数。样本个数又称样本可能数目,它是指从一个总体中可能抽取多少个样本。第4页/共145页(二)总体参数与样本统计量 1.总体参数。总体分布的数量特征就是总体的参数,也是抽样统计推断的对象。常见的总体参数有:总体的平均数,总体成数(比例),总体分布的方差、标准差。它们都是反映总体分布特征的重要指标。第5页/共145页 2.样本统计量。样本统计量是样本的一个函数。它们是随机变量。我们利用统计量
4、来估计和推断总体的有关参数。常见的样本统计量有:样本平均数,样本比例,样本的方差、标准差。第6页/共145页平均数标准差、方差成数单位数参数 、2PN统计量S、S2Pn 总体 样本第7页/共145页三、重复抽样与不重复抽样第8页/共145页第9页/共145页四、抽样分布抽样分布的概念:由样本统计量的全部可能取值和与之相应的概率(频率)组成的分配数列。(主要求出样本平均数的期望与方差)包括以下内容重复抽样分布样本平均数的分布样本成数的分布不重复抽样分布样本平均数的分布样本成数的分布第10页/共145页重复抽样分布-样本平均数的分布某班组5个工人的日工资为34、38、42、46、50元。=422=
5、32现用放回抽样的方法从5人中随机抽2个构成样本。共有52=25个样本。如右图。第11页/共145页验证了以下两个结论:抽样平均数的标准差反映所有的样本平均数与总体平均数的平均误差,称为抽样平均误差,用 表示。第12页/共145页由概率论知,如果总体是正态分布的,则样本平均数的抽样分布是如下正态分布这是一个非常重要的结论,有广泛的应用。(请参见中心极限定理。)第13页/共145页总体成数p是指具有某种特征的单位在总体中的比重。现从总体中抽出n个单位,如果其中有相应特征的单位数是n1,则样本成数是:P也是一个随机变量,利用样本平均数的分布性质结论,即有:第14页/共145页不重复抽样分布样本均值
6、的分布性质:样本成数的分布性质第15页/共145页抽样分布总结样本平均数的分布样本平均数的分布样本成数的分布样本成数的分布重复重复抽样抽样不重复不重复抽样抽样第16页/共145页第二节 参数估计 一、参数估计概述二、总体均值的估计三、总体比例的估计四、总体方差的估计第17页/共145页一、参数估计概述(一)参数估计的定义与种类 所谓参数估计,就是用样本统计量去估计总体的未知参数(或参数的函数)。例如,估计总体均值,估计总体比例和总体方差等等。参数估计有两种基本形式:点估计和区间估计。前者是用一个数值作为未知参数的估计值,后者则是给出具体的上限和下限,把 包括在这个区间内。第18页/共145页(
7、二)点估计 点估计,主要有矩估计法和最大似然估计法。矩估计法是用样本矩去估计总体矩(或是用样本矩的函数去估计总体矩的相应函数)的一种估计方法,由此获得的估计量称作矩估计量;最大似然估计法是把待估计的总体参数看作一个可以取不同数值的变量,计算当总体参数取上述不同数值的时候,发生我们当前所得到的样本观测值的不同概率,总体参数取哪一个数值的时候这种概率最大,便把这个数值作为对总体参数的估计结果。第19页/共145页第20页/共145页(三)估计量的优良标准2.2.有效性。又称最小方差性。第21页/共145页第22页/共145页(四)区间估计与估计的精度和可靠性第23页/共145页第24页/共145页
8、第25页/共145页二、总体均值的估计第26页/共145页第27页/共145页第28页/共145页第29页/共145页第30页/共145页第31页/共145页【例】某企业加工的产品直径X X是一随机变量,且服从方差为0.00250.0025的正态分布。从某日生产的大量产品中随机抽取6 6个,测得平均直径为1616厘米,试在0.950.95的置信度下,求该产品直径的均值置信区间。第32页/共145页解:本例产品数量很多,即总体单位数N很大,故采用放回抽样的有关公式计算。样本平均数 n=16样本平均的标准差 =0.0204抽样极限误差 =1.960.0204=0.04所求的置信区间为:16-0.0
9、416+0.04 即(15.96,16.04)。如何得到?第33页/共145页例:某零件的长度服从正态分布,从该批零件中随机抽取9件,测得平均长度为21.5mm,已知总体方差为0.0225.试求该种零件平均长度的95%的置信区间。第34页/共145页解:已知则代入公式得:即:0.95 21.50.0250.025第35页/共145页我们用95%的置信水平得到某班学生考试成绩的置信区间为60-80分,如何理解?错误的理解:60-80区间以95%的概率包含全班同学平均成绩的真值;或以95%的概率保证全班同学平均成绩的真值落在60-80分之间。正确的理解:如果做了多次抽样(如100次),大概有95次
10、找到的区间包含真值,有5次找到的区间不包括真值。如果大家还是不能理解,那你们最好这样回答有关区间估计的结果:该班同学平均成绩的置信区间是60-80分,置信度为95%。第36页/共145页(二)总体方差2未知的情形第37页/共145页2.区间估计第38页/共145页第39页/共145页第40页/共145页【例】在上例中,若总体方差未知,但通过抽取的6个样本测得的样本方差为0.0025,试在0.95的置信度下,求该产品直径的均值置信区间。第41页/共145页第42页/共145页例:在总体 服从正态分布的情况下,从某大学本科生中随机抽取100人,调查他们平均每天参加体育锻炼的时间为30分钟,样本方差
11、为36,试以95%的置信水平估计该校本科生平均每天参加体育锻炼的时间?第43页/共145页解;由题意可知,用T分布求解。=95%,则其区间为:=第44页/共145页例:某种果树产量服从正态分布,随机抽取6 棵测得其产量分别为:111,91,102,104,116,110。以95%的置信水平估计全部果树的平均产量。第45页/共145页解:代入公式计算得:第46页/共145页n n=n n=(96.45,114.89)第47页/共145页三、总体比例的估计第48页/共145页第49页/共145页第50页/共145页解:本例总体单位数N很大,故采用放回抽样的有关公式计算。n=300,p=0.02,n
12、 P=65,可以认为户数n充分大,=0.05,z=1.96。因此,所求电视机拥有率的置信区间为0.02-0.016P,不拒绝 H0若p-值 /2,不拒绝 H0若p-值 /2,拒绝 H0第92页/共145页【例】上例的结果,计算其P-值,并做出判断。解:查标准正态概率表,当z=2.29时,(0.9774+0.9786)/2=0.9780,尾部面积为(10.9780)/2=0.011,由对称性可知,当z=2.29时,左侧面积为0.011。0.011/2=0.025 0.011这个数字意味着,假若我们反复抽取n=100的样本,在100个样本中仅有可能出现一个使检验统计量等于或小于2.29的样本。该事
13、件发生的概率小于给定的显著性水平,所以,可以判断=150的假定是错误的,也就是说,根据观测的样本,有理由表明总体均值与150克的差异是显著存在的。第93页/共145页(2)临界值规则 假设检验中,根据所提出的显著性水平标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,称作临界值,直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。第94页/共145页注意:(1)P-值规则和临界值规则是等价的。在做检验的时候,只用其中一个规则即可。(2)P-
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 推断
限制150内