第四章 估计与假设检验.ppt
《第四章 估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《第四章 估计与假设检验.ppt(85页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章估计与假设检验估计与假设检验当代国际最著名的统计学家之一当代国际最著名的统计学家之一C.R劳:劳:在终极的分析中,一切知识都是历史;在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在抽象的意义下,一切科学都是数学;在理性的世界里,所有的判断都是统计学。在理性的世界里,所有的判断都是统计学。2第一节第一节统计推断统计推断一、统计推断一、统计推断p统计推断统计推断包括参数估计和假设检验,即通过样本统计量来包括参数估计和假设检验,即通过样本统计量来估计和检验总体的参数。估计和检验总体的参数。p统计推断的目的在于认识未知的总体参数及其分布特征。统计推断的目的在于认识未知
2、的总体参数及其分布特征。3总体总体选择个体选择个体样本样本观测样本观测样本样本观察值样本观察值(数据数据)数据处理数据处理样本有关结论样本有关结论推断总体性质推断总体性质统计量统计量统计推断的一般步骤统计推断的一般步骤p抽样分布抽样分布是统计推断的理论基础是统计推断的理论基础4二、抽样分布二、抽样分布区别以下分布:区别以下分布:n总体分布(总体分布(populationdistribution):总体内):总体内个体个体数值的次数分布。数值的次数分布。n样本分布(样本分布(sampledistribution):样本内):样本内个体个体数数值的次数分布。值的次数分布。n抽样分布(抽样分布(sa
3、mplingdistribution):根据所有可能):根据所有可能的样本观察值计算出来的某一种的样本观察值计算出来的某一种统计量统计量的观察值的观察值的概率分布。的概率分布。5从总体分布到抽样分布从总体分布到抽样分布n总体总体X的概率分布的概率分布n这是一个均匀分布(这是一个均匀分布(uniformdistribution)总体)总体住户住户第一户第一户第二户第二户第三户第三户第四户第四户第五户第五户日支出日支出(X)(X)20202525303035354040户数户数1 11 11 11 11 1概率概率0.200.200.200.200.200.200.200.200.200.206总
4、体总体X的概率分布图的概率分布图7总体平均数和总体方差总体平均数和总体方差 8样本(样本(n=2)的所有可能结果)的所有可能结果第一户第一户第二户第二户第三户第三户第四户第四户第五户第五户第一户第一户(20,20)(20,20)M M=20=20(25,20)(25,20)M M=22.5=22.5(30,20)(30,20)M M=25=25(35,20)(35,20)M M=27.5=27.5(40,20)(40,20)M M=30=30第二户第二户(20,25)(20,25)M M=22.5=22.5(25,25)(25,25)M M=25=25(30,25)(30,25)M M=27.
5、5=27.5(35,25)(35,25)M M=30=30(40,25)(40,25)M M=32.5=32.5第三户第三户(20,30)(20,30)M M=25=25(25,30)(25,30)M M=27.5=27.5(30,30)(30,30)M M=30=30(35,30)(35,30)M M=32.5=32.5(40,30)(40,30)M M=35=35第四户第四户(20,35)(20,35)M M=27.5=27.5(25,35)(25,35)M M=30=30(30,35)(30,35)M M=32.5=32.5(35,35)(35,35)M M=35=35(40,35)(4
6、0,35)M M=37.5=37.5第五户第五户(20,40)(20,40)M M=30=30(25,40)(25,40)M M=32.5=32.5(30,40)(30,40)M M=35=35(35,40)(35,40)M M=37.5=37.5(40,40)(40,40)M M=40=409样本(样本(n=2)的平均数的抽样分布)的平均数的抽样分布平均数平均数202022.522.5252527.527.5303032.532.5353537.537.54040次数次数1 12 23 34 45 54 43 32 21 1概率概率.04.04.08.08.12.12.16.16.20.20
7、.16.16.12.12.08.08.04.0410样本样本(n=2)的平均数的抽样分布图的平均数的抽样分布图11抽样分布:抽样分布:从一个给定的总体中抽取(不论是否从一个给定的总体中抽取(不论是否有放回)容量(或大小)为有放回)容量(或大小)为n的所有可能的样的所有可能的样本,对于每一个样本,计算出某个统计量(如本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。量的分布,称之为抽样分布。n例如:如果特指的统计量是样本均
8、值,则此分例如:如果特指的统计量是样本均值,则此分布为均值的抽样分布。类似的有标准差、方差、布为均值的抽样分布。类似的有标准差、方差、中位数、比例的抽样分布。中位数、比例的抽样分布。12抽样误差抽样误差:某个样本的统计量和总体参数之某个样本的统计量和总体参数之间的差异间的差异n抽样误差的性质:通常用抽样分布的标准抽样误差的性质:通常用抽样分布的标准差表示,标准差越小,抽样分布越集中,差表示,标准差越小,抽样分布越集中,样本代表总体的可靠性就越大样本代表总体的可靠性就越大不同总体情况下平均数的抽样分布不同总体情况下平均数的抽样分布示意图示意图14三、抽样分布原理三、抽样分布原理基本符号:基本符号
9、:总体总体A=a1,a2,aN,|A|=N从总体中抽取从总体中抽取n个对象构成样本,共有个对象构成样本,共有k个样本,设样个样本,设样本的符号为本的符号为A1,A2,Ak,(有放回)(有放回),|Ai|=n,i=1,2,k每一个样本每一个样本Ai的分布平均数是的分布平均数是,标准差是,标准差是si这些平均数这些平均数构成总体构成总体A的一个平均数抽样分布。的一个平均数抽样分布。用用表示它的平均数,表示它的平均数,是标准差是标准差抽样平均数的平抽样平均数的平均误差。均误差。15(一)被抽样的总体服从正态分布,样本的抽样分(一)被抽样的总体服从正态分布,样本的抽样分布具有下列性质:布具有下列性质:
10、1、从正态分布的总体中抽样,其分布依然是正态、从正态分布的总体中抽样,其分布依然是正态分布;分布;2、从正态分布的总体中抽样,样本平均数的平均、从正态分布的总体中抽样,样本平均数的平均数数等于总体平均数等于总体平均数;3、从正态分布的总体中抽样,抽样分布的标准差、从正态分布的总体中抽样,抽样分布的标准差小于总体的标准差小于总体的标准差;样本容量越大,平均误差;样本容量越大,平均误差越小。越小。抽样分布的原理抽样分布的原理16样本平均数(均值)的标准差的计算公式样本平均数(均值)的标准差的计算公式当总体为有限总体无放回抽样时,其样本均值标准当总体为有限总体无放回抽样时,其样本均值标准差为:差为:
11、如果总体为无限总体的或抽取是有放回的,其样本如果总体为无限总体的或抽取是有放回的,其样本均值标准差为:均值标准差为:为有限总体修正系数为有限总体修正系数可省略修正系数可省略修正系数17(二)被抽样的总体不服从正态分布,非正态(二)被抽样的总体不服从正态分布,非正态总体样本平均数的分布又如何总体样本平均数的分布又如何1 1、中心极限定理可以解决上述问题:、中心极限定理可以解决上述问题:一个具有任意函数形式的总体,其样本一个具有任意函数形式的总体,其样本平均值平均值和方差和方差 有限。在对该总体进行抽有限。在对该总体进行抽样时,随着样本容量样时,随着样本容量n n的增大,由这些平均的增大,由这些平
12、均样本算出的平均数的抽样分布将近似服从平样本算出的平均数的抽样分布将近似服从平均数为均数为和方差为和方差为 的正态分布。的正态分布。182 2、样本容量究竟该多大才能使抽样分布逼近、样本容量究竟该多大才能使抽样分布逼近于正态分布?于正态分布?中心极限定理说明了不仅从正态总体抽中心极限定理说明了不仅从正态总体抽取样本时,样本平均数这一统计量要服从取样本时,样本平均数这一统计量要服从正态分布,即使是从非正态总体进行抽样,正态分布,即使是从非正态总体进行抽样,只要是大样本(容量只要是大样本(容量n n3030),),样本平均数样本平均数也趋向于正态分布。也趋向于正态分布。19第二节第二节点估计点估计
13、一、点估计一、点估计估计某一个总体参数的具体值估计某一个总体参数的具体值X1,Xn未知参数未知参数样本样本统计量统计量对一次具体的抽样对一次具体的抽样=d(X1,Xn)20二、点估计量优劣的判别标准二、点估计量优劣的判别标准衡量一个估计量好坏的标准通常有以下衡量一个估计量好坏的标准通常有以下3个:个:(1)无偏性无偏性(2)一致性一致性(3)有效性有效性(4)充分性充分性214.几种总体参数的点估计量几种总体参数的点估计量22第三节第三节区间估计区间估计n某种意义上说:点估计称某种意义上说:点估计称:“池中有池中有XXX条条鱼鱼”,几乎没法评价,又几乎非错不可,几乎没法评价,又几乎非错不可,换
14、一个人再估计也未必能准确。换一个人再估计也未必能准确。n换一种提法换一种提法n区间估计区间估计:指出未知参数在一定概率:指出未知参数在一定概率(可靠可靠程度程度)下,可能在的范围。下,可能在的范围。23一、置信区间与置信度一、置信区间与置信度一、置信区间与置信度一、置信区间与置信度则称则称1 为置信度为置信度(或置信水平或置信水平);上级的问题上级的问题工作人员的回工作人员的回答答置信度置信度置信区间置信区间调查能在半年内完成吗?调查能在半年内完成吗?没有问题,肯没有问题,肯定能做好定能做好98%以上以上6个月个月调查能在调查能在5个月内完成吗?个月内完成吗?抓抓紧,可以抓抓紧,可以完成完成9
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 估计与假设检验 第四 估计 假设检验
限制150内