(本科)第四章 抽样估计教学ppt课件.PPT
《(本科)第四章 抽样估计教学ppt课件.PPT》由会员分享,可在线阅读,更多相关《(本科)第四章 抽样估计教学ppt课件.PPT(133页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、(本科)第四章 抽样估计教学ppt课件抽样估计的现实应用抽样估计的现实应用例例1 一汽车轮胎制造商生产一种被认为一汽车轮胎制造商生产一种被认为寿命更寿命更长的新型轮胎长的新型轮胎。120个个样本样本测试平均里程:36,500公里推断新轮胎新轮胎平均寿命平均寿命:36,500公里400个样本 支持人数:160推断支持该候选人的选民支持该候选人的选民占全部选民的比例:占全部选民的比例:160/400=40%例例2:某党派想支持某一候选人参选美国某州议员,为了决定是否支持该候选人,该党派领导需要估计支持该候选人的民众支持该候选人的民众占全部登记投票人总数的比例占全部登记投票人总数的比例。由于时间及财
2、力的限制: 本章要求:本章要求:教学目的:教学目的:本章阐述参数估计的理论与方法,通过学习使学生能运用不同的抽样方式对总体参数进行估计及进行假设检验。教学重点及难点:教学重点及难点:教学重点:教学重点:抽样误差的计算;简单随机抽样下总体参数的区间估计及简单随机抽样下样本单位数的计算;假设检验。教学难点:教学难点:抽样平均误差的计算,参数的区间估计。主要教学内容及要求:主要教学内容及要求:1、理解抽样法的意义、特点;2、掌握抽样误差、抽样平均差和抽样极限误差等概念的涵义;掌握影响抽样误差大小的因素;掌握确定必要样本单位数目的方法;3、熟练掌握抽样推断中的基本原理和方法,能够利用样本资料推断总体指
3、标。4、能运用excel计算有关样本统计量,进行总体参数的区间估计。统计推断统计推断参数(未知量)参数(未知量)统统计量(已知量)计量(已知量)抽样调查的基本概念抽样调查的基本概念 全及总体和抽样总体全及总体和抽样总体 全及指标和抽样指标全及指标和抽样指标 抽样方法和样本的可能数目抽样方法和样本的可能数目研究对象的全体,即第一章中研究对象的全体,即第一章中学过的总体。学过的总体。 按随机原则从全及总体中抽取一按随机原则从全及总体中抽取一部分单位组成的集合体,又叫抽样部分单位组成的集合体,又叫抽样总体。总体。 样本总体中所包括的单位数叫样本容样本总体中所包括的单位数叫样本容量,一般用量,一般用n
4、 n表示表示1 1、大样本(、大样本(n30 2n30 2、小样本、小样本(n30(n30)全及总体中所包括的单位数一般用全及总体中所包括的单位数一般用N表示。表示。 1、有限总体有限总体 2、无限总体、无限总体NNXXX,210N1NmiimiiiNiiffXXNXX111或miiimiiNiifXXfXXN1211211或miiimiiNiifXXfXXN121212211或P1NNQ,NNP01 PQP1PP PQP1P2P 有有最最大大值值时时,当当P5 . 0QP nnxxx,210n1n m1iim1iiin1iiffxxnxx或或 m1ii2im1iin1i2ifxx1f1sxx
5、1n1s或或 m1ii2im1ii2n1i2i2fxx1f1sxx1n1s或或为自由度为自由度为 的无偏估计2为 的无偏估计pnnqnnp1,01pqnnppnnsp111pqnnppnnsp1112为 的无偏估计2P为 的无偏估计P pqp1pnnsp pqp1pnns2p m1ii2im1iiN1i2ifXXf1XXn1s或或 m1ii2im1ii2N1i2i2fXXf1XXn1s或或继续继续抽取抽取抽出抽出个体个体登记登记特征特征放回放回总体总体抽出抽出个体个体登记登记特征特征继续继续抽取抽取nNnNB=) 1() 1( nNNNANn!) 1() 1(!nnNNNnACNnNn !)2
6、1(1nNnNnNCDnNnNn )(对样本的对样本的要求不同要求不同考虑顺序的抽样考虑顺序的抽样 ABBA不考虑顺序的抽样不考虑顺序的抽样 AB=BA两种分两种分类交叉类交叉考虑顺序的重复抽样考虑顺序的重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样例:从例:从A、B、C、D四个工人中随机抽取四个工人中随机抽取二人组成一样本,可能的样本是:二人组成一样本,可能的样本是:考虑顺序的重复抽样考虑顺序的重复抽样 考虑顺序的不重复抽样考虑顺序的不重复抽样AA AB AC AD AA AB AC AD BA BB BC
7、 BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD 不考虑顺序的重复抽样不考虑顺序的重复抽样 不考虑顺序的不重复抽样不考虑顺序的不重复抽样AA AB AC AD AA AB AC AD BA BB BC BD BA BB BC BD CA CB CC CD CA CB CC CDDA DB DC DD DA DB DC DD XnxXx1 Xx2 Pp 1Pp 2根据所有可能样本的样平均数或根据所有可能样本的样平均数或样本成数计算的标准差,即每一样本成数计算的标准差,即每一次抽样的样本指标和总体指标之次抽样的样本指标和总
8、体指标之间的平均差异程度。间的平均差异程度。211MxiixXMxiXixM1)(2nxxS注意:不要混淆抽样注意:不要混淆抽样平均误差与样本标准差!平均误差与样本标准差!例:有例:有4个工人,月产量分别为个工人,月产量分别为40,50,70,80,这一总体平均数和标准差为:,这一总体平均数和标准差为:81.15410004)6080()6070()6050()6040(N)XX(22222 60480705040NXX 总体平均总体平均数数标标准准差差现用重复抽样的方法从现用重复抽样的方法从4 4人中抽取人中抽取2 2人构成样本,求样本的平均数,用以代表人构成样本,求样本的平均数,用以代表4
9、 4人总体的平均水平,所有可能的样本及样本的平均工资列表如下:人总体的平均水平,所有可能的样本及样本的平均工资列表如下:序号序号样本变量样本变量样本平均数样本平均数平均数离差平均数离差离差平方离差平方(1)(2)1404040-204002405045-152253407055-5254408060005504045-152256505050-1010075070600085080655259704055-52510705060001170707010100127080751522513804060001480506552515807075152251680808020400合计合计-960-
10、2000 E 2E 样本平均数的平均数:样本平均数的平均数: 抽样平均误差抽样平均误差6016960可能的样)E( 本数目本数目2( )200011.1816xEK15.8111.182xn2xnn2211xNnnnNnN当N500时,有NnNnNNnN111pPPn1111pPPPPNnnnNnN当N500时,有NnNnNNnN11spsP1122ffxxnxx或ppnn11n练习练习 1、对某乡进行简单重复抽样调查,抽出、对某乡进行简单重复抽样调查,抽出100个农户,个农户,户均年收入户均年收入2000元,年收入标准差元,年收入标准差100元,求抽样平元,求抽样平均误差。若抽取的是均误差。
11、若抽取的是200户,则抽样平均误差以是多户,则抽样平均误差以是多少。若要使抽样平均误差降低为原来的一半,则应少。若要使抽样平均误差降低为原来的一半,则应抽多少户。抽多少户。 2、对某县人口用不重复抽样方法按、对某县人口用不重复抽样方法按1/10比例抽出比例抽出1万人进行调查,得知样本平均年龄万人进行调查,得知样本平均年龄40岁,年龄标准岁,年龄标准差差20岁,求抽样平均误差。岁,求抽样平均误差。 3、某县人口、某县人口10万人,用简单随机不重复抽样方法抽万人,用简单随机不重复抽样方法抽取取1/10的人口进行调查,得知男性人口比重为的人口进行调查,得知男性人口比重为51%,求男性人口比重的抽样平
12、均误差。求男性人口比重的抽样平均误差。 4、对某乡进行简单随机重复抽样调查,抽出、对某乡进行简单随机重复抽样调查,抽出100个个农户进行调查,得知年收入在农户进行调查,得知年收入在1800元以上的占元以上的占95%,求农户年收入在求农户年收入在1800元以上比重的抽样平均误差。元以上比重的抽样平均误差。 注意:注意: 1、统计学上往往用、统计学上往往用抽样极限误差抽样极限误差来测度抽样误差来测度抽样误差的大小或者说测度点估计的精度。的大小或者说测度点估计的精度。 原因:原因:总体参数值往往并不知道,因此,总体参数值往往并不知道,因此,实际抽实际抽样误差样误差与与抽样平均误差抽样平均误差也往往无
13、法求出,但在抽样分也往往无法求出,但在抽样分布大体知道的情况下,布大体知道的情况下,抽样极限误差抽样极限误差是可以估计出来是可以估计出来的。的。 2、抽样极限误差的估计总是要和一定的概率保、抽样极限误差的估计总是要和一定的概率保证程度联系在一起的。证程度联系在一起的。 原因:原因:样本统计量往往是一随机变量,它与总体样本统计量往往是一随机变量,它与总体参数真值之差也是一个随机变量,因此就不能期望参数真值之差也是一个随机变量,因此就不能期望某次抽样的样本估计值落在一定区间内是一个必然某次抽样的样本估计值落在一定区间内是一个必然事件,而只能给予一定的概率保证。事件,而只能给予一定的概率保证。 因此
14、,因此,在进行抽样估计时,既需要考虑抽样误在进行抽样估计时,既需要考虑抽样误差的差的可能范围可能范围,同时还需考虑落到这一范围的,同时还需考虑落到这一范围的概率概率大小大小。 前者是前者是估计的准确度估计的准确度问题,后者是问题,后者是估计的可靠估计的可靠性性问题,两者紧密联系不可分开。这也正是区间估问题,两者紧密联系不可分开。这也正是区间估计所关心的主要问题。计所关心的主要问题。 实际计算中一般不直接计算概率保证程度,实际计算中一般不直接计算概率保证程度,由于由于 ,xxxxXz (|)(|)xpXxPXzz xxzppz所以抽样极限误差是概率度所以抽样极限误差是概率度z(临界值)的函数(临
15、界值)的函数 据中心极限定理,当总体为正态或总体非据中心极限定理,当总体为正态或总体非正态但正态但n30时,样本均值的分布趋近于正态分时,样本均值的分布趋近于正态分布;布;当当n足够大时,样本成数的分布近似为正态足够大时,样本成数的分布近似为正态分布。分布。 21()21( )2xx xxf xexxxxXz212()12zzfe 21212zzzzedzn1)()(XxXxE)n,X(Nx )nP1P,P(Np )()(PpPpEn1X510样本抽样分布样本抽样分布原总体分布原总体分布xX2212zZZzed zZZ2211在实际中,一般将这种对应函数关系在实际中,一般将这种对应函数关系编成
16、编成正态概率表正态概率表供直接查用供直接查用68.27%95.45%99.73%),(2nXNxXx2x3x2xx3xx估计的准确度估计的准确度和估计的可靠性估计的可靠性问题 大数定理与中心极限定理大数定理与中心极限定理 大数定理 中心极限定理若,则称为的无偏若,则称为的无偏估计量估计量)(E第三节第三节 总体参数估计总体参数估计若,则称为比更有效的估计量若,则称为比更有效的估计量2121n 若对于任意若对于任意0,有,有1 limPnq 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量;为的无偏、有效、一致估计量;q 为的无偏、有效、一致估计量。为的无偏
17、、有效、一致估计量。xX1nSpPpPsxX,0.6827xxXX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线0.95452xxXX样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线 0.9973落在落在范围内的概率范围内的概率为为99.73%X3xxXxxxxxxXxXx,或,其中,其中, 为极限误差为极限误差xxzx22sxsnn或2211xnsnnNnN或xxzxxxxxxXxXx,或,ppppppPpPp,或,其中,其中, 为极限误差为极限误差ppznnp12p1pppn11pppnnNppzppppppPpPp,或,1、按照质量要求,灯、按照质量要求,灯泡使
18、用寿命在泡使用寿命在1000小时小时以上为合格品试,以以上为合格品试,以95.45%的概率保证度估的概率保证度估计该批灯泡的耐用时数计该批灯泡的耐用时数和合格率;和合格率;2、试以、试以99%的概率保的概率保证程度估计计该批灯泡证程度估计计该批灯泡的而用时数和合格率。的而用时数和合格率。使用时间(小使用时间(小时)时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-1100841100-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验
19、,随机不重复抽取机不重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)时)组中值组中值 灯泡数灯泡数(个)(个)900以下以下8758752 2175017506624866248900-9509259254 4370037006969669696950-10009759751111107251072573964739641000-1050102510257171727757277572704727041050-1100107510758484903009030027216272161100-11501125112518182025020250
20、83232832321150-1200117511757 78225822597468974681200以上以上122512253 3367536758467284672合计合计200200211400211400575200575200 xfxf fxx2 2253.63(1)(1 2%)3.7541200 xnnN 63.5312005752001ffxxs1057200211400fxfx2 95.45%2z,z2 3.75417.51xxz 51.106451.71057xx上限 因此,该批灯泡的使用寿命在因此,该批灯泡的使用寿命在之间,其概率保证度为之间,其概率保证度为95.45%4
21、9.104951. 71057xx下限 使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-12007 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在87.6%-95.4%之间,其之间,其概率保证度为概率保证度为95.45%5 .91200183nnp1 1200%)5 . 8%5 .91(2001n)p1(np (1)91.5% 8.5%(1)(12%)1.952%1200 1pPPnnN%
22、4 .95%9 . 3%5 .91pp上限 %6 .87%9 . 3%5 .91pp下限 95.45%2zz,21.952%3.90%ppz1、若允许的误差范围若允许的误差范围为为10小时小时,试估计该批,试估计该批灯泡的耐用时数;灯泡的耐用时数;2、按照质量要求,灯、按照质量要求,灯泡使用寿命在泡使用寿命在1000小时小时以上为合格品,以上为合格品,要求合要求合格率误差不超过格率误差不超过3%,试估计该批灯泡的合格试估计该批灯泡的合格率。率。使用时间(小使用时间(小时)时)灯泡数(个)灯泡数(个)900以下以下2900-9504950-1000111000-1050711050-110084
23、1100-1150181150-120071200以上以上3合计合计200例:某灯泡厂对例:某灯泡厂对10000个产品进行使用寿命检验,随个产品进行使用寿命检验,随机重复抽取机重复抽取2%的样本进行测试。所得资料如下:的样本进行测试。所得资料如下:使用时间(小使用时间(小时)时)组中值组中值 灯泡数灯泡数(个)(个)900以下以下8758752 2175017506624866248900-9509259254 4370037006969669696950-10009759751111107251072573964739641000-105010251025717172775727757270
24、4727041050-1100107510758484903009030027216272161100-1150112511251818202502025083232832321150-1200117511757 78225822597468974681200以上以上122512253 3367536758467284672合计合计200200211400211400575200575200 xfxf fxx2 2253.63(1)(12%)3.7541200 xnnN 63.5312005752001ffxxs1057200211400fxfx2 1067101057xx上限 1057101
25、057xx下限 102.643.7922xxxxXz 0.9917z 因此,该批灯泡的使用寿命在因此,该批灯泡的使用寿命在1047-1067之之间,其概率保证度为间,其概率保证度为99.17%使用时间(小时)使用时间(小时)灯泡数(个)灯泡数(个)f900以下以下2 2900-9504 4950-100011111000-105071711050-110084841100-115018181150-12007 71200以上以上3 3合计合计200200因此,该批灯泡的合格率在因此,该批灯泡的合格率在88.5%-94.5%之间,其之间,其概率保证度为概率保证度为87.15%5 .9120018
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 本科第四章 抽样估计教学ppt课件 本科 第四 抽样 估计 教学 ppt 课件
限制150内