统计学第五章-参数估计ppt课件.ppt
《统计学第五章-参数估计ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学第五章-参数估计ppt课件.ppt(128页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述统计与推断统计的关系描述统计与推断统计的关系推断统计推断统计利用样本信息和概率利用样本信息和概率论对总体的数量特征论对总体的数量特征进行估计和检验等进行估计和检验等概率论概率论包括分布理论、大数定律和包括分布理论、大数定律和中心极限定理等中心极限定理等描述统计描述统计统计数据的搜集、整统计数据的搜集、整理、显示和分析等理、显示和分析等“What! You have solved it already?”“Well, that would be too much to say. I have discovered a suggestive fact, that is all” Dr. Wat
2、son and Sherlock Holmes The Sign of Four 例例:某大公司要整理2500个职工的档案。其中一项内容是考察这些职工的平均年薪平均年薪及参加过公司培训计划的比参加过公司培训计划的比例例。 总体:总体:2500名职工(population ), 如果上述如果上述情况可由每个人的个人档案中得知,可容易地测出这2500名职工的平均年薪及标准差。已经得到了如下的结果: 总体均值:总体均值: =51800(元) 总体标准差:总体标准差: =4000(元)参数估计的一般问题(例子)参数估计的一般问题(例子)同时,有同时,有1500人参加了公司培训,则人参加了公司培训,则参
3、加公司培训计划的比例为:参加公司培训计划的比例为: =1500/2500=0.60总体参数总体参数 在上例在上例中,假如随机抽取了一个容量为30的样本样本: 平均年薪平均年薪 是否参加培训是否参加培训 49094.3 是 53263.9 是 49643.5 否 00.5181430/1554420/nxxi72.334729/325009260) 1/()(2nxxsi63. 030/19p 根据该样本求得样本年薪平均数样本年薪平均数、标准差标准差及参加过参加过培训计划人数的比例培训计划人数的比例分别为: 则解决最初的问题,我们就涉及到总体参数的估计问题。(元)(元)统计推断统计推断参数(未知
4、量)参数(未知量)统计量(已知量)统计量(已知量)抽出抽出个体个体登记登记特征特征放回放回总体总体继续继续抽取抽取抽出抽出个体个体登记登记特征特征继续继续抽取抽取总体总体N样本样本n等额抽取等额抽取等比例抽取等比例抽取(总体单位按某一标志排序)(总体单位按某一标志排序)hlpdnnnnnABCDEFGHIJKLMNOPLHPD样本容量样本容量指样本中含有的总体单位的指样本中含有的总体单位的数目,数目,通常用通常用n 来表示。来表示。nnNNNNNB11nNNNAnN样本统样本统计量计量总体未总体未知参数知参数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统
5、样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量 样本平均数样本平均数总体平均数总体平均数nxxi1样本平均数是一个随机变量,样本平均数是一个随机变量,它的概率分布称为样本平均数的抽样分布。它的概率分布称为样本平均数的抽样分布。样本平均数的抽样分布样本平均数的抽样分布是推断总体平均数是推断总体平均数 的理论基础的理论基础 样本平均数样本平均数nxxij样本平样本平均数均数总体未总体未知参数:知参数:平均数平均数样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量
6、样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本统样本统计量计量样本平样本平均数均数主要样本主要样本统计量统计量xsp样本均值的抽样分布样本均值的抽样分布( (例题分析例题分析) )样本均值的抽样分布样本均值的抽样分布 ( (例题分析例题分析) )样本均值的抽样分布样本均值的抽样分布 ( (例题分析例题分析) )样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较 ( (例题分析例题分析) )样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 = 50 =10总体分布抽样分布中心极限定理中心极限定
7、理(central limit theorem)从均值为从均值为 ,方差为,方差为 2 2的一个任意总体中抽取容量为的一个任意总体中抽取容量为n n的样本,当的样本,当n n充分大时,样本平均数的抽样分布近似服充分大时,样本平均数的抽样分布近似服从均值为从均值为、方差为、方差为2 2/ /n n的正态分布的正态分布n1)()(xxE),(2nNx5)1(,5)1,(pnnpnPPPNp)()(PpPpEn1510样本抽样分布样本抽样分布原总体分布原总体分布xXMiixxMu121xuiixM1)(2nxxs注意:不要混淆抽样注意:不要混淆抽样标准差与样本标准差!标准差与样本标准差!xunnnu
8、x2NnnNnNnux1122当N500时,有NnNnNNnN11nup1NnnNnNnup1111当N500时,有NnNnNNnN11spsP1122ffxxnxx或ppnn11npsx,无偏性无偏性(unbiasedness) 无偏性:无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性有效性(efficiency)一致性一致性(consistency) 一致性:一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数区间估计区间估计 (interval estimate)1.在点估计点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减估计误差而得到2.根据
9、样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量0.6827xux样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线0.9545xux2样本抽样分布曲线样本抽样分布曲线原总体分布曲线原总体分布曲线 0.9973被包被包住的概率为住的概率为99.73%xux3xxzuppzu1dtextZZ22212Z2Z221221 975.02105.0,95.01x应查,则若确定了保证程度dtextx2221标准正态分布函数值表标准正态分布函数值表2Z2Z 96.1025.02,05.02ZxP得到,则查若确定了显著性水平dtexPtx2221212置信区间置信区间 (9
10、5%的置信区间的置信区间)xxxxxxxx,或,其中,其中, 为极限误差为极限误差xxZux1,12222ffxxsnxxs22snsnux或NnnsNnnux1122或xxuZ xxxxxxxx,或,按按 日产量分组日产量分组(件)(件)组中值组中值(件)(件)工人数工人数(人)(人)11011411411811812212212612613013013413413813814211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计合计100126004144xfxffx
11、x2件件47.69941441126100126002ffxxsfxfx件614.01000100110047.6122Nnnsux件203.1614.096.1xxuZN203. 11261000203. 11261000,203. 1126203. 1126Npppppppp,或,其中,其中, 为极限误差为极限误差ppZunnp12p11111nppppnnnnupp或NnnppNnnupp11112或ppuZ pppppppp,或,按按 日产量分组日产量分组(件)(件)组中值(件)组中值(件)工人数(人)工人数(人)110114114118118122122126126130130134
12、134138138142112116120124128132136140371823211864合计合计100 xf0568. 0029. 096. 1029. 01000100111001 . 09 . 0111, 9 . 010090,96. 1,10,90,100,1000101pppuZNnnppunnpZnnnN则己知N0568. 09 . 010000568. 09 . 01000,0568. 09 . 00568. 09 . 0N总体均值的区间估计总体均值的区间估计 (正态总体、正态总体、 未知、小样本未知、小样本)其他情况:其他情况:CLT失效失效总体均值的区间估计总体均值的区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第五 参数估计 ppt 课件
限制150内