统计学参数估计.pptx





《统计学参数估计.pptx》由会员分享,可在线阅读,更多相关《统计学参数估计.pptx(46页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验第1页/共46页7.1 7.1 参数估计1.用样本统计量去估计总体参数。2.估计量用来估计总体参数的统计量 估计值一个具体样本计算出的统计量的数值第2页/共46页参数估计的方法参数估计的方法点估计点估计区间估计区间估计第3页/共46页二战中的点估计 德军有多少辆坦克?二战期间,盟军非常想知道德军总共制造了多少辆坦克。德国人在制造坦克时是墨守成规的,他们把坦克从1 1开始进行了连续编号。在战争过程中,盟军缴获了一些敌军坦克,并记录了它们的生产编号。那么怎样利用这些号码来估计坦克总数呢?在这个问题中,总体参数是未知的坦
2、克总数N,N,而缴获坦克的编号则是样本。第4页/共46页 假设我们是盟军手下负责解决这个问题的统计人员。制造出来的坦克总数肯定大于等于记录的最大编号。为了找到它比最大编号大多少,我们先找到被缴获坦克编号的平均值,并认为这个值是全部编号的中点。因此样本均值乘以2 2就是总数的一个估计;当然要特别假设缴获的坦克代表了所有坦克的一个随机样本。第5页/共46页 N N的另一个点估计公式是:N=m(1+1/k)-N=m(1+1/k)-11,其中m m是缴获到的最大的坦克编号,k k是被俘虏坦克个数。假如你俘虏了10 10 辆坦克,其中最大编号是5050,那么坦克总数的一个估计是(1+1/10)1+1/1
3、0)50-1=5450-1=54。此处我们认为坦克的实际数略大于最大编号。从战后发现的德军记录来看,盟军的估计值非常接近所生产的坦克的真实值。记录仍然表明统计估计比通常通过其他情报方式作出估计要大大接近于真实数目。统计学家们做得比间谍们更漂亮!第6页/共46页点估计含义:从总体中抽取一个样本,根据该样本的统计量对总体的未知参数作出一个数值点的估计。1.点估计的可靠性用标准误差来衡量。2.一个具体的点估计值无法给出估计的可靠性度量第7页/共46页区间估计含义:在点估计的基础上,给出总体参数估计取值的一个区间范围。样本统计量样本统计量 (点估计点估计)置信区间置信区间置信下限置信下限置信上限置信上
4、限第8页/共46页区间估计的图示x95%95%的样本的样本 -1.96-1.96 x x +1.96+1.96 x x99%99%的样本的样本 -2.58-2.58 x x +2.58+2.58 x x90%90%的样本的样本 -1.65-1.65 x x +1.65+1.65 x x第9页/共46页1.1.置信区间 由样本统计量对总体参数进行估计时的估计区间。在某种程度上确信置信区间中包含总体参数的真值在某种程度上确信置信区间中包含总体参数的真值2.2.置信水平(置信度、置信系数)置信水平(置信度、置信系数)包含总体参数真值的置信区间占所有置信区间包含总体参数真值的置信区间占所有置信区间的比
5、例。常用的比例。常用1-1-表示置信水平。表示置信水平。第10页/共46页 a.总体参数的真值是未知的、固定的,构造出的总体参数的真值是未知的、固定的,构造出的置信区间可能包含真值,也可能不包含真值;置信区间可能包含真值,也可能不包含真值;b.设置信水平为设置信水平为95%,则说明有,则说明有95%的置信区间的置信区间包含总体真值,有包含总体真值,有5%的置信区间不包含总体真值。的置信区间不包含总体真值。第11页/共46页练习题1.1.一个95%95%的置信区间是指()A A 总体参数有95%95%的概率落在这一区间内 B B 总体参数有5%5%的概率落在这一区间内 C C 在用同样方法构造的
6、总体参数的多个区间 中,有95%95%的区间包含该总体参数 D D 在用同样方法构造的总体参数的多个区间 中,有95%95%的区间不包含该总体参数第12页/共46页2.2.根据一个具体的样本求出的总体均值的95%95%的置信区间()A A 以95%95%的概率包含总体均值 B B 有5%5%的可能性包含总体均值 C C 一定包含总体均值 D D 要么包含总体均值,要么不包含总体均值 第13页/共46页置信水平置信水平/2/2Z Z/2/290%90%95%95%99%99%0.100.100.050.050.010.010.050.050.0250.0250.0050.0051.6451.64
7、51.961.962.582.58常用置信水平的临界值常用置信水平的临界值(Z(Z/2/2值值)第14页/共46页评价估计量的标准1.1.无偏性2.2.有效性 对同一总体参数的两个无偏估计量,标准差越小的估计量估计效果越好,称估计量越有效。3.3.一致性 随着样本量的增大,点估计量的值越来越接近被估总体的参数。E()=第15页/共46页7.2 7.2 一个总体参数的区间估计一个总体参数的区间估计第16页/共46页7.2.1 总体均值的区间估计总体均值的置信区间=样本均值边际误差总体是否为正态分布总体方差是否已知样本是大样本还是小样本1.1.正态总体,方差已知或非正态总体、大样本正态总体,方差已
8、知或非正态总体、大样本2.2.分布未知,方差未知,大样本分布未知,方差未知,大样本3.3.正态总体,方差未知,小样本正态总体,方差未知,小样本第17页/共46页1.1.正态总体,方差已知或非正态总体、大样本 样本均值 X XN N(,2 2/n n)总体均值总体均值在在1-1-的置信水平下的置信区间为的置信水平下的置信区间为第18页/共46页【例例】某厂成批生产某种金属棒,其长度服从某厂成批生产某种金属棒,其长度服从 正态分布,标准差为正态分布,标准差为0.06厘米,对一个由厘米,对一个由25 根棒组成的随机样本进行了测量,平均长度为根棒组成的随机样本进行了测量,平均长度为 7.48厘米,求这
9、批金属棒平均长度厘米,求这批金属棒平均长度的置信度的置信度 为为95%95%的置信区间。的置信区间。解:总体服从正态分布,方差已知,置信度为解:总体服从正态分布,方差已知,置信度为95%则则z z0.0250.025=1.96=1.96,在置信度为在置信度为95%95%水平下,金属棒的平均长度在水平下,金属棒的平均长度在7.4567.4567.5047.504厘米之间。厘米之间。第19页/共46页【例例】某某大大学学从从该该校校学学生生中中随随机机抽抽取取100100人人,调调查查到到他他们们平平均均每每天天参参加加体体育育锻锻炼炼的的时时间间为为2626分分钟钟。试试以以9595的的置置信信
10、水水平平估估计计该该大大学学全全体体学学生生平平均均每每天天参参加加体体育育锻锻炼的时间(已知总体方差为炼的时间(已知总体方差为3636分钟)。分钟)。第20页/共46页解:虽然总体分布未知,但总体方差已知,样本量充分大,x26,=6,n=100,/2=1.96在95的置信水平下估计大学生平均每 天 参 加 锻 炼 的 时 间 在 24.82427.176 分钟之间。第21页/共46页2.2.方差未知,大样本(方差未知,大样本(n30)n30)总体均值总体均值在在1-1-的置信水平下的置信区间为的置信水平下的置信区间为第22页/共46页【例例】一家保险公司收集到由一家保险公司收集到由36位投保
11、人组成位投保人组成的随机样本,他们的平均年龄为的随机样本,他们的平均年龄为40岁,标准差岁,标准差为为5岁,求这家保险公司的所有投保人的平均岁,求这家保险公司的所有投保人的平均年龄在年龄在90%的置信水平下的置信区间。的置信水平下的置信区间。解:总体的分布未知,总体方差也未知,但所抽解:总体的分布未知,总体方差也未知,但所抽 样本容量样本容量36为大样本,因此,求总体均值的为大样本,因此,求总体均值的 置信区间可用样本标准差代替总体标准差置信区间可用样本标准差代替总体标准差置信区间为:置信区间为:则投保人平均年龄在则投保人平均年龄在90%90%的置信度下的的置信度下的置信区间为置信区间为38.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 参数估计

限制150内