第四讲估计与检验精选PPT.ppt
《第四讲估计与检验精选PPT.ppt》由会员分享,可在线阅读,更多相关《第四讲估计与检验精选PPT.ppt(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四讲估计与检验第1页,此课件共41页哦一、区间估计第2页,此课件共41页哦总体均值区间估计总体均值置信水平为100(1-)%的置信区间为:注意:注意:1、估计成立的条件是:样本必须是随机、独立的;、估计成立的条件是:样本必须是随机、独立的;2、使用、使用t分布表时,要求总体必须是近似正态的,需对样本作正态性检验;分布表时,要求总体必须是近似正态的,需对样本作正态性检验;3、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置、置信水平不是概率(置信区间是确定的而不是随机的),可以认为以置信水平(如信水平(如95%)相信总体均值在执行区间内;或是说,置信水平这一)相信总体均值在执行区
2、间内;或是说,置信水平这一计算方法可以使得置信区间以计算方法可以使得置信区间以95%的概率覆盖总体均值。的概率覆盖总体均值。大样本下:方差未知:或小样本下第3页,此课件共41页哦例1n某小组随机抽样调查了250户家庭的年收入,样本均值为9.8万,样本标准差为4.8万。小组给出一个置信区间(9.2,10.4),但未给出置信水平。1、问该区间的置信水平?(试比较两种分布的情形)2、小组给出解释:该地区家庭平均年收入为9.210.4的概率为95%,这种说法对吗?3、若同时有10个小组在进行相同的独立调查,问9个或以上小组得出的95%置信区间都覆盖总体均值的概率是多少?提示:可以将每一个区间是否覆盖总
3、体均值作为一次Bernoulli试验。令Y为覆盖总体均值的全金属区间数,显然YBin(10,0.95)第4页,此课件共41页哦单侧置信区间总体均值100(1-)%的置信区间:下限为:上限为:第5页,此课件共41页哦例2n1、同例1,问总体均值95%置信区间的下限?n当置信水平提高时,估计的可靠性将(提高 or 降低)?精确性将(提高 or 降低)?第6页,此课件共41页哦比例置信区间n若XBin(n,p),由中心极限定理传统方法是以样本p代替总体p进行区间估计,最近的研究表明,Agresti Coull区间有改进,置信水平为100(1-)%的置信区间计算公式如下:若下限小于0则用0代替,上限大
4、于1则用1代替。第7页,此课件共41页哦例3:n某企业从所购买的元件中随机抽检了150份,有5份不合格,估计不合格品率95%置信区间。(试用传统方法和Agresti Coull 方法分别计算比较)第8页,此课件共41页哦根据指定精度确定所需样本数n为获得总体平均100(1-)%的置信区间,且要求区间宽度不超过D时,则需从这个总体中抽取随机样本数为:n总体方差未知的两阶段法:阶段1:从总体中抽取n1个先期样本(如n1=30),计算这个样本的方差S2;阶段2:以S2替代总体未知方差计算所需样本数n,若nn1,再补抽 n n1 份样本。另:请同学们自行计算确定总体比例所需样本数。另:请同学们自行计算
5、确定总体比例所需样本数。第9页,此课件共41页哦例4n例1中,若要求所获得总体均值99%置信区间的偏差为(+-)0.5万元,问至少要调查多少样本?n例3中,若要求所获得总体不合格品率99%置信区间的偏差为(+-)0.5%万元,问至少要抽取多少样本?第10页,此课件共41页哦两个总体均值之差的置信区间n根据第三讲的知识,请同学们自行给出大样本情形下的计算公式。n小样本不能使用中心极限定理,可以使用t分布,计算公式:第11页,此课件共41页哦例5n欲比较A、B两医院住院病人的住院天数。随机抽取A医院64个住院病历,计算平均住院天数为6.54天,标准差为1.2;随机抽取B医院81个住院病历,计算平均
6、住院天数为6.24天,标准差为0.96。则两个医院住院病人平均住院天数差的95%置信区间是多少?有人认为两个医院病人的住院时间没有差异,与上述数据矛盾吗?为什么?第12页,此课件共41页哦例6n随机抽取A、B两地空气污染指数PSI,如下表所示A150146132164126128B9510411299109假设两地空气污染指数都服从正态分布,试估计两地PSI平均差95%置信区间。第13页,此课件共41页哦例7n有文献给出一项对睡眠习惯的研究结果。在一个由87个成年人组成的样本中,每天躺在床上的平均时间为7.70小时(不管处于清醒状态还是睡眠状态),标准差为1.02小时,其中处于睡眠状态的平均时
7、间为7.06小时,标准差为1.11小时。所以躺在床上的平均清醒时间为7.70-7.06=0.64小时。有可能建立平均清醒时间95%的置信区间吗?如果行,是多少?如不行,为什么?第14页,此课件共41页哦例8:数据对的置信区间数据对的置信区间n某轮胎制造商希望比较新、旧材料制成的轮胎的磨损情况。从每种轮胎中各选一个随机安装在10辆前驱汽车左、右前轮上。4万公里后测量磨损情况如下(单位:mm):12345678910新材料4.355.004.215.035.714.614.706.033.804.70旧材料4.194.624.044.725.524.264.276.243.464.50差值0.16
8、0.380.170.310.190.350.43-0.210.340.2问新、旧材料轮胎磨损差值95%的置信区间。第15页,此课件共41页哦两个总体比例之差的置信区间n若XBin(nx,px),Y Bin(ny,py),则 px-py 置信水平为100(1-)%的置信区间的计算方法为:传统方法:传统方法:改进方法:改进方法:第16页,此课件共41页哦例9n重复交易次数是顾客满意度的一个很好的度量。某企业随机抽取了今年的120个交易账户,有56个订购次数在2次以上。从去年抽取80个样本,有30个订购次数在2次以上。试计算这两年中订购次数在2次以上顾客的比例之差的置信水平为95%的置信区间。第17
9、页,此课件共41页哦二、假设检验第18页,此课件共41页哦问题1n某校新入学学生被随机分配进入高一两个班,人数都是70人,化学课分别由2个老师任教。期末考试的平均分分别是70.5和72.4分,标准差都为5.4分。其中第一个班有一个学生想找第2个班的老师补课,他的选择有道理吗?第19页,此课件共41页哦分析n每一次考试都包含很多随机因素;n老师1可以认为自己的教学水平(以学生考试平均分来测量)为72.4分;n老师1可以认为老师2的教学水平其实和自己是一样的,这次考试的结果是因为自己班级发挥不好而对方班级发挥的好。n对于这种具有随机性的结果的证明只能寻求统计意义上的检验。第20页,此课件共41页哦
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 估计 检验 精选 PPT
限制150内