统计推断讲义.pptx
《统计推断讲义.pptx》由会员分享,可在线阅读,更多相关《统计推断讲义.pptx(19页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计推断从数据得到对现实世界的结从数据得到对现实世界的结论的过程论的过程估计估计 总体它代表我们所关心的那部分现实世界。总体它代表我们所关心的那部分现实世界。而在利用样本中的信息来对总体进行推断而在利用样本中的信息来对总体进行推断之前人们一般对代表总体的变量假定了分之前人们一般对代表总体的变量假定了分布族。比如假定人们的身高属于正态分布布族。比如假定人们的身高属于正态分布族;对抽样调查假定了二项分布族等等。族;对抽样调查假定了二项分布族等等。这些模型基本上是根据经验来假定的,所这些模型基本上是根据经验来假定的,所以仅仅是对现实世界的一个近似。在假定以仅仅是对现实世界的一个近似。在假定了总体分布
2、族之后,进一步对总体的认识了总体分布族之后,进一步对总体的认识就是要在这个分布族中选择一个适合于我就是要在这个分布族中选择一个适合于我们问题的分布;由于分布族成员是由参数们问题的分布;由于分布族成员是由参数确定的,如果参数能够估计,对总体的具确定的,如果参数能够估计,对总体的具体分布就知道得差不多了。体分布就知道得差不多了。估计估计 一种是点估计一种是点估计(point estimation),也就是,也就是用估计量的实现值来近似相应的总体参数。用估计量的实现值来近似相应的总体参数。另一种是区间估计另一种是区间估计(interval estimation);它是包括估计量在内(有时是以估计量为
3、它是包括估计量在内(有时是以估计量为中心)的一个区间;该区间被认为很可能中心)的一个区间;该区间被认为很可能包含总体参数。包含总体参数。点估计给出一个数字,用起来很方便;而点估计给出一个数字,用起来很方便;而区间估计给出一个区间,说起来留有余地;区间估计给出一个区间,说起来留有余地;不象点估计那么绝对。不象点估计那么绝对。无偏估计无偏估计(大样本性质大样本性质)区间估计的置信度区间估计的置信度(大样本性质大样本性质)估计估计 注注意意置置信信区区间间的的论论述述是是由由区区间间和和置置信信度度两两部部分分组组成成。有有些些新新闻闻媒媒体体报报道道一一些些调调查查结结果果只只给给出出百百分分比比
4、和和误误差差(即即置置信信区区间间),并并不不说说明明置置信信度度,也也不不给给出出被被调调查查的的人人数数,这这是是不不负负责责的的表表现现。因因为为降降低低置置信信度度可可以以使使置置信信区区间间变变窄窄(显显得得“精精确确”),有有误误导导读读者者之之嫌嫌。如如果果给给出出被被调调查查的的人人数数,则则内内行行可可以以由由推推算算出出置置信信度度(由由后后面面给给出出的公式),反之亦然。的公式),反之亦然。一个描述性例子一个描述性例子 一一个个有有10000个个人人回回答答的的调调查查显显示示,同同意意某某种种观观点点的的人人的的比比例例为为70%(有有7000人人同同意意),可可以以算
5、算出出总总体体中中同同意意该该观观点点的的比比例例的的95%置置信信区区间间为为(0.691,0.709);另另一一个个调调查查声声称称有有70%的的比比例例反反对对该该种种观观点点,还还说说总总体体中中反反对对该该观观点点的的置置信信区区间间也也是是(0.691,0.709)。到到底底相相信信谁谁呢呢?实实际际上上,第第二二个个调调查查隐隐瞒瞒了了置置信信度度(等等价价于于隐隐瞒瞒了了样样本本量量)。如如果果第第二二个个调调查查仅仅仅仅调调查查了了50个个人人,有有35个个人人反反对对该该观观点点。根根据据后后面面的的公公式式可可以以算算出出,第第二二个个调调查查的的置置信信区区间间的的置信
6、度仅有置信度仅有11%。假设检验假设检验 在假设检验中,一般要设立一个原假设;在假设检验中,一般要设立一个原假设;而设立该假设的动机主要是企图利用人们而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和掌握的反映现实世界的数据来找出假设和现实的矛盾,从而否定这个假设。在多数现实的矛盾,从而否定这个假设。在多数统计教科书中(除了理论探讨之外)的假统计教科书中(除了理论探讨之外)的假设检验都是以否定原假设为目标。设检验都是以否定原假设为目标。如果否定不了,那就说明证据不足,无法如果否定不了,那就说明证据不足,无法否定原假设。但这不能说明原假设正确。否定原假设。但这不能说明原假设
7、正确。很多教科书在这个问题上不适当地用很多教科书在这个问题上不适当地用“接接受原假设受原假设”的说法,犯了明显的低级逻辑的说法,犯了明显的低级逻辑错误。错误。假设检验的过程和逻辑假设检验的过程和逻辑 首先要提出一个原假设,比如某正态首先要提出一个原假设,比如某正态总体的均值等于总体的均值等于5(m=5)。这种原假)。这种原假设也称为零假设(设也称为零假设(null hypothesis),),记为记为H0。与此同时必须提出对立假设,比如总与此同时必须提出对立假设,比如总体均值大于体均值大于5(m5)。对立假设又称)。对立假设又称为备选假设或备择假设(为备选假设或备择假设(alternative
8、 hypothesis)记为记为)记为记为H1或或Ha。假设检验的过程和逻辑假设检验的过程和逻辑 根据零假设根据零假设(不是备选假设!),我(不是备选假设!),我们可以得到该检验统计量的分布;们可以得到该检验统计量的分布;然后再看这个统计量的数据实现值然后再看这个统计量的数据实现值(realization)属不属于小概率事件。)属不属于小概率事件。也就是说把数据代入检验统计量,看也就是说把数据代入检验统计量,看其值是否落入零假设下的小概率范畴;其值是否落入零假设下的小概率范畴;如果的确是小概率事件,那么我们就如果的确是小概率事件,那么我们就有可能拒绝零假设,否则我们说没有有可能拒绝零假设,否则
9、我们说没有足够证据拒绝零假设。足够证据拒绝零假设。假设检验的过程和逻辑假设检验的过程和逻辑 注意:注意:零假设和备选假设在假设检验零假设和备选假设在假设检验中并不对称中并不对称。因检验统计量的分布是。因检验统计量的分布是从零假设导出的,因此,如果发生矛从零假设导出的,因此,如果发生矛盾,当然就对零假设不利了。盾,当然就对零假设不利了。不发生矛盾也不说明备选假设有问题不发生矛盾也不说明备选假设有问题(因为和备选假设无关)。(因为和备选假设无关)。假设检验的过程和逻辑假设检验的过程和逻辑 检检验验统统计计量量在在零零假假设设下下等等于于这这个个样样本本的的数数据据实实现现值值或或更更加加极极端端值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 推断 讲义
限制150内