统计推断讲义.pptx

资源ID：85118796 资源大小：80.36KB 全文页数：19页
资源格式： PPTX 下载积分：10金币

快捷下载

会员登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要10金币

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

统计推断讲义.pptx

统计推断从数据得到对现实世界的结从数据得到对现实世界的结论的过程论的过程估计估计总体它代表我们所关心的那部分现实世界。总体它代表我们所关心的那部分现实世界。而在利用样本中的信息来对总体进行推断而在利用样本中的信息来对总体进行推断之前人们一般对代表总体的变量假定了分之前人们一般对代表总体的变量假定了分布族。比如假定人们的身高属于正态分布布族。比如假定人们的身高属于正态分布族；对抽样调查假定了二项分布族等等。族；对抽样调查假定了二项分布族等等。这些模型基本上是根据经验来假定的，所这些模型基本上是根据经验来假定的，所以仅仅是对现实世界的一个近似。在假定以仅仅是对现实世界的一个近似。在假定了总体分布族之后，进一步对总体的认识了总体分布族之后，进一步对总体的认识就是要在这个分布族中选择一个适合于我就是要在这个分布族中选择一个适合于我们问题的分布；由于分布族成员是由参数们问题的分布；由于分布族成员是由参数确定的，如果参数能够估计，对总体的具确定的，如果参数能够估计，对总体的具体分布就知道得差不多了。体分布就知道得差不多了。估计估计一种是点估计一种是点估计(point estimation)，也就是，也就是用估计量的实现值来近似相应的总体参数。用估计量的实现值来近似相应的总体参数。另一种是区间估计另一种是区间估计(interval estimation)；它是包括估计量在内（有时是以估计量为它是包括估计量在内（有时是以估计量为中心）的一个区间；该区间被认为很可能中心）的一个区间；该区间被认为很可能包含总体参数。包含总体参数。点估计给出一个数字，用起来很方便；而点估计给出一个数字，用起来很方便；而区间估计给出一个区间，说起来留有余地；区间估计给出一个区间，说起来留有余地；不象点估计那么绝对。不象点估计那么绝对。无偏估计无偏估计(大样本性质大样本性质)区间估计的置信度区间估计的置信度(大样本性质大样本性质)估计估计注注意意置置信信区区间间的的论论述述是是由由区区间间和和置置信信度度两两部部分分组组成成。有有些些新新闻闻媒媒体体报报道道一一些些调调查查结结果果只只给给出出百百分分比比和和误误差差（即即置置信信区区间间），并并不不说说明明置置信信度度，也也不不给给出出被被调调查查的的人人数数，这这是是不不负负责责的的表表现现。因因为为降降低低置置信信度度可可以以使使置置信信区区间间变变窄窄（显显得得“精精确确”），有有误误导导读读者者之之嫌嫌。如如果果给给出出被被调调查查的的人人数数，则则内内行行可可以以由由推推算算出出置置信信度度（由由后后面面给给出出的公式），反之亦然。的公式），反之亦然。一个描述性例子一个描述性例子一一个个有有10000个个人人回回答答的的调调查查显显示示，同同意意某某种种观观点点的的人人的的比比例例为为70%（有有7000人人同同意意），可可以以算算出出总总体体中中同同意意该该观观点点的的比比例例的的95%置置信信区区间间为为（0.691，0.709）；另另一一个个调调查查声声称称有有70%的的比比例例反反对对该该种种观观点点，还还说说总总体体中中反反对对该该观观点点的的置置信信区区间间也也是是（0.691，0.709）。到到底底相相信信谁谁呢呢？实实际际上上，第第二二个个调调查查隐隐瞒瞒了了置置信信度度（等等价价于于隐隐瞒瞒了了样样本本量量）。如如果果第第二二个个调调查查仅仅仅仅调调查查了了50个个人人，有有35个个人人反反对对该该观观点点。根根据据后后面面的的公公式式可可以以算算出出，第第二二个个调调查查的的置置信信区区间间的的置信度仅有置信度仅有11%。假设检验假设检验在假设检验中，一般要设立一个原假设；在假设检验中，一般要设立一个原假设；而设立该假设的动机主要是企图利用人们而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设和掌握的反映现实世界的数据来找出假设和现实的矛盾，从而否定这个假设。在多数现实的矛盾，从而否定这个假设。在多数统计教科书中（除了理论探讨之外）的假统计教科书中（除了理论探讨之外）的假设检验都是以否定原假设为目标。设检验都是以否定原假设为目标。如果否定不了，那就说明证据不足，无法如果否定不了，那就说明证据不足，无法否定原假设。但这不能说明原假设正确。否定原假设。但这不能说明原假设正确。很多教科书在这个问题上不适当地用很多教科书在这个问题上不适当地用“接接受原假设受原假设”的说法，犯了明显的低级逻辑的说法，犯了明显的低级逻辑错误。错误。假设检验的过程和逻辑假设检验的过程和逻辑首先要提出一个原假设，比如某正态首先要提出一个原假设，比如某正态总体的均值等于总体的均值等于5（m=5）。这种原假）。这种原假设也称为零假设（设也称为零假设（null hypothesis），），记为记为H0。与此同时必须提出对立假设，比如总与此同时必须提出对立假设，比如总体均值大于体均值大于5（m5）。对立假设又称）。对立假设又称为备选假设或备择假设（为备选假设或备择假设（alternative hypothesis）记为记为）记为记为H1或或Ha。假设检验的过程和逻辑假设检验的过程和逻辑根据零假设根据零假设（不是备选假设！），我（不是备选假设！），我们可以得到该检验统计量的分布；们可以得到该检验统计量的分布；然后再看这个统计量的数据实现值然后再看这个统计量的数据实现值（realization）属不属于小概率事件。）属不属于小概率事件。也就是说把数据代入检验统计量，看也就是说把数据代入检验统计量，看其值是否落入零假设下的小概率范畴；其值是否落入零假设下的小概率范畴；如果的确是小概率事件，那么我们就如果的确是小概率事件，那么我们就有可能拒绝零假设，否则我们说没有有可能拒绝零假设，否则我们说没有足够证据拒绝零假设。足够证据拒绝零假设。假设检验的过程和逻辑假设检验的过程和逻辑注意：注意：零假设和备选假设在假设检验零假设和备选假设在假设检验中并不对称中并不对称。因检验统计量的分布是。因检验统计量的分布是从零假设导出的，因此，如果发生矛从零假设导出的，因此，如果发生矛盾，当然就对零假设不利了。盾，当然就对零假设不利了。不发生矛盾也不说明备选假设有问题不发生矛盾也不说明备选假设有问题（因为和备选假设无关）。（因为和备选假设无关）。假设检验的过程和逻辑假设检验的过程和逻辑检检验验统统计计量量在在零零假假设设下下等等于于这这个个样样本本的的数数据据实实现现值值或或更更加加极极端端值值的的概概率率称称为为p-值值（p-value）。）。显显然然得得到到很很小小p-值值意意味味着着小小概概率率事事件件发发生生了了。如如果果小小概概率率事事件件发发生生，是是相相信信零零假假设设，还还是相信数据呢？是相信数据呢？当当然然是是相相信信数数据据。于于是是就就拒拒绝绝零零假假设设。但但小小概概率率并并不不能能说说明明不不会会发发生生，仅仅仅仅发发生生的的概率很小罢了。概率很小罢了。拒拒绝绝正正确确零零假假设设的的错错误误常常被被称称为为第第一一类类错错误（误（type I error）。）。假设检验的过程和逻辑假设检验的过程和逻辑有有第第一一类类错错误误，就就有有第第二二类类错错误误；那那是是备备选选零零假假设设正正确确时时反反而而说说零零假假设设正正确确的的错错误误，称为第二类错误（称为第二类错误（type II error）。）。零零假假设设和和备备选选假假设设哪哪一一个个正正确确，这这是是确确定定性的，没有概率可言。性的，没有概率可言。而而可可能能犯犯错错误误的的是是人人。涉涉及及假假设设检检验验的的犯犯错错误误的的概概率率就就是是犯犯第第一一类类错错误误的的概概率率和和犯犯第二类错误的概率。第二类错误的概率。负负责责的的态态度度是是无无论论做做出出什什么么决决策策，都都应应该该给出犯错误的概率。给出犯错误的概率。假设检验的过程和逻辑假设检验的过程和逻辑到到底底p-值值是是多多小小才才能能够够拒拒绝绝零零假假设设呢呢？也也就就是是说说，需需要要有有什什么么是是小小概概率率的的标标准准。这这要要看看具具体体应应用用的的需需要要。但但在在一一般般的的统统计计书书和和软软件件中中，使使用用最最多多的的标标准准是是在在零零假假设设下下（或或零零假假设设正正确确时时）抽抽样样所所得得的的数数据据拒拒绝绝零零假假设设的的概概率率应应小小于于0.05（也也可可能能是是0.01，0.005，0.001等等等等）。这这种种事事先先规规定定的的概概率率称称为为显显著著性性水水平平(significant level)，用用字字母母a a来来表表示示。当当p-值值小小于于或或等等于于a a时时，就就拒拒绝绝零零假假设设。所所以以，a a是是所所允允许许的的犯犯第第一一类类错错误误概概率率的的最最大大值值。当当p-值值小小于于或或等等于于a a时时，我们说这个检验是显著的我们说这个检验是显著的(significant)。假设检验的过程和逻辑假设检验的过程和逻辑归纳起来，假设检验的逻辑步骤为：归纳起来，假设检验的逻辑步骤为：第一，写出零假设和备选假设；第一，写出零假设和备选假设；第二，确定检验统计量；第二，确定检验统计量；第三，确定显著性水平第三，确定显著性水平a a；第四，根据数据计算检验统计量的实现值；第四，根据数据计算检验统计量的实现值；第五，根据这个实现值计算第五，根据这个实现值计算p-值；值；第第六六，进进行行判判断断：如如果果p-值值小小于于或或等等于于a a，就就拒拒绝绝零零假假设设，这这时时犯犯错错误误的的概概率率最最多多为为a a；如如果果p-值值大大于于a a，就就不不拒拒绝绝零零假假设设，因因为为证据不足。证据不足。假设检验的过程和逻辑假设检验的过程和逻辑实实际际上上，计计算算机机软软件件仅仅仅仅给给出出p-值值，而而不不给给出出a a。这这有有很很多多方方便便之之处处。比比如如a a=0.05，而而假假定定我我们们得得到到的的p-值值等等于于0.001。这这时时我我们们如如果果如如果果采采用用p-值值作作为为新新的的显显著著性性水水平平，即即a a=0.001，于于是是可可以以说说，我我们们拒拒绝绝零零假假设设，显显著著性性水水平平为为0.001。拒拒绝绝零零假假设设时时犯犯错错误误的的概概率率实实际际只只是是千千分分之之一一而而不不是是百百分分之之五五。在在这这个个意意义义上上，p-值值又又称称为为观观测测的的显显著著性性水水平平（observed significant level）。在在统统计计软软件件输输出出p-值值的的位位置置，有有的的用用“p-value”，有有的的用用significant的的缩缩写写“Sig”就就是是这这个个道道理。理。假设检验的过程和逻辑假设检验的过程和逻辑展展示示结结果果的的精精确确性性（根根据据数数据据减减少少a a的的值值）总总是是没没有有害害处处的的。这这好好比比一一个个身身高高180厘厘米米的的男男生生，可可能能愿愿意意被被认认为为高高于于或或等等于于180厘厘米米，而而不不愿愿意意说说他他高高于于或或等等于于155厘厘米米，虽虽然然这这第第二二种种说说法法数数学上没有丝毫错误。学上没有丝毫错误。假设检验的过程和逻辑假设检验的过程和逻辑关关于于“临临界界值值”的的注注：作作为为概概率率的的显显著著性性水水平平a a实实际际上上相相应应于于一一个个检检验验统统计计量量取取值值范范围围的的一一个个临临界界值值（critical value），它它定定义义为为，统统计计量量取取该该值值或或更更极极端端的的值值的的概概率率等等于于a a。也也就就是是说说，“统统计计量量的的实实现现值值比比临临界界值值更更极极端端”等等价价于于“p-值值小小于于a a”。使使用用临临界界值值的的概概念念进进行行的的检检验不计算验不计算p-值。只比较统计量的取值和临界值的大小。值。只比较统计量的取值和临界值的大小。使使用用临临界界值值而而不不是是p-值值来来判判断断拒拒绝绝与与否否是是前前计计算算机机时时代代的的产产物物。当当时时计计算算p-值值不不易易，只只有有采采用用临临界界值值的的概概念念。但但从从给给定定的的a a求求临临界界值值同同样样也也不不容容易易，好好在在习习惯惯上上仅仅仅仅在在教教科科书书中中列列出出相相应应于于特特定定分分布布的的几几个个有有限限的的a a临临界界值值（比比如如a a=0.05，a a=0.025，a a=0.01，a a=0.005，a a=0.001等等等等），或或者者根根据据分分布布表表反反过过来来查查临临界界值值（很很不不方方便便也也很很粗糙）。粗糙）。现现在在计计算算机机软软件件都都不不给给出出a a和和临临界界值值，但但都都给给出出p-值值和和统计量实现值，让用户自己决定显著性水平是多少。统计量实现值，让用户自己决定显著性水平是多少。假设检验的例子假设检验的例子汽汽车车厂厂商商声声称称其其发发动动机机排排放放标标准准的的一一个个指指标标平平均均低低于于20个个单单位位。在在抽抽查查了了10台台发发动动机机之之后后，得得到到下下面面的的排排放放数数据据：17.0、21.7、17.9、22.9、20.7、22.4、17.3、21.8、24.2、25.4。该该样样本本均均值值为为21.13。究究竟竟能能否否由由此此认认为为该该指指标标均均值值超超过过20？这次我们的假设检验问题就是这次我们的假设检验问题就是假设检验的例子假设检验的例子检验统计量为检验统计量为我我们们可可以以发发现现p-值值为为0.1243，因因此此，我我们们没没有有证证据否定零假设。据否定零假设。

注意事项

本文（统计推断讲义.pptx）为本站会员（修****）主动上传，淘文阁 - 分享文档赚钱的网站仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知淘文阁 - 分享文档赚钱的网站（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。