置信度 置信区间.pdf
《置信度 置信区间.pdf》由会员分享,可在线阅读,更多相关《置信度 置信区间.pdf(33页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、置信水平置信水平出自出自 MBA MBA 智库百科智库百科( (http:/ )置信水平置信水平(Confidence level)(Confidence level)目录目录显示编辑什么是置信水平什么是置信水平置信水平置信水平来表示样本统计值的精确度 ,它是指样本统计值落在参数值某一正负区间内的概率。编辑置信水平的确定置信水平的确定但确定置信水平究竟是百分之几,则主要决定于以下两个要素:第要素是内部控制的健全状况和运用状况如何。也就是说,在 内部控制的完备状况和运用状况均属良好的情况下,选择 80的置信水平就可以了,但当内部控制的完备状况和运用状况并不充:分时,就必须选择 95乃至 99的置
2、信水平。影响确定置信水平的另一要素是受审查公司的环境条件 。这种环境条件是指一般的经济条件、特殊的经济法律条件、受审查公司的经营组织和财务构成等。在这些条件对受审查公司不利 4 如销售收入明显下降)的情况下,就应决定在依据性试验中选择较高的置信水平。 、但是,因为环境条件的内容是多种多样的,所以, 审计人员必领以高度的专业能力来进行判断,并根据这种判断来认真研究环境的条件,以决定置信水平的选择。编辑置信水平的置信度置信水平的置信度置信度也称为可靠度,或置信水平、置信系数,即在 抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估
3、计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。置信水平是描述 GIS 中线元素与面元素的位置不确定性的重要指标之一。 置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。置信区间置信区间出自出自 MBA MBA 智库百科智库百科( (http:/ )置信区间置信区间(Confidence interval)(Confidence interval)目录目录显示编辑什么是置信区间什么是置信区间置信区间置信区间又称估计区间估计区间,是用来估计参数的取值范围
4、的。常见的 52%-64%,或 8-12,就是置信区间(估计区间)。编辑置信区间的概述置信区间的概述1、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。3、该区间包含了参数真值的可信程度。4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。编辑置信区间的计算步骤置信区间的计算步骤第一步:求一个样本的均值第二步:计算出抽样误差。人们经过实践,通常认为调查:100 个样本的抽样误差为10%;500 个样本的抽样误差为5%;1,200 个样本时的抽样误差为3%;第三步:用第一步求出
5、的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。编辑关于置信区间的宽窄关于置信区间的宽窄窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。假设全班考试的平均分数为 65 分,则置 信 区间 间隔 宽窄度 表 达 的 意 思0-100 分 100 宽 等于什么也没告诉你30-80 分 50 较窄 你能估出大概的平均分了(55 分)60-70 分 10 窄 你几乎能判定全班的平均分了(65 分)编辑置信区间与置信水平、样本量的关系置信区间与置信水平、样本量的关系1.样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。实例分析:实例分析:经过实践计
6、算的样本量与置信区间关系的变化表(假设置信水平相同):样本量 置信区间间隔 宽窄度10050%-70%20宽80056.2%63.2% 7较窄1,60057.5%-63%5.5较窄3,20058.5%-62%3.5更窄由上表得出由上表得出: :1、在置信水平相同的情况下,样本量越多,置信区间越窄。2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4 倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了 1,200 个消费者),就不再增加样本了。通过置信区间的计算公式来验证置信区间与样
7、本量的关系置信区间=样本的推断值(可靠程度系数 )从上述公式中可以看出:从上述公式中可以看出:在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。2.置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。实例分析:实例分析:美国做了一项对总统工作满意度的调查。在调查抽取的1,200 人中,有60%的人赞扬了总统的工作,抽样误差为3%,置信水平为 95%;如果将抽样误差减少为2.3%,置信水平降到为 90%。则两组数字的情况比较如下:抽样误差 置信水平 置信区间间隔 宽窄度39560357-636宽2.390602.357.7-62.3 4.6窄由上表得出由上表得
8、出: :在样本量相同的情况下(都是 1,200 人),置信水平越高(95%),置信区间越宽。抽样误差(抽样误差(Sampling errorSampling error)编辑什么是抽样误差什么是抽样误差在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。 抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差, 而不是指前一种因不遵循随机性原则而造成的系统性误差。总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避免会产生抽样误差,因为
9、从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本平均数与总体平均数之差,样本成数与总体成数之差 |pP | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。抽样误差也是衡量抽样检查准确程度的指标。抽样误差越大,表明 抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在 统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。编辑抽样误
10、差的计算抽样误差的计算1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。2、平均数指标的抽样误差1)重复抽样的条件下:2)不重复抽样的条件下:3、成数指标的抽样误差1)重复抽样的条件下:2)不重复抽样的条件下:编辑抽样误差的控制措施抽样误差的控制措施抽样误差则是不可避免的,但可以减少,其措施有:1、增加样本个案数。2、适应选择抽样方式。例如,在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。显著性水平显著性水平出自
11、出自 MBA MBA 智库百科智库百科( (http:/ )(重定向自显著水平)显著性水平(显著性水平(Significance LevelSignificance Level)编辑什么是显著性水平什么是显著性水平假设检验是围绕对原假设内容的审定而展开的 。如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出了正确的决定。但是,由于假设检验是根据 样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用 表示,统计上把 称为假设检验中的显著性水平,也就是决策中所面
12、临的风险。显著性水平显著性水平是假设检验中的一个概念 , 是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取 0.05 或 0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为 95或 99。显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。编辑显著性水平的理解显著性水平的理解显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,原假设成立而无显著性差异;
13、事件属于拒绝区间,拒绝原假设而认为有显著性差异。对显著水平的理解必须把握以下二点:1 1、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险来决定。来决定。2 2、统计上所讲的显著性与实际生活工作中的显著性是不一样的。、统计上所讲的显著性与实际生活工作中的显著性是不一样的。显著性差异显著性差异出自出自 MBA MBA 智库百科智库百科( (http:/ )显著性差异显著性差异(Significance Difference)(Significance Difference)编辑什么是显著性差异什么是显著性差异显著性差异
14、显著性差异是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。如比西一般能力测验中, 大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异, 这一差异很可能来自于学记忆法对被试记忆能力的改变。编辑显著性差异的评析显著性差异的评析显著性
15、差异是一种有量度的或然性评价。比如,我们说A、B 两数据在 0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为 95。两个数据所代表的样本还有 5的可能性是没有差异的。这 5的差异是由于随机误差造成的。P-value 是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称 P 值。如果此值小,就下原假设为不真实的结论。统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。一般P 值大于 ,则无法拒绝原假设,相反,P 值小于 ,则拒绝原假设。通常情况下,实验结果达到 0.05 水平或 0.01水平,才可以说数据之间具备了显著性差异。在作结论时,应确实描述方向性 (例
16、如显著大于或显著小于)。如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设 (Alternative Hypothesis) 得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。假设检验假设检验出自出自 MBA MBA 智库百科智库百科( (http:/ )假设检验(假设检验(Hypothesis TestingHypothesis Testing)目录目录显示编辑什么是假设检验什么是假设检验假设检验假设检验是用来判断样本与样本 ,样本与总体
17、的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数 (或率) 、样本均数 (率)与已知总体均数 (率) 有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误
18、差的影响,区分差别在统计上是否成立,并了解事件发生的概率。在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。假设检验的思想是,先假设两者相等,即: 0,然后用统计的方法来计算验证你的假设是否正确。编辑假设检验的基本思想假设检验的基本思想1.小概率原理
19、如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件) 在一次试验中几乎不可能发生的;要是在一次试验中A 竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。2.假设的形式H0原假设,H1备择假设双尾检验:H0: = 0,单尾检验:,H1: 0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。编辑假设检验的原理假设检验的原理一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。假设检验使用了一种类似于“反证法”的推理方法,它的特点是:(1)先假设总体某项假设成立,计算其会导
20、致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。(2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过 0.05 的事件称为“小概率事件”,也可视具体情形而取 0.1 或 0.01等。在假设检验中常记这个概率为,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。编辑假设检验的种类假设
21、检验的种类假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。正态分布检验包括三类:JB 检验、KS 检验、Lilliefors 检验,用于检验样本是否来自于一个正态分布总体。正态总体均值检验检验分析方法和分析结果的准确度 ,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。正态总体均值检验分为两种情况,t 检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检
22、验。当为双样本检验时,在两样本 t 检验中要用到 F 检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用 t 检验,若不等,可采用 t检验或变量变换或秩和检验等方法。Z 检验是一般用于大样本(即样本容量大于 30)平均值差异性检验的方法。上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检验方法。编辑假设检验的基本思想假设检验的基本
23、思想假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01 或 P3.48,也就是在 50个样品中抽到 4 个不合格品才能判整批为不合格。而如果我们改变 的取值,也就是我们定义的小概率的取值,比如说取 0.01,认为概率不超过 0.01 的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x4.30,也就是在 50 个样品中抽到 5 个不合格品才能判整批为不合格。检验要求是不合格品率 P 不能超过 3%,而现在根据 0.01,算出来 50 个样品中抽到 5 个不合格品才能判整批为不合格,会不会犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会
24、犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类:第一类错误(拒真错误):原假设 H0 为真(批产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品) ,样本落在拒绝域 W 内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为 ,也就是显著性水平。 控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。第二类错误(取伪错误):原假设 H0 不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在 W 外,从而导致接受 H0(根据样本的情况把批质量判断为合格)。其发生的概率记为 。 控制的其实是使用方的风险
25、,控制的是使用方所承担的接受质量不合格批的风险。再回到刚刚计算的上例的情况, 由 0.05 变化为 0.01,我们对批质量不合格的判断由 50 个样本中出现 4 个不合格变化为 5 个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着 的减小对批质量不合格的判断条件其实放宽了50 个样本中出现 4 个不合格变化为 5 个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。在相同样本量下,要使 小,必导致 大;要使 小,必导致 大,要同时兼顾生产方和使用方的风险是不可能的。要使 、 皆小,只有增大样本量,这又增加了
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 置信度 置信区间 置信
限制150内