置信度 置信区间.pdf
置信水平置信水平出自出自 MBA MBA 智库百科智库百科( (http:/ )置信水平置信水平(Confidence level)(Confidence level)目录目录显示编辑什么是置信水平什么是置信水平置信水平置信水平来表示样本统计值的精确度 ,它是指样本统计值落在参数值某一正负区间内的概率。编辑置信水平的确定置信水平的确定但确定置信水平究竟是百分之几,则主要决定于以下两个要素:第要素是内部控制的健全状况和运用状况如何。也就是说,在 内部控制的完备状况和运用状况均属良好的情况下,选择 80的置信水平就可以了,但当内部控制的完备状况和运用状况并不充:分时,就必须选择 95乃至 99的置信水平。影响确定置信水平的另一要素是受审查公司的环境条件 。这种环境条件是指一般的经济条件、特殊的经济法律条件、受审查公司的经营组织和财务构成等。在这些条件对受审查公司不利 4 如销售收入明显下降)的情况下,就应决定在依据性试验中选择较高的置信水平。 、但是,因为环境条件的内容是多种多样的,所以, 审计人员必领以高度的专业能力来进行判断,并根据这种判断来认真研究环境的条件,以决定置信水平的选择。编辑置信水平的置信度置信水平的置信度置信度也称为可靠度,或置信水平、置信系数,即在 抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。置信水平是描述 GIS 中线元素与面元素的位置不确定性的重要指标之一。 置信水平表示区间估计的把握程度,置信区间的跨度是置信水平的正函数,即要求的把握程度越大,势必得到一个较宽的置信区间,这就相应降低了估计的准确程度。置信区间置信区间出自出自 MBA MBA 智库百科智库百科( (http:/ )置信区间置信区间(Confidence interval)(Confidence interval)目录目录显示编辑什么是置信区间什么是置信区间置信区间置信区间又称估计区间估计区间,是用来估计参数的取值范围的。常见的 52%-64%,或 8-12,就是置信区间(估计区间)。编辑置信区间的概述置信区间的概述1、对于具有特定的发生概率的随机变量,其特定的价值区间:一个确定的数值范围(“一个区间”)。2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。3、该区间包含了参数真值的可信程度。4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。编辑置信区间的计算步骤置信区间的计算步骤第一步:求一个样本的均值第二步:计算出抽样误差。人们经过实践,通常认为调查:100 个样本的抽样误差为10%;500 个样本的抽样误差为5%;1,200 个样本时的抽样误差为3%;第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。编辑关于置信区间的宽窄关于置信区间的宽窄窄的置信区间比宽的置信区间能提供更多的有关总体参数的信息。假设全班考试的平均分数为 65 分,则置 信 区间 间隔 宽窄度 表 达 的 意 思0-100 分 100 宽 等于什么也没告诉你30-80 分 50 较窄 你能估出大概的平均分了(55 分)60-70 分 10 窄 你几乎能判定全班的平均分了(65 分)编辑置信区间与置信水平、样本量的关系置信区间与置信水平、样本量的关系1.样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。实例分析:实例分析:经过实践计算的样本量与置信区间关系的变化表(假设置信水平相同):样本量 置信区间间隔 宽窄度10050%-70%20宽80056.2%63.2% 7较窄1,60057.5%-63%5.5较窄3,20058.5%-62%3.5更窄由上表得出由上表得出: :1、在置信水平相同的情况下,样本量越多,置信区间越窄。2、置信区间变窄的速度不像样本量增加的速度那么快,也就是说并不是样本量增加一倍,置信区间也变窄一倍(实践证明,样本量要增加4 倍,置信区间才能变窄一倍),所以当样本量达到一个量时(通常是1,200,如上例三个国家各抽了 1,200 个消费者),就不再增加样本了。通过置信区间的计算公式来验证置信区间与样本量的关系置信区间=样本的推断值(可靠程度系数 )从上述公式中可以看出:从上述公式中可以看出:在其他因素不变的情况下,样本量越多(大),置信区间越窄(小)。2.置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。实例分析:实例分析:美国做了一项对总统工作满意度的调查。在调查抽取的1,200 人中,有60%的人赞扬了总统的工作,抽样误差为3%,置信水平为 95%;如果将抽样误差减少为2.3%,置信水平降到为 90%。则两组数字的情况比较如下:抽样误差 置信水平 置信区间间隔 宽窄度39560357-636宽2.390602.357.7-62.3 4.6窄由上表得出由上表得出: :在样本量相同的情况下(都是 1,200 人),置信水平越高(95%),置信区间越宽。抽样误差(抽样误差(Sampling errorSampling error)编辑什么是抽样误差什么是抽样误差在抽样检查中,由于用样本指标代替全及指标所产生的误差可分为两种:一种是由于主观因素破坏了随机原则而产生的误差,称为系统性误差;另一种是由于抽样的随机性引起的偶然的代表性误差。 抽样误差仅仅是指后一种由于抽样的随机性而带来的偶然的代表性误差, 而不是指前一种因不遵循随机性原则而造成的系统性误差。总的说来,抽样误差是指样本指标与全及总体指标之间的绝对误差。在进行抽样检查时不可避免会产生抽样误差,因为从总体中随机抽取的样本,其结构不可能和总体完全一致。例如样本平均数与总体平均数之差,样本成数与总体成数之差 |pP | 。虽然抽样误差不可避免,但可以运用大数定律的数学公式加以精确地计算,确定它具体的数量界限,并可通过抽样设计加以控制。抽样误差也是衡量抽样检查准确程度的指标。抽样误差越大,表明 抽样总体对全及总体的代表性越小,抽样检查的结果越不可靠。反之,抽样误差越小,说明抽样总体对全及总体的代表性越大,抽样检查的结果越准确可靠。在 统计学中把抽样误差分为抽样平均误差和抽样极限误差,下面就这两种误差分别进行阐释。为使推理过程简化,这里不对属性总体进行分析,而仅对变量总体进行分析计算。编辑抽样误差的计算抽样误差的计算1、表现形式:平均数指标抽样误差;成数(比重)抽样误差。2、平均数指标的抽样误差1)重复抽样的条件下:2)不重复抽样的条件下:3、成数指标的抽样误差1)重复抽样的条件下:2)不重复抽样的条件下:编辑抽样误差的控制措施抽样误差的控制措施抽样误差则是不可避免的,但可以减少,其措施有:1、增加样本个案数。2、适应选择抽样方式。例如,在同样条件下,又重复抽样比重复抽样的抽样误差小,又如在总体现象分类比较明显时,采用分层随机抽样比其它方法的抽样误差小。由于总体真正的参数值未知,真正的抽样误差也未知,所以抽样误差的计算一般都以抽样平均误差来代表真正的抽样误差。显著性水平显著性水平出自出自 MBA MBA 智库百科智库百科( (http:/ )(重定向自显著水平)显著性水平(显著性水平(Significance LevelSignificance Level)编辑什么是显著性水平什么是显著性水平假设检验是围绕对原假设内容的审定而展开的 。如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出了正确的决定。但是,由于假设检验是根据 样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用 表示,统计上把 称为假设检验中的显著性水平,也就是决策中所面临的风险。显著性水平显著性水平是假设检验中的一个概念 , 是指当原假设为正确时人们却把它拒绝了的概率或风险。它是公认的小概率事件的概率值,必须在每一次统计检验之前确定,通常取 0.05 或 0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为 95或 99。显著性水平代表的意义是在一次试验中小概率事物发生的可能性大小。编辑显著性水平的理解显著性水平的理解显著性水平是在进行假设检验时事先确定一个可允许的作为判断界限的小概率标准。检验中,依据显著性水平大小把概率划分为二个区间,小于给定标准的概率区间称为拒绝区间,大于这个标准则为接受区间。事件属于接受区间,原假设成立而无显著性差异;事件属于拒绝区间,拒绝原假设而认为有显著性差异。对显著水平的理解必须把握以下二点:1 1、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险、显著性水平不是一个固定不变的数值,依据拒绝区间所可能承担的风险来决定。来决定。2 2、统计上所讲的显著性与实际生活工作中的显著性是不一样的。、统计上所讲的显著性与实际生活工作中的显著性是不一样的。显著性差异显著性差异出自出自 MBA MBA 智库百科智库百科( (http:/ )显著性差异显著性差异(Significance Difference)(Significance Difference)编辑什么是显著性差异什么是显著性差异显著性差异显著性差异是一个统计学名词。它是统计学(Statistics)上对数据差异性的评价。当数据之间具有了显著性差异,就说明参与比对的数据不是来自于同一总体(Population),而是来自于具有差异的两个不同总体,这种差异可能因参与比对的数据是来自不同实验对象的。如比西一般能力测验中, 大学学历被试组的成绩与小学学历被试组会有显著性差异。也可能来自于实验处理对实验对象造成了根本性状改变,因而前测后测的数据会有显著性差异。例如,记忆术研究发现,被试学习某记忆法前的成绩和学习记忆法后的记忆成绩会有显著性差异, 这一差异很可能来自于学记忆法对被试记忆能力的改变。编辑显著性差异的评析显著性差异的评析显著性差异是一种有量度的或然性评价。比如,我们说A、B 两数据在 0.05水平上具备显著性差异,这是说两组数据具备显著性差异的可能性为 95。两个数据所代表的样本还有 5的可能性是没有差异的。这 5的差异是由于随机误差造成的。P-value 是原假设H0真实的结论时,我们观察到样本的值有多大的概率,简称 P 值。如果此值小,就下原假设为不真实的结论。统计学上称为小概率事件,即样本不是从原假设的分布中抽出的。一般P 值大于 ,则无法拒绝原假设,相反,P 值小于 ,则拒绝原假设。通常情况下,实验结果达到 0.05 水平或 0.01水平,才可以说数据之间具备了显著性差异。在作结论时,应确实描述方向性 (例如显著大于或显著小于)。如果我们是检验某实验(Hypothesis Test)中测得的数据,那么当数据之间具备了显著性差异,实验的虚无假设(Null Hypothesis)就可被推翻,对立假设 (Alternative Hypothesis) 得到支持;反之若数据之间不具备显著性差异,则实验的备则假设可以被推翻,虚无假设得到支持。假设检验假设检验出自出自 MBA MBA 智库百科智库百科( (http:/ )假设检验(假设检验(Hypothesis TestingHypothesis Testing)目录目录显示编辑什么是假设检验什么是假设检验假设检验假设检验是用来判断样本与样本 ,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数 (或率) 、样本均数 (率)与已知总体均数 (率) 有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。在质量管理工作中经常遇到两者进行比较的情况,如采购原材料的验证,我们抽样所得到的数据在目标值两边波动,有时波动很大,这时你如何进行判定这些原料是否达到了我们规定的要求呢?再例如,你先后做了两批实验,得到两组数据,你想知道在这两试实验中合格率有无显著变化,那怎么做呢?这时你可以使用假设检验这种统计方法,来比较你的数据,它可以告诉你两者是否相等,同时也可以告诉你,在你做出这样的结论时,你所承担的风险。假设检验的思想是,先假设两者相等,即: 0,然后用统计的方法来计算验证你的假设是否正确。编辑假设检验的基本思想假设检验的基本思想1.小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件) 在一次试验中几乎不可能发生的;要是在一次试验中A 竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。2.假设的形式H0原假设,H1备择假设双尾检验:H0: = 0,单尾检验:,H1: 0假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。编辑假设检验的原理假设检验的原理一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。假设检验使用了一种类似于“反证法”的推理方法,它的特点是:(1)先假设总体某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。(2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过 0.05 的事件称为“小概率事件”,也可视具体情形而取 0.1 或 0.01等。在假设检验中常记这个概率为,称为显著性水平。而把原先设定的假设成为原假设,记作H0。把与H0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作H1。编辑假设检验的种类假设检验的种类假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。正态分布检验包括三类:JB 检验、KS 检验、Lilliefors 检验,用于检验样本是否来自于一个正态分布总体。正态总体均值检验检验分析方法和分析结果的准确度 ,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。正态总体均值检验分为两种情况,t 检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检验。当为双样本检验时,在两样本 t 检验中要用到 F 检验。从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用 t 检验,若不等,可采用 t检验或变量变换或秩和检验等方法。Z 检验是一般用于大样本(即样本容量大于 30)平均值差异性检验的方法。上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检验方法。编辑假设检验的基本思想假设检验的基本思想假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(P0.01 或 P3.48,也就是在 50个样品中抽到 4 个不合格品才能判整批为不合格。而如果我们改变 的取值,也就是我们定义的小概率的取值,比如说取 0.01,认为概率不超过 0.01 的事件发生了就是不合理的了,那又会怎样呢?还是用上面的公式计算,则得出,解得x4.30,也就是在 50 个样品中抽到 5 个不合格品才能判整批为不合格。检验要求是不合格品率 P 不能超过 3%,而现在根据 0.01,算出来 50 个样品中抽到 5 个不合格品才能判整批为不合格,会不会犯错误啊!假设检验是根据样本的情况作的统计推断,是推断就会犯错误,我们的任务是控制犯错误的概率。在假设检验中,错误有两类:第一类错误(拒真错误):原假设 H0 为真(批产品质量是合格的),但由于抽样的随机性(抽到过多的不合格品) ,样本落在拒绝域 W 内,从而导致拒绝H0(根据样本的情况把批质量判断为不合格)。其发生的概率记为 ,也就是显著性水平。 控制的其实是生产方的风险,控制的是生产方所承担的批质量合格而不被接受的风险。第二类错误(取伪错误):原假设 H0 不真(批产品质量是不合格的),但由于抽样的随机性(抽到过少的不合格品),样本落在 W 外,从而导致接受 H0(根据样本的情况把批质量判断为合格)。其发生的概率记为 。 控制的其实是使用方的风险,控制的是使用方所承担的接受质量不合格批的风险。再回到刚刚计算的上例的情况, 由 0.05 变化为 0.01,我们对批质量不合格的判断由 50 个样本中出现 4 个不合格变化为 5 个,批质量是合格的而不被接受的风险就小了,犯第一类错误的风险小了,也就是生产方的风险小了;但同时随着 的减小对批质量不合格的判断条件其实放宽了50 个样本中出现 4 个不合格变化为 5 个,批质量是不合格的而被接受的风险大了;犯第二类错误的风险大了,也就是使用方的风险大了。在相同样本量下,要使 小,必导致 大;要使 小,必导致 大,要同时兼顾生产方和使用方的风险是不可能的。要使 、 皆小,只有增大样本量,这又增加了质量成本。因此综上所述,假设检验可以告诉我们如何科学地进行质量合格判定,又告诉我们要兼顾生产方和使用方的质量风险,同时考虑质量和成本的问题。显著性检验显著性检验出自出自 MBA MBA 智库百科智库百科( (http:/ )显著性检验(显著性检验(Significance TestingSignificance Testing)目录目录显示编辑什么是显著性检验什么是显著性检验显著性检验显著性检验就是事先对总体 (随机变量) 的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设(原假设)是否合理,即判断总体的真实情况与原假设是否显著地有差异。或者说,显著性检验要判断 样本与我们对总体所做的假设之间的差异是纯属机会变异, 还是由我们所做的假设与总体真实情况之间不一致所引起的。显著性检验是针对我们对总体所做的假设做检验,其原理就是“小概率事件实际不可能性原理”来接受或否定假设。抽样实验会产生抽样误差,对实验资料进行比较分析时,不能仅凭两个结果(平均数或率)的不同就作出结论,而是要进行统计学分析,鉴别出两者差异是抽样误差引起的,还是由特定的实验处理引起的。编辑显著性检验的含义显著性检验的含义显著性检验即用于实验处理组与对照组或两种不同处理的效应之间是否有差异,以及这种差异是否显著的方法。常把一个要检验的假设记作H0,称为原假设(或零假设) (nullhypothesis) ,与H0对立的假设记作H1,称为备择假设(alternativehypothesis) 。 在原假设为真时,决定放弃原假设,称为第一类错误,其出现的概率通常记作 ; 在原假设不真时,决定接受原假设,称为第二类错误,其出现的概率通常记作 。通常只限定犯第一类错误的最大概率 , 不考虑犯第二类错误的概率 。这样的假设 检验又称为显著性检验,概率 称为显著性水平。最常用的 值为 0.01、0.05、0.10 等。一般情况下,根据研究的问题,如果犯弃真错误损失大,为减少这类错误, 取值小些 ,反之, 取值大些。编辑显著性检验的原理显著性检验的原理无效假设显著性检验的基本原理是提出“无效假设”和检验“无效假设”成立的机率(P)水平的选择。所谓“无效假设”,就是当比较实验处理组与对照组的结果时,假设两组结果间差异不显著,即实验处理对结果没有影响或无效。经统计学分析后,如发现两组间差异系抽样引起的,则“无效假设”成立,可认为这种差异为不显著(即实验处理无效) 。若两组间差异不是由抽样引起的,则“无效假设”不成立,可认为这种差异是显著的(即实验处理有效)。“无效假设”成立的机率水平检验“无效假设”成立的机率水平一般定为 5%(常写为 p0.05),其含义是将同一实验重复 100 次,两者结果间的差异有5 次以上是由抽样误差造成的,则“无效假设”成立,可认为两组间的差异为不显著,常记为 p0.05。若两者结果间的差异 5 次以下是由抽样误差造成的,则“无效假设”不成立,可认为两组间的差异为显著,常记为 p0.05。如果 p0.01,则认为两组间的差异为非常显著。编辑显著性检验的相关概念显著性检验的相关概念编辑原假设和备择假设原假设和备择假设1 1、原假设:对总体所作的论断或推测,指观察到的差异只反映机会变异。记作H0。2 2、备择假设:是指观察到的差异是真实的。记作H1。3 3、原假设和备择假设合在一起,应涵盖我们所研究的总体特征的所有可能性。编辑双尾检验和单尾检验双尾检验和单尾检验采用双尾检验还是采用单尾检验(以及左单尾还是右单尾),取决于备择假设的形式。表 1:拒绝域的单、双尾与备择假设之间的对应关系拒绝域位置拒绝域位置原假设原假设备择假设备择假设双尾H0: = 0左单尾(不可能有 0时,H0: = 0)H1: 0右单尾编辑(不可能有 0显著性检验的作用显著性检验的作用分析工作者常常用标准方法与自己所用的分析方法进行对照试验 ,然后用统计学方法检验两种结果是否存在显著性差异。 若存在显著性差异而又肯定测定过程中没有错误,可以认定自己所用的方法有不完善之处,即存在较大的 系统误差。因此分析结果的差异需进行统计检验或显著性检验。编辑显著性检验的基本思想显著性检验的基本思想显著性检验的基本思想可以用小概率原理来解释。1 1、小概率原理:小概率事件在一次试验中是几乎不可能发生的,假若在一次试验中事件 事实上发生了。那只能认为事件 不是来自我们假设的总体,也就是认为我们对总体所做的假设不正确。2 2、观察到的显著水平:由样本资料计算出来的检验统计量观察值所截取的尾部面积为。这个概率越小,反对原假设,认为观察到的差异表明真实的差异存在的证据便越强,观察到的差异便越加理由充分地表明真实差异存在。3 3、检验所用的显著水平:针对具体问题的具体特点,事先规定这个检验标准。4 4、在检验的操作中,把观察到的显著性水平与作为检验标准的显著水平标准比较,小于这个标准时,得到了拒绝原假设的证据,认为样本数据表明了真实差异存在。大于这个标准时,拒绝原假设的证据不足,认为样本数据不足以表明真实差异存在。5 5、检验的操作可以用稍许简便一点的作法:根据所提出的显著水平查表得到相应的 值,称作临界值,直接用检验统计量的观察值与临界值作比较,观察值落在临界值所划定的尾部内,便拒绝原假设;观察值落在临界值所划定的尾部之外,则认为拒绝原假设的证据不足。编辑显著性检验的两类错误显著性检验的两类错误1 1、显著性检验中的第一类错误及其概率、显著性检验中的第一类错误及其概率显著性检验中的第一类错误是指,原假设H0: = 0事实上正确,可是检验统计量的观察值却落入拒绝域 , 因而否定了本来正确的假设 。 这是弃真的错误 。发生第一类错误的概率(记作 )也就是当原假设H0: = 0正确时检验统计量的观察值落入拒绝域的概率。显然,在双尾检验时是两个尾部的拒绝域面积之和;在单尾检验时是单尾拒绝域的面积。2 2、显著性检验中的第二类错误及其概率、显著性检验中的第二类错误及其概率显著性检验中的第二类错误是指,原假设H0: = 0不正确,而备择假设H1: 0是正确的,可是检验统计量的观察值却落入了接受域,因而没有否定本来不正确的原假设。这是取伪的错误。发生第二类错误的概率(记作 )是指,把来自样本值代入检验统计量所得结果落入接受域的概率。3、 和 的关系的总体的当样本容量一定时, 越小, 就越大;反之, 越大, 就越小。编辑显著性检验的显著性检验的 P P 值值11若用计算机统计软件进行假设检验, 我们会见到 P值。将算得检验统计量样本值查表得的概率是就是 P 值(在那里我们称之为观察到的显著水平)。P P 值是怎么来的值是怎么来的从某总体中抽样所得的样本,其参数会与总体参数有所不同,这可能是由于两种原因:、这一样本是由该总体抽出,其差别是由抽样误差所致;、这一样本不是从该总体抽出,所以有所不同。如何判断是那种原因呢?统计学中用显著性检验赖判断。其步骤是:、建立检验假设(又称无效假设,符号为H0):如要比较A 药和 B 药的疗效是否相等,则假设两组样本来自同一总体,即A 药的总体疗效和 B 药相等,差别仅由抽样误差引起的碰巧出现的。、选择适当的统计方法计算 H0 成立的可能性即概率有多大,概率用 P 值表示。、根据选定的显著性水平(0.05 或 0.01),决定接受还是拒绝 H0。如果 P0.05,不能否定“差别由抽样误差引起”,则接受 H0;如果 P0.05或 P 0.01,可以认为差别不由抽样误差引起,可以拒绝 H0,则可以接受令一种可能性的假设(又称备选假设,符号为 H1),即两样本来自不同的总体,所以两药疗效有差别。统计学上规定的统计学上规定的 P P 值意义见下表值意义见下表P P 值值碰巧的概率碰巧的概率对无效假设对无效假设统计意义统计意义P0.05碰巧出现的可能性大于 5%不能否定无效假两组差别无显著意义设P0.05碰巧出现的可能性小于 5%可以否定无效假两组差别有显著意义设P 0.01碰巧出现的可能性小于 1%可以否定无效假 两者差别有非常显著设意义理解 P 值,下述几点必须注意:P 的意义不表示两组差别的大小,P 反映两组差别有无统计学意义,并不表示差别大小。因此,与对照组相比,C 药取得 P0.05,D 药取得 P 0.01 并不表示 D 的药效比 C 强。 P0.05 时,差异无显著意义,根据统计学原理可知,不能否认无效假设,但并不认为无效假设肯定成立。在药效统计分析中,更不表示两药等效。哪种将“两组差别无显著意义”与“两组基本等效”相同的做法是缺乏统计学依据的。统计学主要用上述三种 P 值表示,也可以计算出确切的 P 值,有人用 P 0.001,无此必要。显著性检验只是统计结论。判断差别还要根据专业知识。编辑显著性检验的结果显著性检验的结果关于显著性检验的结果:( (一一) )显著性检验回答什么问题显著性检验回答什么问题我们所观察到的差异(是纯属于机会变异,还是反映了真实的差异?1、如果显著性检验得到差异显著的结论这时并不能评价差异的大小和重要性。2、显著性检验只能告诉我们差异是否在事实上存在,而不能回答差异产生的原因。3、显著性检验不能检查我们对实验所作的设计是否有缺陷( (二二) )显著性检验回答问题的方式显著性检验回答问题的方式在表述显著性检验结论的时候,应与检验的逻辑推理相符。当检验统计量的观察值落在拒绝域时,我们应该说,样本资料显著地 (或高度显著地)表明,差异是存在的。( (三三) )对观察到的显著水平数值的评价对观察到的显著水平数值的评价编辑显著性检验中的总体和样本显著性检验中的总体和样本1 1、显著性检验的对象是无限总体。2 2、大样本可能会使检验统计量过分敏感。3 3、从有限总体中抽取样本用于显著性检验时,必须作概率抽样。编辑显著性检验的步骤显著性检验的步骤显著性检验的一般步骤或格式,如下:1 1、提出假设、提出假设H0:_H1:_同时 , 与备择假设相应 , 指出所作检验为双尾检验还是左单尾或右单尾检验 。2 2、构造检验统计量,收集样本数据,计算检验统计量的样本观察值。3 3、根据所提出的显著水平 ,确定临界值和拒绝域。4 4、作出检验决策。把检验统计量的样本观察值和临界值比较 , 或者把观察到的显著水平与显著水平标准比较;最后按检验规则作出检验决策。当样本值落入拒绝域时,表述成:“拒绝原假设”,“显著表明真实的差异存在”;当样本值落入接受域时,表述成:“没有充足的理由拒绝原假设”,“没有充足的理由表明真实的差异存在”。另外,在表述结论之后应当注明所用的显著水平。编辑总体均值为某定值的显著性检验总体均值为某定值的显著性检验总体均值的显著性检验可有双尾、左单尾、右单尾三种不同的情况。下面就总体分布的不同情况,总体方差是否已知的不同情况以及样本大小的不同情况分别介绍检验统计量和检验规则。一、总体为正态分布,总体方差已知,样本不论大小对于假设:H0: = 0,在H0成立的前提下,有检验统计量如果规定显著性水平为 ,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:和;。二、总体分布未知,总体方差已知,大样本对于假设H0: = 0,在H0成立的前提下,如果样本足够大(n30),近似地有检验统计量如果规定显著性水平为 a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为和;。三、总体为正态分布,总体方差未知,小样本对于假设H0: = 0,在H0成立的前提下,有检验统计量如果规定显著性水平为 a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:;和。;四、总体分布未知,总体方差未知,大样本对于假设H0: = 0,在H0成立的前提下,如果总体偏斜适度,且样本足够大,近似地有检验统计量如果规定显著性水平为 a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为:编辑和; ;总体比例为某定值的显著性检验总体比例为某定值的显著性检验总体比例指的是随机试验中某种指定事件出现的概率 。随机试验中某种指定事件出现叫做“成功”,把一次试验中成功的概率记作 。对于假设H0: = 0,在H0成立的前提下,如果本容量足够大,大到足以满足,并且样时,近似地有检验统计量其中 p 是样本比例。如果规定显著性水平为 a,在双尾,左单尾,右单尾三种不同情形下,拒绝域分别为: 编辑和;。显著性检验应注意的问题显著性检验应注意的问题进行显著性检验还应注意以下几个问题:1、要有合理的试验设计和准确的试验操作,避免 系统误差、降低试验误差,提高试验的准确性和精确性。2、选用的显著性检验方法要符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所选用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其应用条件和适用范围。3、选用合理的统计假设。进行显著性检验时,无效假设和备择假设的选用,决定了采用两尾检验或是一尾检验。4、正确理解显著性检验结论的统计意义 。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在实际应用上一定就有重要或很重要的价值。“显著”或“极显著”是指表面差异为试验误差可能性小于 0.05 或 0.01,已达到了可以认为存在真实差异的显著水平。有些试验结果虽然表面差异大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果虽然表面差异小,但由于试验误差小,反而可能推断为“差异显著”。显著水平的高低只表示下结论的可靠程度的高低,即在 0.01 水平下否定无效假设的可靠程度为 99,而在 0.05 水平下否定无效假设的可靠程度为 95%。“差异不显著”是指表面差异为试验误差可能性大于统计上公认的概率水平 0.05,不能理解为没有差异。下“差异不显著”的结论时,客观上存在两种可能:一是无本质差异,二是有本质差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本容量,则可能表现出差异显著性。显著性检验只是用来确定无效假设能否被否定,而不能证明无效假设是正确的。5、统计分析结论的应用,还要与经济效益等结合起来综合考虑。编辑常用显著性检验常用显著性检验1.t 检验适用于计量资料、正态分布、方差具有齐性的两组间小样本比较。包括配对资料间、样本与均数间、两样本均数间比较三种,三者的计算公式不能混淆。2.t检验应用条件与 t 检验大致相同,但 t检验用于两组间方差不齐时,t检验的计算公式实际上是方差不齐时 t 检验的校正公式。3.U 检验应用条件与 t 检验基本一致,只是当大样本时用U 检验,而小样本时则用t检验,t 检验可以代替 U 检验。4.方差分析用于正态分布、方差齐性的多组间计量比较。常见的有单因素分组的多样本均数比较及双因素分组的多个样本均数的比较, 方差分析首先是比较各组间总的差异,如总差异有显著性,再进行组间的两两比较,组间比较用 q 检验或 LST检验等。5.X2 检验是计数资料主要的显著性检验方法。用于两个或多个百分比(率)的比较。常见以下几种情况:四格表资料、配对资料、多于2 行*2 列资料及组内分组 X2 检验。6.零反应检验用于计数资料。是当实验组或对照组中出现概率为0 或 100时,X2 检验的一种特殊形式。属于直接概率计算法。7.符号检验、秩和检验和 Ridit 检验三者均属非参数统计方法,共同特点是简便、快捷、实用。可用于各种非正态分布的资料、未知分布资料及半定量资料的分析。其主要缺点是容易丢失数据中包含的信息 。所以凡是正态分布或可通过数据转换成正态分布者尽量不用这些方法。8.Hotelling 检验用于计量资料、正态分布、两组间多项指标的综合差异显著性检验。编辑显著性检验的应用显著性检验的应用在市场调研中,由于人力、物力、时间等问题,一般都用 抽样调查的方法抽取一定数量的具有代表性的群体,得出样本数据来进行市场研究,并对市场总体特征进行统计推断,在这里面就会存在两个问题,一是样本的特征数量能否反映总体特征?二是 ,两种不同的样本的数量标志参数是否存在差异?只有解决这两个问题,才能正确的推断市场总体特征,也才能找出市场中不同特征群体的需求差异,这就需要统计学中的显著性检验来解决,由于显著性检验的功能在 数据分析中的重大作用,显著性检验在市场调研中得到了广泛的应用;但若不恰当的使用便会导致市场调研信息反应的歪曲或挖掘不充分;以下是我根据以往应用显著22性检验的经验而总结的一些关于如何恰当的应用统计检验的体会,仅供参考、讨论。要恰当的运用检验方法,我们需要做到以下几点:首先,了解各检验方法的适用范围及其特点。这也是正确使用检验方法的基本前提 , 只有了解各检验方法的基本思想及特点,才能正确选取适当的检验方法。许多统计检验方法的应用对总体有特殊的要求 ,如 t 检验要求总体符合正态分布,F 检验要求误差呈正态分布且各组方差整齐,等等。这些常用来估计或检验总体参数的方法,统称为参数统计。许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布) ,这类方法称非参数统计,相应的,统计检验总体分为参数检验和非参数检验。在选择参数与非参数检验时,首要考虑是数据的分布情况,能确定分布类型的,则可适当选用参数检验,参数检验主要包括包含的方法有:单样本T 检验、两独立样本T 检验、两配对样本T 检验;非参数由于不限制分布,统计方法简便,适用性强,但检验效率较低,应用时应适当加以考虑,非参数检验主要涉及五个方面,即单样本、两独立样本、两配对样本、多独立样本、多配对样本的非参数检验。不同的检验方法,比较的统计量是不同的。T 检验等检验方法都是比较的均值;卡方检验、K-S 检验等比较频数;曼惠特尼 U 检验等是对秩进行比较;符号检验法比较的是前后变化差值的符号、 而符号秩检验法则是对差值及符号一同比较的检验。其次,认清研究目的。研究目的是市场调研中一切实务的根本出发点 ,做数据分析时同样首要考虑的是研究目的,研究目的也是数据分析的方向,但此时研究目的需要细化,具体到要通过哪些数据、得到什么信息、何种结果的问题,如希望通