[精选]双样本置信区间和假设检验1.pptx
第第4局部局部:置信区间置信区间和和假设检验假设检验第第第第4 4局部局部局部局部:双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验目的:目的:目标:目标:比较方差,采用 F-检验法、Bartlett检验法和Levene检验法。比较平均值,采用双样本置信区间和假设检验。理解统计重要性和实际重要性之间的区别。本章的目的是使用假设检验假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性。位于洗衣机上的传动装置的总高度将影响制动性能。我们所关心的CTQ是总高度总高度,目标值=5.394英寸。有8个不同的固定架用于固定该部件以便加工。您想了解一些什么?固定架是否为重要的固定架是否为重要的X变量?变量?分析步骤:1.将数据制成图表,并观察差异。2.使用假设检验和置信区间来确定此差异是否确实存在。3.得出结论。翻开翻开Minitab中的文件中的文件“lth L:6SigmaMinitabTrainingMinitabSession 2lth.mtw举例举例举例举例.总高度总高度总高度总高度-数据列表数据列表数据列表数据列表第一步第一步-制图制图数据显示数据显示行设备 1 设备 2 设备 3 设备 4 设备 5 设备 6 设备 7 设备 8 15.3905.3875.3945.3885.3865.3885.3885.388 25.3895.3875.3945.3895.3845.3885.3895.389 35.3905.3875.3935.3885.3855.3885.3885.388 45.3895.3875.3945.3905.3855.3885.3885.388 55.3885.3885.3945.3895.3845.3885.3885.388 65.3915.3885.3955.3925.3875.3915.3915.390 75.3915.3895.3965.3915.3885.3915.3925.391 85.3915.3895.3975.3915.3875.3915.3915.390 95.3915.3885.3955.3915.3875.3905.3895.389 105.3895.3875.3955.3905.3875.3905.3895.390变量N平均值中值Tr平均值 标准方差 SE平均值设备1105.38995.39005.39000.00110.0003设备2105.38775.38755.38760.00080.0003设备3105.39475.39455.39460.00120.0004设备4105.38995.39005.38990.00140.0004设备5105.38605.38655.38600.00140.0004设备6105.38935.38905.38920.00140.0004设备7105.38935.38905.38910.00150.0005设备8105.38915.38905.38900.00110.0003方框图可以提供设备间的差异图方框图可以提供设备间的差异图方框图可以提供设备间的差异图方框图可以提供设备间的差异图设备设备3和和5的的平均值明显不同平均值明显不同设备设备2的标准差的标准差是否不同是否不同?从图形中可得出答案。假设检验假设检验给出了答案的统计置信度GraphBoxplot目标值目标值=5.394观察数据的另一种方式观察数据的另一种方式抖动的分布图抖动的分布图抖动的分布图抖动的分布图8765432105.3955.3905.385固定架总高度目标值5.394采用假设检验法来分析差异采用假设检验法来分析差异是实实在在的还是偶然发生的是实实在在的还是偶然发生的您想知道什么?您想知道什么?您想知道什么?您想知道什么?1.方差:方差:统计问题统计问题-不同不同固定架方差之间看上去明显的差异是实际固定架方差之间看上去明显的差异是实际存在还是偶然发生的?存在还是偶然发生的?实际问题实际问题-我们是否应该努力制造象我们是否应该努力制造象2号那样的固定架,号那样的固定架,以减少方差?以减少方差?2.平均值平均值:统计问题统计问题-不同不同固定架均值之间看上去明显的差异是实际固定架均值之间看上去明显的差异是实际存在还是偶然发生的?存在还是偶然发生的?实际问题实际问题-我们是否应该努力制造象我们是否应该努力制造象3号那样的固定架,号那样的固定架,以使它们接近目标值?以使它们接近目标值?根据您希望比较的内容选择假设检验法根据您希望比较的内容选择假设检验法采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还是偶然发生?是偶然发生?是偶然发生?是偶然发生?比较方差比较方差 F检验法 2个方差 Bartlett检验法 用于正态数据 Levene检验法 用于非正态数据比较平均值比较平均值 双样本 t 成对t1.2.为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?在六个西格玛工程中,我们使用图形和假设检验来筛选筛选少数关键Xs。假设检验假设检验有助于确定差异是确实存在,还是偶然确实存在,还是偶然发生发生。置信区间置信区间给出总体值参数最可能的取值范围。最可能的取值范围。所有 潜在“Xs关键少数关键少数关键少数关键少数 “X Xs s为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?由于所有数据均存在偏差,因此,即使总体是一样的,样本数据也会存在细微差异。让我们来看一看在生成一些随机数据无规律的数据时会发生什么情况。1.产生产生8组随机数据组随机数据翻开新的工作表:File New.Minitab Worksheet OK生成10行数据。保存在c1-c8栏中。Calc Random data Normal为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?2.在一栏中进行叠加。在一栏中进行叠加。Manip Stack/Unstack Stack叠加c1-c8。将叠加的数据保存在c9。在10中存储下标。为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?3.将数据制图,并寻找差异将数据制图,并寻找差异。Graph Boxplot制作c9 Y和c10 X,固定架的比照图。为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?4.请注意,样本平均值和方差存在着差异,即使所有8组数据都取自同一总体也不例外。有些统计程序的前提条件是方差相同,而大多数程序对这一假并不敏感,因此,它通常不是我们所关心的问题。如果您利用Minitab进行双样本t检验,它将问您是否假设方差相同。您可以使用方差检验来作出判断。比较方差比较方差比较方差比较方差何时应该比较方差?何时应该比较方差?如果您对改变了工序,并想确定输出结果中的方差是否改变,您可以将工序改变前后的方差进行比较。比较方差比较方差-3种方法种方法1.比较2个个 方差,假定为正态正态 分布2.一次比较多个多个方差,假定为正态正态 分布。3.一次比较多个多个方差,采用非正态非正态数据。F-检验(手动),或Bartlett检验(采用Minitab)Bartlett检验(Minitab)Levene检验(Minitab)手工计算的手工计算的F-检验检验 比较2个方差计算F=s12/s22,其中 s12 =两个样本方差中较大的方差,和 s22 =两个样本方差中较小的方差如果计算的F值比表格中的F值更大,则否认零假设并接受存在差异举例举例:比较固定架比较固定架1和固定架和固定架2的方差的方差s1=.00110 固定架1的标准方差s2=.000823固定架2的标准方差每个样本的容量为10-各自的自由度为9。计算的F=.001102/.0008232 =1.79分子的自由度为9、分母的自由度为9的F分布临界值为3.18,由F表格中得出。计算的F值比表格的F值小,因此,无法拒绝方差相等这个零假设。结论:没有足够的证据来以结论:没有足够的证据来以95%的置信度的置信度说明方差已经改变。说明方差已经改变。F表格表格分子自由度分子自由度分子自由度分母自由度课堂练习课堂练习:手工计算手工计算F-检验检验 F=s12/s22其中 s12 =一个分布的方差两个样本方差中的较大方差 s22 =另一分布的方差两个样本方差中的较小方差比较固定架比较固定架7和固定架和固定架8的方差的方差s7=.00149 固定架7的标准方差s8=.00110固定架8的标准方差每个样本的容量为10。分子的自由度是多少?分母的自由度是多少?F表格的临界值是多少?哪个方差值更大,而应置于分子?计算的F是多少?计算的F值是否比表格的F值大?您的结论是什么?您有证据能够以95%的置信度来说明固定架7和固定架8之间的方差不同吗?方差齐性 StatANOVAHomogeneity of Variance Bartlett检验法-正态数据 Levene检验法-非正态数据采用采用采用采用MinitabMinitab比较方差比较方差比较方差比较方差Ho:12=22 =.=k2 p 时无法拒绝 HoHa:i2=j2 至少一对 p ANOVAHomogeneity of Variance0.00050.00150.00250.0035西格玛的95%置信区间Bartlett检验法检验统计值:4.298P-值 :0.745Levene检验法检验统计值:0.818P-值 :0.576因素级别12345678总高度的方差齐性统计结论:统计结论:我们无法得出8个固定架之间的方差存在差异的结论。我们在图形中观察到的差异可能是由于偶然因素而发生的。实际结论:实际结论:不应该将所有固定架都制造成象设备2那样来减少方差。方差齐性检验方差齐性检验P值值 .05,无法拒绝无法拒绝 Ho我们现在转向我们现在转向我们现在转向我们现在转向平均值平均值平均值平均值您希望知道什么您希望知道什么您希望知道什么您希望知道什么?统计问题统计问题-固定架之间方差的明显差异是实际存在还是固定架之间方差的明显差异是实际存在还是偶然出现的?偶然出现的?实际问题实际问题-是否应该努力制造是否应该努力制造3号那样的固定架,以使其号那样的固定架,以使其均值接近目标值?均值接近目标值?目标值5.394现在转向现在转向现在转向现在转向双双双双样本样本样本样本t t 单样本比较单样本比较将一组数据与标准值比较双样本比较双样本比较 两组数据互相比较Bill MarkBill par为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?单样本比较单样本比较将一组数据与标准值比较。双双样本比较样本比较互相比较两组数据Ho:1=2或者:Ho:1-2=0如果如果 1-2 的置信区间不包括的置信区间不包括0,则说明,则说明 1 和和 2 之间之间的差异是的差异是显著的。显著的。单击单击“Graphs点击两次点击两次“OK运行运行采用采用采用采用MinitabMinitab进行进行进行进行“双样本双样本双样本双样本t t,以比较两个固定架以比较两个固定架以比较两个固定架以比较两个固定架假设是什么假设是什么?Ho:Ha:选择选择Ha 单单侧侧或或 双侧双侧StatBasic Statistic2-Sample t如果如果F检验未拒绝检验未拒绝Ho,单击,单击“Assume Equal Variance比较固定架比较固定架1与固定架与固定架3:单击单击“Boxplotsof dataP值值 .05;拒绝拒绝Ho MinitabMinitab给出了置信区间给出了置信区间给出了置信区间给出了置信区间和假设检验和假设检验和假设检验和假设检验Ho 和和 Ha的假设的假设 1-2的置信区间的置信区间 不包括不包括0.0置信区间的说明置信区间的说明置信区间的说明置信区间的说明平均值差异的最可能估计值为:5.3899-5.3947=-0.0048.实际差异实际差异 如果我们包括总体的所有数据可能大于该值,也可能小于该值。我们有95%的置信度的置信度说明实际值在 -0.00586和-0.00374之间。这是总体差异的近似值范围近似值范围 与数据一致的数值。以这种方式组成的区间中有95%的区间包含实际总体值您出错的机率是5%。0.0不在该区间内,因此,我们可以有力的证明固定架之间的差异确实存在,而不是偶然出现。这意味着我们可以否认2个平均值是相等这一零假设 Ho:1=2 or 1-2=0。P值值大于大于Ha:Window Close all graphs点击“Data 窗口中的任意位置,然后点击右上角的“X。在在Minitab中翻开文件中翻开文件“ttests L:6SigmaMinitabTrainingMinitabSession 2Ttest.mtw您的工作表将如下所示:您的工作表将如下所示:您的工作表将如下所示:您的工作表将如下所示:此处键入标题描述性统计描述性统计Variable N Mean Median Tr Mean StDev SE Meancalip1 12 0.26625 0.26650 0.26620 0.00122 0.00035calip2 12 0.26600 0.26550 0.26590 0.00176 0.00051diff 12 0.00025 0.00050 0.00040 0.00201 0.00058 为何采用成对为何采用成对为何采用成对为何采用成对t?t?为何使用为何使用?为了降低变异性 部件间的差异 并作出更精确的估测更精确的估测 更小的置信区间。您希望知道什么您希望知道什么?卡钳的测量结果是否相同。何时采用成对检验何时采用成对检验?对同一件试验单元同一件试验单元或在相似条件下进行两次测量。在此例中,对同一部件进行了两次测量。每行数据都有匹配内容时 举例:-外罩在喷漆前后的平整度 -话务员在受培训前后的成绩假设假设 Ho:1-2=0Ha:1-2=0Ha:1-2 0对于Minitab中的双样本t检验,在各独立栏中输入两次测量结果。首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形差异直方图 c9一些差异是正数卡钳1更高,而一些差异是负数卡钳2更高。差异的平均值是否明显不同于0?首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形卡钳2与卡钳1的分布图单击Options添加抖动度首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形卡钳2与卡钳1的分布图单击Frame 和Min/Max 显示相同的X和Y轴范围首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形首先将数据绘制成图形卡钳2与卡钳1的分布图具有抖动轴刻度相等均等线 卡钳1=卡钳2一些点位于均等线之上和之下。有时卡钳1的测量值更高;有时卡钳2的测量值更高。下面,利用单样本下面,利用单样本下面,利用单样本下面,利用单样本t t检验来检验其差值以比较检验来检验其差值以比较检验来检验其差值以比较检验来检验其差值以比较两个样本的平均值两个样本的平均值两个样本的平均值两个样本的平均值假设是什么假设是什么?Ho:Ha:拒绝的标准是什么拒绝的标准是什么?“0 位于位于C.I.之内之内;无法拒绝无法拒绝Ho必须使用两必须使用两种测量方式种测量方式的差值来进的差值来进单样本单样本t检验检验我们不能说两个卡钳测量结果的平均我们不能说两个卡钳测量结果的平均值不同值不同StatBasic Statistics1-Sample t置信区间置信区间Variable N Mean StDev SE Mean 95.0%CI diff 12 0.00025 0.00201 0.00058 -0.00102,0.00152问题方法平均值的取值范围是什么?单样本置信区间平均值是否与假设值不同?单样本假设检验2个平均值之间差异的取值范围两个平均值之间差异的置是什么?信区间 两个总体的平均值是否相同?双样本假设检验对于成对数据,数据,两个样本的平均值成对t检验,以及差异的是否相同 置信区间。您想知道平均值的哪些内容您想知道平均值的哪些内容您想知道平均值的哪些内容您想知道平均值的哪些内容?问题说明问题说明呼叫中心不可用性的变化范围广,平均值为53%。这导致应答率很低,造成客户不满意。CTQ:客户关系不可用性测量结果测量结果:每日的不可用时间缺陷缺陷:一日的可用时间 35%单位单位:每日,M-F时机时机:每日,M-F客户客户:呼入的客户课堂练习课堂练习课堂练习课堂练习翻开文件翻开文件CALLCNTRL:6sigmaMinitabTrainingMinitabSession 2CALLCNTR.mtw使用C2与C6栏中的数据相互比较这三个呼叫中心的不可用性。首先将数据绘制成图形。使用假设检验来确定3个呼叫中心可用性的方差和平均值之间是否存在显著差异。在运行某些例行程序之间,您需要对数据进行“退栈:Manip Stack/Unstack Unstack在“不可用性中对数据进行退栈存储在数据栏c14-c16中使用数据栏2中的下标3个呼叫中心个呼叫中心1.中心A 24样本2.中心B 24样本3.中心C 12样本关键概念关键概念关键概念关键概念:-:-第第第第4 4局部局部局部局部双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验方差F-检验是比较2个方差的假设检验 在Minitab中,方差检验称为“方差齐性 Bartlett检验法比较正态数据的方差 Levene检验法比较非正态数据的方差平均值 t-检验用于比较2个数据组的平均值 成对t-检验比较数据成对时两个总体的平均值差异置信区间 总体参数的取值范围 与数据一致的值关键概念关键概念关键概念关键概念:-:-第第第第4 4局部局部局部局部双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验 统计风险 错误:将实际上相同的东西误认为存在差异在装配线上拒绝好的部件 风险:产生错误的风险 根据惯例,风险为5%或 =0.05P值:所观察到的显著性水平。在总体值相同的情况下,观察到存在这么大差异的机率。如果所观察到的显著性水平“p小于可接受的风险“,则接受Ha拒绝Ho。如果所观察到的显著性水平“p大于可接受的风险“,则拒绝Ha无法拒绝Ho。附录附录假设检验术语假设检验术语假设检验术语假设检验术语 1.零假设零假设 Ho-不存在变化或差异的命题。如果没有充分的证据拒绝它,就假设这一命题是真的。2.备择假设择假设Ha-存在变化或差异的命题。如果拒绝Ho,则认为这一命题是真的。3.一类错误一类错误-当Ho 实际上为真时而被拒绝所产生的错误,或是接受存在差异、但事实上却没有差异时所犯的错误。4.风险风险-出现第一类错误的最大风险或机率。这个机率总是大于零,通常为5%。研究人员决定拒绝Ho 所可以接受的最大风险。5.显著水平显著水平-同风险。6.二类错误二类错误-当Ho 实际上为伪而没有被拒绝所产生的错误,或是接受没有差异、但事实上存在差异时所犯的错误。7.风险风险-二类错误出现的风险或机率,或者是说,忽略了问题的有效处理或解决方案。8.显著性差异显著性差异-用于描述统计假设检验结果的术语,即:差异大得不能合理地归因于偶然因素。9.成效成效-统计检验能力,以检查出差异,或正确地拒绝Ho 的机率。通常用来确定样本大小是否足以检查出数据之间的差异。10.检验统计值检验统计值-标准化数值z、t、F等,代表Ho 的可行性,它以的方式分布,因此可以确定这种观察值出现的机率。通常,Ho 的可行性越高,则检验统计值的绝对值就越小,在这种分布范围内观察到这个值的机率也就越大。B14.8T T分布的单侧使用分布的单侧使用分布的单侧使用分布的单侧使用实际的总体均值小于实际的总体均值小于UCL这一结论具有这一结论具有95%的可信度。如果我们观察到的样本平均的可信度。如果我们观察到的样本平均值大于值大于UCL,则我们可能会得出这样的结论:这种情况由于随机因素而发生的机率则我们可能会得出这样的结论:这种情况由于随机因素而发生的机率为为5%抽样误差。抽样误差。5%df=4抽样平均值的分布t=2.132UCL拒绝Ho接受HoX风险95%95%95%置信区间置信区间置信区间置信区间Copyright 1995 Six Sigma Academy Inc.UCL=X+tnUCL=X+2.1325B14.9T T分布的双侧使用分布的双侧使用分布的双侧使用分布的双侧使用实际的总体平均值包含在给定的置信区间内这一结论的可信度为95%。如果我们观察到的样本平均值大于UCL 或小于LCL,则我们可能会得出这样的结论:随机发生这类事件的机率为5%样本方差。2.5%df=4抽样平均值的分布UCLX2.5%95%LCL95%95%置信区间置信区间置信区间置信区间风险风险 t=2.776t=2.776备注:备注:T表格列出了曲线表格列出了曲线的一半数据,因此使用的一半数据,因此使用97.5%的表格数值。的表格数值。LCL=X t/2nLCL=X 2.776UCL=X+t/2UCL=X+2.776拒绝 Ho接受 Ho拒绝 HoCopyright 1995 Six Sigma Academy Inc.5n51.设备设备1与设备与设备5的比较的比较假设是什么?Ho:设备1=设备 5Ha:设备 1=设备 5拒绝的标准是什么?p .05,无法拒绝 Hop .05,无法拒绝Hop ANOVAHomogeneity of Variance Factor=Center我们确实确实有证据得出这样的结论:呼叫中心的方差间存在差异!6.426.42页的课堂练习答案页的课堂练习答案页的课堂练习答案页的课堂练习答案:首先用图表比较首先用图表比较:框图框图不可用性与中心不可用性与中心,不可用性与班次不可用性与班次中心与中心之间看上去存在差异一定要在Y轴上注明刻度运行双样本运行双样本运行双样本运行双样本t t检验来对中心之间进行比较:检验来对中心之间进行比较:检验来对中心之间进行比较:检验来对中心之间进行比较:无法无法证明中心证明中心A和中心和中心B之间存在统计差异之间存在统计差异!无法无法证明中心证明中心A和中心和中心C之间存在统计差异之间存在统计差异!中心中心B和中心和中心C之间之间存在存在统计差异统计差异!9、静夜四无邻,荒居旧业贫。4月-234月-23Monday,April 17,202310、雨中黄叶树,灯下白头人。21:53:1321:53:1321:534/17/2023 9:53:13 PM11、以我独沈久,愧君相见频。4月-2321:53:1321:53Apr-2317-Apr-2312、故人江海别,几度隔山川。21:53:1321:53:1321:53Monday,April 17,202313、乍见翻疑梦,相悲各问年。4月-234月-2321:53:1321:53:13April 17,202314、他乡生白发,旧国见青山。17 四月 20239:53:13 下午21:53:134月-2315、比不了得就不比,得不到的就不要。四月 239:53 下午4月-2321:53April 17,202316、行动出成果,工作出财富。2023/4/17 21:53:1321:53:1317 April 202317、做前,能够环视四周;做时,你只能或者最好沿着以脚为起点的射线向前。9:53:13 下午9:53 下午21:53:134月-239、没有失败,只有暂时停止成功!。4月-234月-23Monday,April 17,202310、很多事情努力了未必有结果,但是不努力却什么改变也没有。21:53:1321:53:1321:534/17/2023 9:53:13 PM11、成功就是日复一日那一点点小小努力的积累。4月-2321:53:1321:53Apr-2317-Apr-2312、世间成事,不求其绝对圆满,留一份缺乏,可得无限完美。21:53:1321:53:1321:53Monday,April 17,202313、不知香积寺,数里入云峰。4月-234月-2321:53:1321:53:13April 17,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。17 四月 20239:53:13 下午21:53:134月-2315、楚塞三湘接,荆门九派通。四月 239:53 下午4月-2321:53April 17,202316、少年十五二十时,步行夺得胡马骑。2023/4/17 21:53:1321:53:1317 April 202317、空山新雨后,天气晚来秋。9:53:13 下午9:53 下午21:53:134月-239、杨柳散和风,青山澹吾虑。4月-234月-23Monday,April 17,202310、阅读一切好书如同和过去最杰出的人谈话。21:53:1421:53:1421:534/17/2023 9:53:14 PM11、越是没有本领的就越加自命非凡。4月-2321:53:1421:53Apr-2317-Apr-2312、越是无能的人,越喜欢挑剔别人的错儿。21:53:1421:53:1421:53Monday,April 17,202313、知人者智,自知者明。胜人者有力,自胜者强。4月-234月-2321:53:1421:53:14April 17,202314、意志坚强的人能把世界放在手中像泥块一样任意揉捏。17 四月 20239:53:14 下午21:53:144月-2315、最具挑战性的挑战莫过于提升自我。四月 239:53 下午4月-2321:53April 17,202316、业余生活要有意义,不要越轨。2023/4/17 21:53:1421:53:1417 April 202317、一个人即使已登上顶峰,也仍要自强不息。9:53:14 下午9:53 下午21:53:144月-23MOMODA POWERPOINTLorem ipsum dolor sit amet,consectetur adipiscing elit.Fusce id urna blandit,eleifend nulla ac,fringilla purus.Nulla iaculis tempor felis ut cursus.感感 谢谢 您您 的的 下下 载载 观观 看看专家告诉