[精选]双样本置信区间和假设检验1.pptx
《[精选]双样本置信区间和假设检验1.pptx》由会员分享,可在线阅读,更多相关《[精选]双样本置信区间和假设检验1.pptx(53页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4局部局部:置信区间置信区间和和假设检验假设检验第第第第4 4局部局部局部局部:双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验双样本置信区间和假设检验目的:目的:目标:目标:比较方差,采用 F-检验法、Bartlett检验法和Levene检验法。比较平均值,采用双样本置信区间和假设检验。理解统计重要性和实际重要性之间的区别。本章的目的是使用假设检验假设检验来检查两个总体的平均值和方差之间的差异是否存在统计显著性。位于洗衣机上的传动装置的总高度将影响制动性能。我们所关心的CTQ是总高度总高度,目标值=5.394英寸。有8个不同的固定架用于固定该部件以便加工。您想了解
2、一些什么?固定架是否为重要的固定架是否为重要的X变量?变量?分析步骤:1.将数据制成图表,并观察差异。2.使用假设检验和置信区间来确定此差异是否确实存在。3.得出结论。翻开翻开Minitab中的文件中的文件“lth L:6SigmaMinitabTrainingMinitabSession 2lth.mtw举例举例举例举例.总高度总高度总高度总高度-数据列表数据列表数据列表数据列表第一步第一步-制图制图数据显示数据显示行设备 1 设备 2 设备 3 设备 4 设备 5 设备 6 设备 7 设备 8 15.3905.3875.3945.3885.3865.3885.3885.388 25.389
3、5.3875.3945.3895.3845.3885.3895.389 35.3905.3875.3935.3885.3855.3885.3885.388 45.3895.3875.3945.3905.3855.3885.3885.388 55.3885.3885.3945.3895.3845.3885.3885.388 65.3915.3885.3955.3925.3875.3915.3915.390 75.3915.3895.3965.3915.3885.3915.3925.391 85.3915.3895.3975.3915.3875.3915.3915.390 95.3915.3885
4、.3955.3915.3875.3905.3895.389 105.3895.3875.3955.3905.3875.3905.3895.390变量N平均值中值Tr平均值 标准方差 SE平均值设备1105.38995.39005.39000.00110.0003设备2105.38775.38755.38760.00080.0003设备3105.39475.39455.39460.00120.0004设备4105.38995.39005.38990.00140.0004设备5105.38605.38655.38600.00140.0004设备6105.38935.38905.38920.0014
5、0.0004设备7105.38935.38905.38910.00150.0005设备8105.38915.38905.38900.00110.0003方框图可以提供设备间的差异图方框图可以提供设备间的差异图方框图可以提供设备间的差异图方框图可以提供设备间的差异图设备设备3和和5的的平均值明显不同平均值明显不同设备设备2的标准差的标准差是否不同是否不同?从图形中可得出答案。假设检验假设检验给出了答案的统计置信度GraphBoxplot目标值目标值=5.394观察数据的另一种方式观察数据的另一种方式抖动的分布图抖动的分布图抖动的分布图抖动的分布图8765432105.3955.3905.385固
6、定架总高度目标值5.394采用假设检验法来分析差异采用假设检验法来分析差异是实实在在的还是偶然发生的是实实在在的还是偶然发生的您想知道什么?您想知道什么?您想知道什么?您想知道什么?1.方差:方差:统计问题统计问题-不同不同固定架方差之间看上去明显的差异是实际固定架方差之间看上去明显的差异是实际存在还是偶然发生的?存在还是偶然发生的?实际问题实际问题-我们是否应该努力制造象我们是否应该努力制造象2号那样的固定架,号那样的固定架,以减少方差?以减少方差?2.平均值平均值:统计问题统计问题-不同不同固定架均值之间看上去明显的差异是实际固定架均值之间看上去明显的差异是实际存在还是偶然发生的?存在还是
7、偶然发生的?实际问题实际问题-我们是否应该努力制造象我们是否应该努力制造象3号那样的固定架,号那样的固定架,以使它们接近目标值?以使它们接近目标值?根据您希望比较的内容选择假设检验法根据您希望比较的内容选择假设检验法采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还采用什么工具确定差异是确实存在,还是偶然发生?是偶然发生?是偶然发生?是偶然发生?比较方差比较方差 F检验法 2个方差 Bartlett检验法 用于正态数据 Levene检验法 用于非正态数据比较平均值比较平均值 双样本 t 成对t1.2.为什么使用假设检验和为什么使用假设检验和为
8、什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?在六个西格玛工程中,我们使用图形和假设检验来筛选筛选少数关键Xs。假设检验假设检验有助于确定差异是确实存在,还是偶然确实存在,还是偶然发生发生。置信区间置信区间给出总体值参数最可能的取值范围。最可能的取值范围。所有 潜在“Xs关键少数关键少数关键少数关键少数 “X Xs s为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?由于所有数据均存在偏差,因此,即使总体是一样的,样本数据也会存在细微差异。让我们来看一看在生成一些随机数据无规律的数据时会发生什
9、么情况。1.产生产生8组随机数据组随机数据翻开新的工作表:File New.Minitab Worksheet OK生成10行数据。保存在c1-c8栏中。Calc Random data Normal为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?2.在一栏中进行叠加。在一栏中进行叠加。Manip Stack/Unstack Stack叠加c1-c8。将叠加的数据保存在c9。在10中存储下标。为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?3.将数据制
10、图,并寻找差异将数据制图,并寻找差异。Graph Boxplot制作c9 Y和c10 X,固定架的比照图。为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和为什么使用假设检验和置信区间?置信区间?置信区间?置信区间?4.请注意,样本平均值和方差存在着差异,即使所有8组数据都取自同一总体也不例外。有些统计程序的前提条件是方差相同,而大多数程序对这一假并不敏感,因此,它通常不是我们所关心的问题。如果您利用Minitab进行双样本t检验,它将问您是否假设方差相同。您可以使用方差检验来作出判断。比较方差比较方差比较方差比较方差何时应该比较方差?何时应该比较方差?如果您对改变了工序,并想确定输
11、出结果中的方差是否改变,您可以将工序改变前后的方差进行比较。比较方差比较方差-3种方法种方法1.比较2个个 方差,假定为正态正态 分布2.一次比较多个多个方差,假定为正态正态 分布。3.一次比较多个多个方差,采用非正态非正态数据。F-检验(手动),或Bartlett检验(采用Minitab)Bartlett检验(Minitab)Levene检验(Minitab)手工计算的手工计算的F-检验检验 比较2个方差计算F=s12/s22,其中 s12 =两个样本方差中较大的方差,和 s22 =两个样本方差中较小的方差如果计算的F值比表格中的F值更大,则否认零假设并接受存在差异举例举例:比较固定架比较固
12、定架1和固定架和固定架2的方差的方差s1=.00110 固定架1的标准方差s2=.000823固定架2的标准方差每个样本的容量为10-各自的自由度为9。计算的F=.001102/.0008232 =1.79分子的自由度为9、分母的自由度为9的F分布临界值为3.18,由F表格中得出。计算的F值比表格的F值小,因此,无法拒绝方差相等这个零假设。结论:没有足够的证据来以结论:没有足够的证据来以95%的置信度的置信度说明方差已经改变。说明方差已经改变。F表格表格分子自由度分子自由度分子自由度分母自由度课堂练习课堂练习:手工计算手工计算F-检验检验 F=s12/s22其中 s12 =一个分布的方差两个样
13、本方差中的较大方差 s22 =另一分布的方差两个样本方差中的较小方差比较固定架比较固定架7和固定架和固定架8的方差的方差s7=.00149 固定架7的标准方差s8=.00110固定架8的标准方差每个样本的容量为10。分子的自由度是多少?分母的自由度是多少?F表格的临界值是多少?哪个方差值更大,而应置于分子?计算的F是多少?计算的F值是否比表格的F值大?您的结论是什么?您有证据能够以95%的置信度来说明固定架7和固定架8之间的方差不同吗?方差齐性 StatANOVAHomogeneity of Variance Bartlett检验法-正态数据 Levene检验法-非正态数据采用采用采用采用Mi
14、nitabMinitab比较方差比较方差比较方差比较方差Ho:12=22 =.=k2 p 时无法拒绝 HoHa:i2=j2 至少一对 p ANOVAHomogeneity of Variance0.00050.00150.00250.0035西格玛的95%置信区间Bartlett检验法检验统计值:4.298P-值 :0.745Levene检验法检验统计值:0.818P-值 :0.576因素级别12345678总高度的方差齐性统计结论:统计结论:我们无法得出8个固定架之间的方差存在差异的结论。我们在图形中观察到的差异可能是由于偶然因素而发生的。实际结论:实际结论:不应该将所有固定架都制造成象设备
15、2那样来减少方差。方差齐性检验方差齐性检验P值值 .05,无法拒绝无法拒绝 Ho我们现在转向我们现在转向我们现在转向我们现在转向平均值平均值平均值平均值您希望知道什么您希望知道什么您希望知道什么您希望知道什么?统计问题统计问题-固定架之间方差的明显差异是实际存在还是固定架之间方差的明显差异是实际存在还是偶然出现的?偶然出现的?实际问题实际问题-是否应该努力制造是否应该努力制造3号那样的固定架,以使其号那样的固定架,以使其均值接近目标值?均值接近目标值?目标值5.394现在转向现在转向现在转向现在转向双双双双样本样本样本样本t t 单样本比较单样本比较将一组数据与标准值比较双样本比较双样本比较
16、两组数据互相比较Bill MarkBill par为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?为什么计算置信区间和假设检验?单样本比较单样本比较将一组数据与标准值比较。双双样本比较样本比较互相比较两组数据Ho:1=2或者:Ho:1-2=0如果如果 1-2 的置信区间不包括的置信区间不包括0,则说明,则说明 1 和和 2 之间之间的差异是的差异是显著的。显著的。单击单击“Graphs点击两次点击两次“OK运行运行采用采用采用采用MinitabMinitab进行进行进行进行“双样本双样本双样本双样本t t,以比较两个固定架以比较两个固定架以比较两个固定
17、架以比较两个固定架假设是什么假设是什么?Ho:Ha:选择选择Ha 单单侧侧或或 双侧双侧StatBasic Statistic2-Sample t如果如果F检验未拒绝检验未拒绝Ho,单击,单击“Assume Equal Variance比较固定架比较固定架1与固定架与固定架3:单击单击“Boxplotsof dataP值值 .05;拒绝拒绝Ho MinitabMinitab给出了置信区间给出了置信区间给出了置信区间给出了置信区间和假设检验和假设检验和假设检验和假设检验Ho 和和 Ha的假设的假设 1-2的置信区间的置信区间 不包括不包括0.0置信区间的说明置信区间的说明置信区间的说明置信区间的
18、说明平均值差异的最可能估计值为:5.3899-5.3947=-0.0048.实际差异实际差异 如果我们包括总体的所有数据可能大于该值,也可能小于该值。我们有95%的置信度的置信度说明实际值在 -0.00586和-0.00374之间。这是总体差异的近似值范围近似值范围 与数据一致的数值。以这种方式组成的区间中有95%的区间包含实际总体值您出错的机率是5%。0.0不在该区间内,因此,我们可以有力的证明固定架之间的差异确实存在,而不是偶然出现。这意味着我们可以否认2个平均值是相等这一零假设 Ho:1=2 or 1-2=0。P值值大于大于Ha:Window Close all graphs点击“Dat
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精选 样本 置信区间 假设检验
限制150内