[精选]《联想集团6sigma培训资料--对比实验》70页.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《[精选]《联想集团6sigma培训资料--对比实验》70页.pptx》由会员分享,可在线阅读,更多相关《[精选]《联想集团6sigma培训资料--对比实验》70页.pptx(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、比照实验比照实验 欢送光临6sigma世界10109-9271-HAYG Lemaire1.统计基础知识统计基础知识2.参数估计参数估计3.假设检验假设检验4.比照实验报告编写和练习比照实验报告编写和练习课程进程课程进程为什么要学习比照实验为什么要学习比照实验许多许多的的问题问题需要就某些需要就某些参数参数作出接受或作出接受或拒绝的决拒绝的决定,这说明是一个假设。它代表把一个实务的问定,这说明是一个假设。它代表把一个实务的问题演绎成统计学上的问题。而这个决策过程便称题演绎成统计学上的问题。而这个决策过程便称为:为:Hypothesis TestingHypothesis Testing我们把实
2、现假设检验的过程成为比照实验。我们把实现假设检验的过程成为比照实验。统计学上的测试能为我们就问题作出客观解说,统计学上的测试能为我们就问题作出客观解说,相比较以前,我们只能作出主观的解说。这是后相比较以前,我们只能作出主观的解说。这是后续学习内容的基础。续学习内容的基础。统计基础知识统计基础知识第一单元第一单元n总体总体Population:在统计问题中在统计问题中,我们把研究对我们把研究对象的全体成为总体象的全体成为总体n个体个体:构成总体的每个成员称为个体构成总体的每个成员称为个体n样本样本Sample:从总体中抽取局部个体所组成的集从总体中抽取局部个体所组成的集合称为样本合称为样本n样品
3、样品:样本中的个体称为样品样本中的个体称为样品n样本容量样本容量:样品的个数称为样本容量样品的个数称为样本容量,常用常用n表示表示1.1总体和样本总体和样本样本样本n随机样本随机样本Random sample:能够被推广应用于能够被推广应用于更大的总体的样本。总体的每个个体有一个的有更大的总体的样本。总体的每个个体有一个的有时是相等的时机被包含在该样本中。时是相等的时机被包含在该样本中。n简单随机样本简单随机样本Simple random sample:1、同一性:样本与总体有同样的分布、同一性:样本与总体有同样的分布2、独立性:、独立性:如果给定第一个事件,无论它的结果是什么,第二如果给定第
4、一个事件,无论它的结果是什么,第二个事件的时机都一样。个事件的时机都一样。1.2统计量和抽样分布统计量和抽样分布n统计量统计量:不含未知参数的样本函数称为统计量。不含未知参数的样本函数称为统计量。n抽样分布:统计量的分布称为抽样分布。抽样分布:统计量的分布称为抽样分布。n有序样本:有序样本:是从总体是从总体X中随机抽取的容量为中随机抽取的容量为n的样本,将它们的样本,将它们的观测值从小到大排序,这便是有序样本。的观测值从小到大排序,这便是有序样本。统计推断过程统计推断过程n统计学的主要任务:统计学的主要任务:1、研究总体是什么分布?、研究总体是什么分布?2、这个总体即分布的均值、方差是多少?、
5、这个总体即分布的均值、方差是多少?样样本本总体总体样本统计量例如:样本均值、方差总体总体均值、均值、方差方差抽样1.2常用统计量常用统计量n描述中心位置的统计量:描述中心位置的统计量:1、众数、众数mode:一个变量的众数是指出现次数最一个变量的众数是指出现次数最多的值,不过它不一定唯一。多的值,不过它不一定唯一。2、中位数:、中位数:3、均值、均值mean:1.2常用统计量常用统计量n描述数据分散程度的统计量:描述数据分散程度的统计量:1、极差、极差range:2、方差、方差variance3、标准差、标准差standard deviation:4、标准误差、标准误差standard err
6、or:是很多不同样本:是很多不同样本的均值的标准差。的均值的标准差。5、变异系数:、变异系数:1.3正态分布正态分布n正态分布:正态分布:1.3正态分布正态分布n标准正态分布:标准正态分布:n它是特殊的正态分布,服从标准的正态分布的它是特殊的正态分布,服从标准的正态分布的随机变量记为随机变量记为z,概率密度函数记为,概率密度函数记为z z1.3正态分布正态分布n标准正态分布的变换:标准正态分布的变换:1.3正态分布正态分布n标准正态分布的分位数:标准正态分布的分位数:n0.975是随机变量是随机变量z不超过不超过1.96的概率的概率n1.961.96是标准正态分布是标准正态分布N N0,10,
7、1的的0.9750.975的分位数,的分位数,记为记为z z0.9750.9750.9750.0251.4常用的抽样分布常用的抽样分布正态样本均值的分布正态样本均值的分布:=10=10=10=10=10=10X X X X X Xn n n n=4=4=4=4X Xn n n n=16=16=16=16总体分布总体分布抽样分布抽样分布1.4常用的抽样分布常用的抽样分布nt分布分布:X X X X X Xt t 分布与正态分布的比较分布与正态分布的比较正态分布正态分布t t 分分布布t t t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t
8、(dfdf=5)=5)1.4常用的抽样分布常用的抽样分布nF F分布分布:设设X X1 1,X X2 2,X Xn n是来自正态总体是来自正态总体N N1 1,1 12 2 的一个样本,的一个样本,Y Y1 1,Y Y2 2,Y Yn n是来自正态总体是来自正态总体N N2 2,2 22 2 的一个样本,且相互独立的一个样本,且相互独立,则则:n将将F Fn n-1,m-1-1,m-1 称为第一自由度为称为第一自由度为n n-1-1,第,第二自由度为二自由度为m-1m-1的的F F分布分布1.4常用的抽样分布常用的抽样分布nF F分布分布:F F F1,101,105,105,1010,101
9、0,10参数估计参数估计第二单元第二单元2.1点估计点估计n点估计的概念点估计的概念point estimation:n用样本均值估计总体均值用样本均值估计总体均值n用样本方差估计总体方差用样本方差估计总体方差n用样本标准差估计总体标准差用样本标准差估计总体标准差2.2区间估计区间估计n区间估计的概念区间估计的概念interval estimate:n置信区间置信区间confidence interval:n ,则称这种置信区间为,则称这种置信区间为等尾置信区间。等尾置信区间。2.2区间估计区间估计 置信区间下限值1-aa/2a/2x 置信区间上限值n点估计与区间估计的区别点估计与区间估计的区
10、别:我是意见是这个值是我是意见是这个值是10,但误差在但误差在1之间。之间。2.2区间估计区间估计2.2区间估计区间估计n置信水平的概念置信水平的概念:是是的置信水平为的置信水平为1-1-的置信区间。它的置信区间。它的含义是能盖住未知参数的含义是能盖住未知参数的概率为的概率为1-1-。n置信区间量化了数据的不定性。置信区间量化了数据的不定性。2.2区间估计区间估计n总体均值置信区间的计算总体均值置信区间的计算:n :n 未知未知:2.2区间估计区间估计n2 2分布分布:n方差置信区间的计算:方差置信区间的计算:2.2区间估计区间估计n置信区间的长度置信区间的长度:1、大的样本产生、大的样本产生
11、较短的区间,小的样本产生较长的较短的区间,小的样本产生较长的区间。区间。2 2、低的置信水平产生较短的区间,高的置信水平产、低的置信水平产生较短的区间,高的置信水平产生较长的区间。生较长的区间。N=100N=200N=300N=400N=500ExercisesX=sXnDistribution of Sampling AveragesXXn研究草莓酱的重量是多少?研究草莓酱的重量是多少?n答案:答案:=9595的置信区间的置信区间假设检验假设检验第三单元第三单元3.1假设检验问题假设检验问题n例:草莓酱的净重服从正态分布例:草莓酱的净重服从正态分布N,2,6月份从产品中随机抽取月份从产品中随
12、机抽取50瓶称重的平均重量为瓶称重的平均重量为180.5克克,5月份从产品中随机抽取月份从产品中随机抽取50瓶称重的平均重量为瓶称重的平均重量为179.6克克,,问从总体上是否重量比原来少了?,问从总体上是否重量比原来少了?1、这不是一个参数估计问题、这不是一个参数估计问题2、要求对、要求对6 6-5 5=0=0作出答复:是与否作出答复:是与否3、这类问题被称为统计假设检验问题、这类问题被称为统计假设检验问题n估计的主要任务是找参数值等于几;估计的主要任务是找参数值等于几;n假设检验的兴趣主要是看参数的值是否等于某个特假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值别感兴趣的值3.2定
13、义假设定义假设H0和和HaH0n要判断要判断0.9克这个值是否超出了样本变换所能造成的差克这个值是否超出了样本变换所能造成的差异的范围,我们先要问一问在总体均值相等的情况下,异的范围,我们先要问一问在总体均值相等的情况下,样本均值会发生什么情况,即是否两个均值的差等于样本均值会发生什么情况,即是否两个均值的差等于0,在统计学上被称为零假设,在统计学上被称为零假设null hypothesisn之所以用零来修饰假设,其原因是假设的内容总是没之所以用零来修饰假设,其原因是假设的内容总是没有差异或没有改变有差异或没有改变3.2定义假设定义假设H0和和HaHAn零假设其逻辑上的反面假设是零假设其逻辑上
14、的反面假设是“两个参数有区别。两个参数有区别。这种反面假设称为备择假设这种反面假设称为备择假设alternative hypothesis。n当零假设所提问的问题被否认时,备择假设的答案就当零假设所提问的问题被否认时,备择假设的答案就是正确的。如果样本数据能证明对于零假设提出的问是正确的。如果样本数据能证明对于零假设提出的问题应该否认,那么我们就拒绝题应该否认,那么我们就拒绝rejectreject零假设而倾零假设而倾向于备择假设。向于备择假设。3.3怎样答复零假设所提出的问题怎样答复零假设所提出的问题概率:概率:p-值值np-值是当零假设正确时,得到所观测的数据或更极端值是当零假设正确时,得
15、到所观测的数据或更极端的数据的概率,这个概率称为的数据的概率,这个概率称为p-值值p-value。n当当p-值小到以至于几乎不可能在零假设正确时出现目值小到以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。前的观测数据时,我们就拒绝零假设。p-值越小,拒值越小,拒绝零假设的理由就越充分。绝零假设的理由就越充分。n注意:注意:有时错误以为有时错误以为p-值与零假设对错的概率有关,值与零假设对错的概率有关,但这是不可能的但这是不可能的.p-值指的是关于数据的概率。值指的是关于数据的概率。p-值值告诉我们在某总体的许多样本中,某一类数据出现的告诉我们在某总体的许多样本中,某一类数
16、据出现的经常程度。经常程度。3.3怎样答复零假设所提出的问题怎样答复零假设所提出的问题假设检验机制:假设检验机制:n为了求为了求p-值,统计理论指出要把观测到的值,统计理论指出要把观测到的0.9这个样本这个样本均值之差变换成标准得分。均值之差变换成标准得分。n标准得分:标准得分:0.0H00.00.510.9观测到的差观测到的差样本均值的差样本均值的差标准得分标准得分2.142 p-值0.03473.3怎样答复零假设所提出的问题怎样答复零假设所提出的问题假设检验机制:假设检验机制:nt值等于值等于2.142的概率是的概率是0.0347,因此两个样本均值之差因此两个样本均值之差等于等于0.9的概
17、率也是的概率也是0.0347,换句话说就是如果两总,换句话说就是如果两总体均值相等的话,从均值相等的总体中抽取体均值相等的话,从均值相等的总体中抽取200个样个样本两两相减所得之差只有本两两相减所得之差只有3.47个样本的样本均值相差个样本的样本均值相差在在0.9,是小概率,是小概率0.05事件,我们拒绝零假设。事件,我们拒绝零假设。H00.00.510.9观测到的差观测到的差样本均值的差样本均值的差标准得分标准得分2.142 p-值0.03473.4显著水平显著水平n显著水平:我们不是在数据收集完毕之后计算显著水平:我们不是在数据收集完毕之后计算p-值,值,而是在收集数据以前就已经确定好的小
18、概率来构造一而是在收集数据以前就已经确定好的小概率来构造一个区间。当样本数据落入这个区间时就拒绝零假设。个区间。当样本数据落入这个区间时就拒绝零假设。这个小概率这个小概率 称为检验的显著水平称为检验的显著水平significant level,通常选,通常选0.05.n一个检验的显著水平一个检验的显著水平是抽样所得的数据拒绝了本来是抽样所得的数据拒绝了本来是正确的零假设的概率。是正确的零假设的概率。n拒绝域:当样本数据落入这个区间时就拒绝零假设,拒绝域:当样本数据落入这个区间时就拒绝零假设,那么这个区间就称为拒绝域。那么这个区间就称为拒绝域。n临界值临界值critical values:拒绝域
19、的边界所对应的拒绝域的边界所对应的标准得分的值。对于双边检验,样本统计量的临界标准得分的值。对于双边检验,样本统计量的临界值值是两个值。是两个值。3.4显著水平显著水平HoHoHo值值值临界值临界值临界值临界值临界值临界值 /2/2 /2/2/2 样本统计量样本统计量样本统计量拒绝域拒绝域拒绝域拒绝域拒绝域拒绝域接受域接受域接受域抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平3.5风险风险和和sX=sXnDistribution of Sampling AveragesXX3.5和和的关系的关系sX=sXnDistribution
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 精选 联想集团6sigma培训资料-对比实验 联想集团 sigma 培训资料 对比 实验 70
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内