联想集团6sigma培训资料--对比实验(PPT70)精编版.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《联想集团6sigma培训资料--对比实验(PPT70)精编版.pptx》由会员分享,可在线阅读,更多相关《联想集团6sigma培训资料--对比实验(PPT70)精编版.pptx(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、对比实验对比实验 欢迎光临6sigma世界10109-9271-HAYG LemaireLegend ConfidentialLegend Confidential1.统计基础知识统计基础知识2.参数估计参数估计3.假设检验假设检验4.对比实验报告编写和练习对比实验报告编写和练习课程进程课程进程Legend ConfidentialLegend Confidential为什么要学习对比实验为什么要学习对比实验许多许多的的问题问题需要就某些需要就某些参数参数作出接受或作出接受或拒绝的决拒绝的决定,这说明是一个假设。它代表把一个实务的问定,这说明是一个假设。它代表把一个实务的问题演绎成统计学上的问
2、题。而这个决策过程便称题演绎成统计学上的问题。而这个决策过程便称为:为:Hypothesis TestingHypothesis Testing我们把实现假设检验的过程成为对比实验。我们把实现假设检验的过程成为对比实验。统计学上的测试能为我们就问题作出客观解说,统计学上的测试能为我们就问题作出客观解说,相比较以前,我们只能作出主观的解说。这是后相比较以前,我们只能作出主观的解说。这是后续学习内容的基础。续学习内容的基础。Legend ConfidentialLegend Confidential统计基础知识统计基础知识第一单元第一单元Legend ConfidentialLegend Conf
3、identialn总体总体(Population):在统计问题中在统计问题中,我们把研究对象我们把研究对象的全体成为总体的全体成为总体n个体个体:构成总体的每个成员称为个体构成总体的每个成员称为个体n样本样本(Sample):从总体中抽取部分个体所组成的集合从总体中抽取部分个体所组成的集合称为样本称为样本n样品样品:样本中的个体称为样品样本中的个体称为样品n样本容量样本容量:样品的个数称为样本容量样品的个数称为样本容量,常用常用n表示表示1.1总体和样本总体和样本Legend ConfidentialLegend Confidential样本样本n随机样本随机样本(Random sample)
4、:能够被推广应用于更大能够被推广应用于更大的总体的样本。总体的每个个体有一个已知的(有的总体的样本。总体的每个个体有一个已知的(有时是相等的)机会被包含在该样本中。时是相等的)机会被包含在该样本中。n简单随机样本简单随机样本(Simple random sample):1、同一性:样本与总体有同样的分布、同一性:样本与总体有同样的分布2、独立性:、独立性:如果给定第一个事件,无论它的结果是什么,第二如果给定第一个事件,无论它的结果是什么,第二个事件的机会都一样。个事件的机会都一样。Legend ConfidentialLegend Confidential1.2统计量和抽样分布统计量和抽样分布
5、n统计量统计量:不含未知参数的样本函数称为统计量。不含未知参数的样本函数称为统计量。n抽样分布:统计量的分布称为抽样分布。抽样分布:统计量的分布称为抽样分布。n有序样本:有序样本:是从总体是从总体X中随机抽取的容量为中随机抽取的容量为n的样本,将它们的样本,将它们的观测值从小到大排序,这便是有序样本。的观测值从小到大排序,这便是有序样本。Legend ConfidentialLegend Confidential统计推断过程统计推断过程n统计学的主要任务:统计学的主要任务:1、研究总体是什么分布?、研究总体是什么分布?2、这个总体(即分布)的均值、方差是多少?、这个总体(即分布)的均值、方差是
6、多少?样样本本总体总体样本统计量例如:样本均值、方差总体总体均值、均值、方差方差抽样Legend ConfidentialLegend Confidential1.2常用统计量常用统计量n描述中心位置的统计量:描述中心位置的统计量:1、众数(、众数(mode):一个变量的众数是指出现次数最一个变量的众数是指出现次数最多的值,不过它不一定唯一。多的值,不过它不一定唯一。2、中位数:、中位数:3、均值、均值(mean):Legend ConfidentialLegend Confidential1.2常用统计量常用统计量n描述数据分散程度的统计量:描述数据分散程度的统计量:1、极差(、极差(ran
7、ge):2、方差(、方差(variance)3、标准差(、标准差(standard deviation):):4、标准误差(、标准误差(standard error):是很多不同样本):是很多不同样本的均值的标准差。的均值的标准差。5、变异系数:、变异系数:Legend ConfidentialLegend Confidential1.3正态分布正态分布n正态分布:正态分布:Legend ConfidentialLegend Confidential1.3正态分布正态分布n标准正态分布:标准正态分布:n它是特殊的正态分布,服从标准的正态分布的它是特殊的正态分布,服从标准的正态分布的随机变量记为
8、随机变量记为z,概率密度函数记为,概率密度函数记为(z z)Legend ConfidentialLegend Confidential1.3正态分布正态分布n标准正态分布的变换:标准正态分布的变换:Legend ConfidentialLegend Confidential1.3正态分布正态分布n标准正态分布的分位数:标准正态分布的分位数:n0.975是随机变量是随机变量z不超过不超过1.96的概率的概率n1.961.96是标准正态分布是标准正态分布N N(0,1)0,1)的的0.9750.975的分位数,的分位数,记为记为z z0.9750.9750.9750.025Legend Conf
9、identialLegend Confidential1.4常用的抽样分布常用的抽样分布正态样本均值的分布正态样本均值的分布:=10=10=10=10=10=10X X X X X Xn n n n=4=4=4=4X Xn n n n=16=16=16=16总体分布总体分布抽样分布抽样分布Legend ConfidentialLegend Confidential1.4常用的抽样分布常用的抽样分布nt分布分布:X X X X X Xt t 分布与正态分布的比较分布与正态分布的比较正态分布正态分布t t 分分布布t t t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(
10、dfdf=13)=13)t t(dfdf=5)=5)Legend ConfidentialLegend Confidential1.4常用的抽样分布常用的抽样分布nF F分布分布:设设X X1 1,X X2 2,X Xn n是来自正态总体是来自正态总体N N(1 1,1 12 2 )的一个样本,的一个样本,Y Y1 1,Y Y2 2,Y Yn n是来自正态总体是来自正态总体N N(2 2,2 22 2)的一个样本,且相互独立的一个样本,且相互独立,则则:n将将F F(n n-1,m-1)-1,m-1)称为第一自由度为称为第一自由度为(n n-1)-1),第二自,第二自由度为由度为(m-1)(m
11、-1)的的F F分布分布Legend ConfidentialLegend Confidential1.4常用的抽样分布常用的抽样分布nF F分布分布:F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)Legend ConfidentialLegend Confidential参数估计参数估计第二单元第二单元Legend ConfidentialLegend Confidential2.1点估计点估计n点估计的概念(点估计的概念(point estimation):n用样本均值估计总体均值用样本均值估计总体均值n用样本方差估计总体方差用样本方差估计总体方差n用
12、样本标准差估计总体标准差用样本标准差估计总体标准差Legend ConfidentialLegend Confidential2.2区间估计区间估计n区间估计的概念(区间估计的概念(interval estimate):n置信区间(置信区间(confidence interval):):n ,则称这种置信区间为,则称这种置信区间为等尾置信区间。等尾置信区间。Legend ConfidentialLegend Confidential2.2区间估计区间估计 置信区间下限值1-aa/2a/2x 置信区间上限值Legend ConfidentialLegend Confidentialn点估计与区间
13、估计的区别点估计与区间估计的区别:我是意见是这个值是我是意见是这个值是10,但误差在但误差在1之间。之间。2.2区间估计区间估计Legend ConfidentialLegend Confidential2.2区间估计区间估计n置信水平的概念置信水平的概念:是是的置信水平为的置信水平为1-1-的置信区间。它的置信区间。它的含义是能盖住未知参数的含义是能盖住未知参数的概率为的概率为1-1-。n置信区间量化了数据的不定性。置信区间量化了数据的不定性。Legend ConfidentialLegend Confidential2.2区间估计区间估计n总体均值置信区间的计算总体均值置信区间的计算:n
14、已知已知:n 未知未知:Legend ConfidentialLegend Confidential2.2区间估计区间估计n2 2分布分布:n方差置信区间的计算:方差置信区间的计算:Legend ConfidentialLegend Confidential2.2区间估计区间估计n置信区间的长度置信区间的长度:1、大的样本产生、大的样本产生较短的区间,小的样本产生较长的较短的区间,小的样本产生较长的区间。区间。2 2、低的置信水平产生较短的区间,高的置信水平产、低的置信水平产生较短的区间,高的置信水平产生较长的区间。生较长的区间。N=100N=200N=300N=400N=500Legend
15、ConfidentialLegend ConfidentialExercisesX=sXnDistribution of Sampling AveragesXXn研究草莓酱的重量是多少?研究草莓酱的重量是多少?n答案:答案:=9595的置信区间的置信区间Legend ConfidentialLegend Confidential假设检验假设检验第三单元第三单元Legend ConfidentialLegend Confidential3.1假设检验问题假设检验问题n例:草莓酱的净重服从正态分布例:草莓酱的净重服从正态分布N(,2),),6月份从产品中随机抽取月份从产品中随机抽取50瓶称重的平均
16、重量为瓶称重的平均重量为180.5克克,5月份从产品中随机抽取月份从产品中随机抽取50瓶称重的平均重量为瓶称重的平均重量为179.6克克,,问从总体上是否重量比原来少了?,问从总体上是否重量比原来少了?1、这不是一个参数估计问题、这不是一个参数估计问题2、要求对、要求对6 6-5 5=0=0作出回答:是与否作出回答:是与否3、这类问题被称为统计假设检验问题、这类问题被称为统计假设检验问题n估计的主要任务是找参数值等于几;估计的主要任务是找参数值等于几;n假设检验的兴趣主要是看参数的值是否等于某个特假设检验的兴趣主要是看参数的值是否等于某个特别感兴趣的值别感兴趣的值Legend Confiden
17、tialLegend Confidential3.2定义假设定义假设H0和和HaH0n要判断要判断0.9克这个值是否超出了样本变换所能造成的差克这个值是否超出了样本变换所能造成的差异的范围,我们先要问一问在总体均值相等的情况下,异的范围,我们先要问一问在总体均值相等的情况下,样本均值会发生什么情况,即是否两个均值的差等于样本均值会发生什么情况,即是否两个均值的差等于0,在统计学上被称为,在统计学上被称为零假设零假设(null hypothesis)n之所以用零来修饰假设,其原因是假设的内容总是没之所以用零来修饰假设,其原因是假设的内容总是没有差异或没有改变有差异或没有改变Legend Conf
18、identialLegend Confidential3.2定义假设定义假设H0和和HaHAn零假设其逻辑上的反面假设是零假设其逻辑上的反面假设是“两个参数有区别两个参数有区别”。这种反面假设称为这种反面假设称为备择假设(备择假设(alternative hypothesis)。)。n当零假设所提问的问题被否定时,备择假设的答案就当零假设所提问的问题被否定时,备择假设的答案就是正确的。如果样本数据能证明对于零假设提出的问是正确的。如果样本数据能证明对于零假设提出的问题应该否定,那么我们就拒绝(题应该否定,那么我们就拒绝(rejectreject)零假设而倾)零假设而倾向于备择假设。向于备择假设
19、。Legend ConfidentialLegend Confidential3.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题概率:概率:p-值值np-值是当零假设正确时,得到所观测的数据或更极端值是当零假设正确时,得到所观测的数据或更极端的数据的概率,这个概率称为的数据的概率,这个概率称为p-值(值(p-value)。)。n当当p-值小到以至于几乎不可能在零假设正确时出现目值小到以至于几乎不可能在零假设正确时出现目前的观测数据时,我们就拒绝零假设。前的观测数据时,我们就拒绝零假设。p-值越小,拒值越小,拒绝零假设的理由就越充分。绝零假设的理由就越充分。n注意:注意:有时错误以为有时
20、错误以为p-值与零假设对错的概率有关,值与零假设对错的概率有关,但这是不可能的但这是不可能的.p-值指的是关于数据的概率。值指的是关于数据的概率。p-值值告诉我们在某总体的许多样本中,某一类数据出现的告诉我们在某总体的许多样本中,某一类数据出现的经常程度。经常程度。Legend ConfidentialLegend Confidential3.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题假设检验机制:假设检验机制:n为了求为了求p-值,统计理论指出要把观测到的值,统计理论指出要把观测到的0.9这个样本这个样本均值之差变换成标准得分。均值之差变换成标准得分。n标准得分:标准得分:0.0
21、H00.00.510.9观测到的差观测到的差样本均值的差样本均值的差标准得分标准得分2.142 p-值0.0347Legend ConfidentialLegend Confidential3.3怎样回答零假设所提出的问题怎样回答零假设所提出的问题假设检验机制:假设检验机制:nt值等于值等于2.142的概率是的概率是0.0347,因此两个样本均值之差因此两个样本均值之差等于等于0.9的概率也是的概率也是0.0347,换句话说就是如果两总,换句话说就是如果两总体均值相等的话,从均值相等的总体中抽取体均值相等的话,从均值相等的总体中抽取200个样个样本两两相减所得之差只有本两两相减所得之差只有3.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 联想集团 sigma 培训资料 对比 实验 PPT70 精编
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内