中级质量工程师考试下册.docx
第一章概率统计基础知识(中级)上海质量教育培训中心2005 年第一节概率基础知识、事件与概率(-)随机现象随机现象在一定条件下,并不总是出现相同结果的现象。特点随机现象的结果至少有两个至于哪一个出现,人们事先并不知道样本点认识一个随机现象,首要的是能罗列出它 的一切可能发生的基本结果。这里的基本结果 是今后的抽样单元即样本点。样本空间:记为Q随机现象可能样本点的全部称为这个随机现象的样本空间。(二)随机事件事件(随机事件):随机现象的某些样本点组 成的集合。用大写英文字 母A、B、C表示。随机事件的特征任一事件A是相应样本空间Q中的一个子集。一事件A发生当且仅当()A中某样本点 发生。事件A的表示可用集合,也可用语言,但所用 语言要大家明白无误。任一样本空间Q有一个最大子集即Q;它对 应的事件称为必然事件,仍用。表示。一任一样本空间Q都有一个最小子集即空集, 它对应的事件称为不可能事件,记为随机事件的关系包含:ACB或BA在一个随机现象中有两个事件A与B,若事件A中任一个样本点必在B中,则称A被包含在B中,或B包含A。互不相容在个随机现象中有两个事件A与B,若 事件A与B没有相同的样本点,则称A与B互不 相容。可推广到三个或更多个事件间的互不相容 相等:A=B即AUB且BA在一个随机现象中有两个事件A与B,若样 本A与B含有相同的样本点,则称事件A与B相 等。例:A= (x, y): x + y =奇数B= (x, y): x与y的奇偶性不同A=B=(1,2), (1,4), (1,6), (2. 1), (2,3), (2,5)(3,2), (3,4), (3,6)-则:(三)事件的运算事件运算对立事件:Af A在个随机现象中,。是样本空间,A为事件,则由在。中而不在A中的样本点组成的事件称 为A的对立事件,记。A则A = A, Q =,中=Q事件A与B的并:AUB由事件A与B中所有样本点(相同的只计入 一次)组成的新事件。称为A与B的并,发生意味着事件A与B至少个发生”AU B事件A与B的交:A I B或AB由事件A与B中公共的样本点组成的新事件称为事件A与B的交。发生意味着“事件A与B同 时发生”AI B事件的并和交可推广到更多个事件上去。事件A对B的差:A-B由在事件A中而不在B中的样本点组成的新事件,称为A对B的差。(a) A-B(b) A-B (A D B)事件运算性质:交换律:AUB = BUA, AI B = B I A结合律:AU (B UC) = (AU B) UCAI (B IC) = (AI B)IC一分配律:AU (B IC) = (AU B)I (AUC)AI (B UC) = (AI B)U (AIC)对偶律:AU B = AI BAI B = AU B可用维恩图验证,可推广到三个或三个以上事件的运算。(四)事件的概率概率事件发生可能性大小的度量在个随机现象中,用来表示任一随机事件A发生可能性大小的实数称为该事件的概率,记为 P (A)o概率是个介于和1之间的数,即OWP(A)WI;必然事件的概率等于1,即P ( 0 ) =1;不可能事件的概率等于,即P ()=0。二、概率的古典定义与统计定义(一)古典定义所涉及的随机现象只有有限个样本点。如 共有n个样本点;-每个样本点出现的可能性是相同的(等可能性);假如被考察事件A含有K个样本点,则事件 A的概率定义为 中样本点的总数中含样本点的个数Q=AnP( A ) K(二)统计定义与考察事件A有关的随机现象是可以大量 重复试验的;若在n次重复试验中,事件A发生Kn次 则 事件A发生的频率为; 重复试验数事件A发生次数nf ( A) Knn =-fn(A)将会随着重复试验次数不断增加而趋 于稳定,这个频率的稳定值就是事件A的概 率。一般用重复次数n较大时的频率去近似 概率。三、概率的性质及其运算法则概率的性质:(可由概率的定义看出)-性质1;对任意事件A,有0<P(A) 1;性质2: P(A) =1- R丹性质3:若AB则 P (A-B) =P (A) -P (B)性质 4: P (AUB) =P (A) +P (B) -P (AB) 若A与B互不相容P (AUB) =P (A) +P (B)-性质5:对于多个互不相容事件Al,A2, 有 P(A1 U A2 U A3 U)=P(Al)+P()+p(A3)+; 四、条件概率与概率的乘法法则(1)条件概率两个事件A与B,在事件B已发生的条件下,事 件A再发生的概率称为条件概率,记P (A/B)o 计算公式:(P( B )P( B )P( AB ) = P( AB ) > 0性质6:对任意二个事件A与B,有 P(AB)=P(A B)P(B)=P(B A)P(A) P(B)>0 P (A) >0(2)独立性和独立事件的概率 相互独立:设有两个事件A与B,假如其中一个事件 的发生不影响另个事件的发生与否,则称A 事件与B事件相互独立。性质7:假如二个事件A与B相互独立,则A与B同 时发生的概率为P(AB)=P(A)P(B)性质8:假如二个事件A与B相互独立,则在事件B发生条件下,事件A的条件概率P(A B)等 于事件A的(无条件)概率p(A) ;() () ()() ()()()P AP BP A P BP BPAB = PAB = =事件的相互独立可推广到三个或更多的事件 上去。第二节随机变量及其分布 、随机变量随机变量用来表示随机现象结果的变量称为随机变 量。常用大写字母X、Y、Z表示。随机变量类型离散随机变量个随机变量仅取数轴上有限个点或可列 个点,则此随机变量为离散(型)随机变量。 连续随机变量如一个随机变量的所有可能取值充满数轴 上一个范围(a, b)或整个数轴,则此随机变 量为连续(型)随机变量。二、随机变量的分布随机变量的分布随机变量取值的统计规律性。随机变量X的分布内容;X可能取哪些值或在哪个区间上取值 X取这些值的概率各是多少?或X在任 小区间上取值的概率是多少?(-)离散随机变量的分布离散随机变量的分布可用分布列表示(离 散分布) 分布列或用数学式表达;P(X=Xi)=pi i=l, 2n (pl+pn=l)pi也称为分布的概率函数X XI X2 XnP pl p2 pn(二)连续随机变量的分布 用概率密度函数表示(简称分布) 条件; p (x) 20 f +8 =-00 p (x) dx 1概率密度函数p(x)的各种形式位置不同散布不同形状不同其中p(x)在x0点的值p(x)不是概率,是高度。注:纵轴原为“单位长度上的频率”,由频率的稳定性,可用概率代替频率,纵轴就成为 “单位长度上的概率”即概率密度的概念,故最后形成的曲线称为概率密度曲线。p(X)X重要结论:1. X在区间(a, b)上取值的概率p(aVXVb)为概率密度曲线以下区间(a, b)上的面积,即P(a<X<b)= /ba p (x) dx2. X在一点取值的概率为零,即P(X=a)=0故:P(aVxVb)=P(aWxWb)=P(aXVb)=P(aVXb)三、随机变量分布的均值、方差与标准差均值:用来表示分布的中心位置,用E(X)表示X是离散随机变量X是连续随机变量E(X)=2 x i pif xp x dx +8-00 ()方差:用来表示分布的散布大小,用Var(x)表示Var (X)=X是离散随机变量X是连续随机变量2 xi - E(x)2 Rf x E(x)2P(x)dx +800 标准差:用表示。=。(X) = Var(X)表示分布散布大小。均值与方差的运算性质 对任意二个随机变量XI和X2,有E(X1+X2)=E(X1)+E(X2) 设X为随机变量,a与b为任意常数,有 E(ax+b)=aE(x)+bVar(aX + b) = a2Var(X) 设XI与X2相互独立Var (XI ± X2 ) = Var (XI ) + Var(X2 ) (和的方差等于方差之和)这个性质可推广到三个或更多个相互独立 随机变量场合方差的这个性质不能推广到标准差场 合,对任意两个相互独立的随机变量 XI 与 X2,。(X1+ X2) W。(Xl)+ O (X2) 而应为: ( XI + X2 ) = Var( XI ) +Var( X2 ) 方差具有可加性,标准差不具有可加性。四、常用分布(-)常用的离散分布 二项分布(n ) x n xP( X = x ) = x p (1 - p )- x =0, 1, ,n其中表示从n个不同元素取 出x个的组合数。() x! ( n x )! n n!记为b (n, p)二项分布均值、方差和标准差 均值 E(x)=np 方差:Var(x)=np(l-p) 标准差: = np(l - p ) 泊松分布:(常用于计点过程)X 一人 =e x!P( X x ) X x =0, 1, 2,记为P(入)其中e=2. 71828泊松分布均值、方差和标准差均值:E(X) =入方差:Var( X ) = X标准差:。=入超几何分布:(不放回抽样) ()()(N ) n N M n x Mx P( X x )=一 x =1 , 2,r式中 r=min (n, M)M为N中所含不合格品数n为样本量记为 h (n, N, M)超几何分布均值、方差、标准差均值:NE( X ) = nM方差:()MNNMNVar( X ) n( N n ) ,-=11(二)连续型随机变量的分布正态分布:能描述很多质量特性X随机取值的统计规律性。正态分布概率密度函数:(-oo<X< + °° )正态分布含两个参数日和。,常记:N(u,。2)。其中日为分布均值(即分布中心):。2为 分布方差;0 >0为分布标准差。222()2()10H 0(u ) eTE=标准正态分布表及其应用标准正态分布表可用于计算形如“ UWu”随机事件发生的概率。如:P(U 1.52 )=(1.52)査附表得 0.93575P(U W a ) = p(U<a ) = (a )P(U> a ) = 1一 (a )(-a ) = +(a )P(aUWb) = ©(b)-(a)-P( U W a ) = 2(a ) - 1P( U < a ) = P( -a < U < a )=(a) - 中(-a)=中(a) -1+ (a)=2 中(a) -1标准正态分布N(0, 1)的分位数2分位数(a为1间实数)指它的左侧面积恰好为a,右侧面积恰好为1-a,即用概率表达P(U W ua ) = a当。=0.5时,称为中位数,N(0, 1)分布中u0. 5 三a V0. 5 时,如 a =o. 25 则 uO. 25=-u0. 75 查附表 uO. 75=0. 675,故 uO. 25=-0. 675a1 - a u a正态分布的计算性质 1:设X N( 11, 02 ),贝U X N( 0, 1 ) 0一 U性质2:设XN( u, o2 ),则对任意实数a, b有p x e正态分布概率密度函数图形分析P( X b )=b标准正态分布:u=0且=1的正态分布,称为标准正态分布,记N (0, 1),其变量记为U,概率密度函数记为小(u)224-P( X > a ) = 1U T一 T 7 = X ( U-z u P 7-uP(a<X<b)=O>ba不合格品率为产品质量特性X超出规范限(TL, TU)的概率 X超出TU (上规范限)的概率记PUpU =P(X>TU) X超出TL (下规范限)的概率记PLpL=P (X<TL) X的不合格品率P=PU+PL正态分布中心计算不合格品率要知道两件事:质量特性X的分布,在过程受控情况下, 常为正态分布N(, 2)-产品规范限,是对产品质量特性所作的要 求,这些要求可能是顾客要求;可能是标 准;可能是企业规定的技术要求。则:()1()- 卩= = LL Lp P X T T其中中()可查标准正态分布函数表TL Tu当正态分布中心日 =规范中心时产品质量特性X超出规范u ±3 的不合格率2M TL TUpL=P(x < u-3o ) = 0 (-3)=1-0 (3)=1-0. 99865=0. 00135=1350PPmpU=P(x < u +3 )=1-0 (3)=0.00135=1350PPmp=pL+pU=O. 00135+0. 00135=0.0027=2700PPm-6 -5 -4 -3 -2。- o u 2 3 4 5 6 规范限±1 0±2 0±3 0±4 0±5o±6o合格品率()68. 2795. 4599. 7399. 993799.99994399.9999998不合格品率(ppm)317300455002700630.57.002(三)其他连续分布均匀分布 在区间(a, b)上的均匀分布,记U (a、b)0 a < x < b其它p( x )=b - a1-均值、方差、标准差 均值2E( X ) a b +方差12Var( X ) ( b a )2 -标准差 12(b - a )2 o =指数分布 0 ,p( x )=X e- X x , x 2 0 x < 0 记为Exp ( X ),其中X >0。 均值,方差,标准差XE( X ) = 121 X Var( X )=X0=1对数正态分布(特点)随机变量都在正半轴(0,+8)上取值 大量取值在左边,少量取值在右边,且很 分散,这样的分布称之为右偏分布。(曲 线的尾巴在右边)对数正态分布密度函数正态分布的密度函数 最重要特征:若随机变量X服从对数正态分布,则作对 数变换丫 = In x后,服从正态分布。记正态分布的均值为,方差为,则相 应的对数正态分布的均与方差分别为 u y 2 0 y Li x 2 x均值:U +11 = =u + o= 2222x E( x ) exp y y / e方差:ox2 = Var ( x ) = ii x2 (exp 02y - 1) 若X服从对数正态分布,则P(X < a) = P(ln X < In a)=P(Y < In a)=yy a 0 In ii 五、中心极限定理 随机变量的独立性随机变量XI与X2相互独立是指其中一个取 什么值不影响另个的取值,或者说是指两个 随机变量独立的取值,互不影响。随机变量的独立性可以推广到3个或更多 个随机变量。中心极限定理在统计中,多个相互独立随机变量的平均值(仍然是一个随机变量)将服从或近似服从 正态分布。即n个相互独立同分布的随机变量XI,X2, Xn,均值!和方差都存在,则在n较大时,其样本均值服从或近似服从正态分 布 N ( u , ) 2x n 2第三节统计基础知识、总体、个体与样本(一)总体与个体总体:在个统计问题中,我们把研究对象的 全体成为总体。当研究产品某个特定的质量特性X 时,也常把全体产品的特性看做为总体。 个体:构成总体的每个成员。当研究产品的某个特定的质量特性X 时,把个具体产品的特性值X视为个体。 (二)随机样本满足下面两个条件的样本称为简单随机样 本,简称随机样本:1 .随机性。总体中每个个体都有相同的机会 入样。2 .独立性。从总体中抽取的每个样品对其它 样本的的抽取无任何影响。随机样本可看做n个相互独立的、同分布 的随机变量,其分布与总体分布相同。下面所述的样本都是指满足这两个要求的 简单随机样本。二、频数(频率)直方图为了研究数据的变化规律,需要对数据进行 一定的加工整理。直方图是为研究数据变化规律 而对数据进行加工整理的种基本方法。(一)直方图的作法例L 3-3I食品厂用自动装罐机生产罐头食品,从一批罐头中随机抽取100个进行称量,获得 罐头的净重数据如下:342 352346344343339336342347340340 350347336341349346348342346347 346346345344350348352340356339 348338342347347344343349341348 341340347342337344340344346342 344345338351348345339343345346 344344344343345345350353345352 350345343347354350343350344351 348352344345349332343340346342 335349348344347341346341342为了解这组数据的分布规律,对数据做如下整理:(1)找出这组数据中的最大值xmax及最小值 xmin.计算它们的差R= xmax-xmin, R称为极差, 也就是这组数据的取值范围。在本例中 xmax=356, xmin =332,从而 R=356-332=24。(2)根据数据个数,即样本量n,决定分组数k 及组距ho批数据究竟分多少组,通常根据n的多少而定,不过这也不是绝对的,教材中1.3-2是可以 参考的分组数。选择k的原则是要能显示出数据中所隐藏的 规律,组数不能过多,但也不能太少。每组的区间长度,称为组距。组距可以 相等,也可以不相等。组距相等的情况用得比 较多,不过也有不少情形在对应于数据最大及 最小的个或两个组,使用与其他组不相等的 组距。对于完全相等的组距,通常取组距h为 接近的某个整数值。在本例中,n=100,取k=9,R/k=24/9=2. 7,故取组距 h=3。(3)确定组限,即每个区间的端点及组中 值。为了避免个数据可能同时属于两个组, 因此通常将各组的区间确定为左开右闭的:通常要求Vxmin, >xmax在等距分组 时,,,而每组的组中值a0 ak al = a0 + h a2 = al + h ak = ak -1 + h x i ( ai ai )'=2 -1 +1在本例中取=331. 5,则每组的组限及组中值见表1.3-3 a0(a0 al , (al , a2 , , (ak-1 , ak , (4)计算落在每组的数据的频数及频率确定分组后,统计每组的频数,即落在组 中的数据个数以及频率,列出每组的 频数、频率表,见表!.3-3 fi = ni / n频数、频率及累积频率表组号 i (ai-1 , ai x' i i n i f1 (331. 5,334.53331 0. 012 (334. 5,337.53364 0. 043 (337. 5,340.533911 0. 114 (340. 5,343.534220 0. 205 (343. 5,346.534530 0. 306 (346. 5,349.534819 0. 197 (349. 5,352.535112 0.128 (352. 5,355.53542 0. 029 (355. 5,358.53571 0. 01合计100 1. 00表 !.3-3(5)作频数频率直方图在横轴上标上每个组的组限,以每组的 区间为底,以频数(频率)为高画一个矩形, 所得的图形称为频数(频率)直方图,如图 1.3-40在本例中频数直方图及频率直方图的形 状是完全一致的。这是因为分组是等距的。 在分组不完全等距的情形,在作频率直方 图时,应当用每一个组的频率与组距的比值 /为高作矩形。此时以每个矩形的面积表示 频率。i f i h 频数(频率)直方图(二)直方图的观察与分析a.对称型b.偏态型 c.孤岛型 d.锯齿型 e.平顶型 f.双峰型三、统计量与抽样分布1 .统计量的概念不含未知参数的样本函数样本均值、样本中位数、样本极差、样本 方差、样本标准差及样本变异系数等都是 统计量,只有众数除外。2 .抽样分布统计量的分布称为抽样分布(-)样本数据集中位置的统计量(1)样本均值x=2nixin nnx xX)x Me (,n为奇数,n为偶数(3)众数(Mod)数据中出现频率最高的值。(二)描述样本数据分散程度的统计量(1)样本极差R = x(n) - x( 1 )(2)样本方差工(一)11(2)样本中位数Me (或)x12 2212n i xi xnS12 211-因为n个离差()的总和为零,所以 对于n个独立数据,独立的离差个数只有 n-1个,称n-1为离差(或离差平方和)的 自由度。故方差用离差平方和除以n-1。xi - x简化计算公式:nixi nxnS12 2 211或ninii xinxnS1212 2 111(3)样本标准差S = S2标准差的量纲与数据的量纲一致(4)样本变异系数XC 0 = s四、常用抽样分布1. X的分布设X服从N ( u ,), (xl, x2,,xn)是由总体X中抽取的个样本,则服从N(n,) 2 2 / n(1) X的精确分布(2) X的渐进分布设X为任意分布,(xl, x2, ,xn)是由总体X中抽取个样本,若,则当n-8时,近似服从N ( u , )E( xi ) = 11Var( xi ) =。2 W 0 X 2 / n(3) x2分布设X服从N(0, 1),且设(xl, x2, xn)是由总体X中抽取的个样本,则 2 22212x = x + x + + x n服从自由度为n的x2分布,记作x2 x 2(n)o 设 X 服从 N (,。2 ),则(n 1 )S2 (n 1 ) 22 x 一0(4) t 分布设随机变量X, Y相互独立,XN(0, 1), r (n)则服从自由度为n的t一分布记 作 tt(n) x2 Y / n t = X设 XN ( 11 , ), (xl, x2, , xn)是由总体X中抽取的个样本,则 0 2 t( n ) s / n t x - 1设X和Y相互独立,且XN (,), YN ( 11 ,), (xl, x2, , xnl)与(yl, y2, , yn2)分别由总体X和Y中抽取的样本,则 2 2 t ( n n ) n n n n (n )S ( n )S (x y ) ( ) 2 1 12111212 1222 221 112 + -+ -+-u - u(4) F分布设X与Y相互独立,且Xx2(Nl), Y- x2(N2) 则服从自由度为(N1, N2)的F 分布。记作FF(N1, N2) 21Y / NF = X / N设X和Y相互独立,X,Y, (xl, x2, ,xn)与(yl, y2, , ym)分别由X和Y中抽取的样本,则(2 )1 1N 11 , ( 2 )2 2N 11 . 22222121S /S /F (n - 1, m1)当=时,则210 22 2 F( n , m )SS 1 1 2221 -正态分布a a ii y - = - 1t分布tl- a (n) = -t a (n)x2分布()()2 2x 1- a n# x a n()()Fl" fl , f2 W -Fa fl , f2F分布第四节参数估计、点估计1.概念设是一个未知参数,由总体X中抽取的样本,则用来估计,则称为的估计量(或称估计)。9 (XI ,X2 , LL, Xn )()9' = 0 ' XI ,X2 ,LL,Xn9 9*92 .矩法估计(1)用样本矩估计相应总体矩;(2)用样本矩的函数估计相应总体矩的函数。 例如用样本均值估计总体均值;用样本方差(标准差)来估计总体方差(标准差)。3 .点估计优劣的评选标准(1)无偏性设是9的个估计量,若,则称是9的无偏估计。0 '()9 = 9* E0 '(2)有效性设都是9的无偏估计量,若对一切0的可能取值有;9 * 1,9*2,且至少有一个,严格不等号成立,则比有效。()()Var 9 * 1 Var 9* 2 9 01 9 * 2 9 *(3)正态总体参数的无偏估计的无偏估计有两个,即和。U x x 。2的无偏估计常用的只有一个,即S2 的无偏估计有两个,即和d2RC4S二、区间估计(一)区间估计的概念设。是总体分布中的未知参数,其一切可能 取值组成的参数空间为,从总体中抽取个样 本(xl, x2, ,xn),对给定的,确定两个统计量:与0a (0 < a < 1)()9 L = 9 L xl , x2 , L, xn()9 u = 9 u xl , x2 , L, xn对任意的。e 有P(OL e 0 U ) 21 - a则称9L, 0u是的置信水平为的置 信区间。1 - a1- a置信区间的含义:所构造的一个随机区间能包含未知参数的概率为!-。由于这个随机区间会随样本观察 值的不同而不同,它有时包含了参数,有时没有 包含,但是用这种方法作区间估计时,100次中 大约有100(1 -)个区间能包含未知参数。0 L , U0 a09a 0(二)个正态总体均值与方差的置信区间(1) 。2已知,求日的置信区间H的1- a置信区间为:nx unx u 0 U W +-1- a 2 1- a 2(2) 。2未知,求!的置信区间()()nx t n snx t n 1 s 112 12 a - + -q -(3)方差。2的1- a的置信区间(日未知)()()()(1)111222221 22。Wx -a a nn Snn S(4)标准差。的1- a的置信区间(未知) ()()11112221 2 x -。Wx -a a nS nnS n(三)比例p的置信区间(大样本场合)设总体,样本为xl, x2,xn,样本之和为K,样本均值为则X b(l, p)nx = Knp = K (点估计)当n相当大时,故p的置信区间。x N( p, p(l - p) / n)1 - ax - u x(- x)/ n p x + u a x( - x)/ na1 12121其中是标准正态分布的分位数。21 au21a第五节假设检验基本思想根据所获福勺样本,运用统计分析的方法,对总体X的某种假设H0作出接受或拒绝的 决定。(二)基本步骤1 .建立假设H0称为原假设,H1称为备择假设,如关于均值"常用有三类假设:(1) HO:UHO , Hl:u>uO(2) HO:uuO , Hl:u<u0(3) HO:11=u 0 Hl: uW110(1),(2)称为单边假设检验(3)称为双边假设检验2 .寻找检验统计量T,确定拒绝域的形式3 .给出显著性水平4 .给出临界值,确定拒绝域5 .根据样本观察值计算检验统计量的观察值,根据计算结果作出拒绝或接受H0的判断。a个正态总体的假设检验1.已知 0 2 ,H0: 11 = u 0 , Hl: u W it6(1)检验统计量/ nu x0-u=0(2)给定,查标准正态分布函数值表定出临界值a1- a 2 u(3)由样本观察值计算出统计量u(4)作出判定当1- a 2接受HO u < u1 - a 2 u 2 u拒绝HO,接受Hl2 .已知。2 ,检验 HO: u W u0, Hl: u > u 0(1)检验统计量/ nu x(2)给定a ,定出临界值ul- a(3)由样本观察值计算出统计量u(4)判定当u ul- a接受H0u 2 ul- a拒绝H0,接收Hl3 .已知。2 ,检验 HO: u u0, Hl: u < u 0(1)检验统计量/ nu x 0-U=0(2)给定a ,定出临界值ua(3)由样本观察值计算出统计量u(4)判定当u > ua接受H0u ua拒绝H0,接受Hl4 .未知。2 ,则用t检验法 把上述的统计量u换成t,即 S / nt X - 对给定的,查t 一分布表,确定临界 值,然后作出接受或拒绝的判定。a5 . u未知,检验H0: 2 , H1: 0 2 = 20。2 W (1)检验统计量()2022 1 x = n S(2)给定a ,查x2一分布表,定出临界值2 ( 1)2x a n -和 2 ( 1)1 2 x - a - n(3)由样本观察值计算出统计量x 2当(1) 2 ( 1)1 22 22接受HO,否则拒绝HO,接受Hl。三、有关比例p的假设检验设Xb(l,p), xl, x2,xn由总体X抽取的一个样本,当n较大时,根据中心极限定理, 近似服从正态分布,则xnN p p(l p ), p( p ) / n u x p1近似服从N (0, 1)则可获得P的近似u检验。第二章常用统计技术(中级)方差分析回归分析试验设计上海质量教育培训中心2005 年第一节方差分析、几个概念二、单因子方差分析、几个概念在试验中改变状态的因素称为因子,常用大写 英文字母A、B、C、等表示。因子在试验中所处的状态称为因子的水平。用代表因子的字母加下标表示,记为Al, A2,- ,Ako试验中所考察的指标(可以是质量特性也可以是产量特性或其它)用Y表示。Y是一个随机变 量。单因子试验:若试验中所考察的因子只有一个。例2. 1-1I现有甲、乙、丙三个厂生产同一种 零件,为了 了解不同工厂的零件的强度有无明显的差 异,现分别从每个工厂随机抽取四个零件测定其 强度,数据如表所示,试问三个工厂的零件的平均 强度是否相同?厂量件强度甲乙丙103 101 98 110113 107 108 11682 92 84 86三个厂的零件强度在这一例子中,考察一个因子:因子A:厂该因子有三个水平:甲、乙、丙试验指标是:零件强度这是个单因子试验的问题。每一水平下的 试验结果构成一个总体,现在需要比较三个总体 均值是否一致。如果每个总体的分布都是正态 分布,并且各个总体的方差相等,那么比较各个 总体均值是否一致的问题可以用方差分析方法来 解决。二、单因子方差分析假定因子A有r个水平,在Ai水平下指标服从 正态分布,其均值为,方差为,i=l,2,, ro每一水平下的指标全体便构成一个总体,共 有r个总体,这时比较各个总体的问题就变成比 较各个总体的均值是否相同的问题了,即要检验 如下假设是否为真: Ui 2HO : iil=ii2 = L=iir当不真时,表示不同水平下的指标的均值有显著差异,此时称因子A是显著的,否则 称因子A不显著。检验这假设的分析方法便 是方差分析。H0方差分析的三个基本假定1 .在水平Ai下,指标服从正态分布N( i ,); 1I 22 .在不同水平下,各方差相等:3 .各数据yij相互独立。设在个试验中只考察个因子A,它有个 水平,在每一水平下进行m次重复试验,其结果用 表示,i=l,2,,ro常常把数据列成 如下表格形式: yil , yi2 , L, yim单因子试验数据表水平试验数据和均值Al yll , yl2 , L, ylm T1 ylA2 y21 , y22 , L, y2m T2 y2