分析化学中的数据处理.docx
第三章 分析化学中的数据处理第三章 分析化学中的数据处理§ 3.1 误差及其表示方法定量分析(Quantitive Analysis)的目的是通过一系列的分析步骤,来获得被测组分的准确含量。但是,即使最可靠的分析方法,使用最精密的仪器,由技术最熟练的分析人员操作,也难获得绝对准确的结果。由同一个人,在同样条件下对同一试样进行多次测定,所得结果也不一定是一致的。即分析过程中误差是客观存在的。所以我们应根据实际需要对分析结果的可靠性和精确程度作出合理的评价和正确的表示。 同时还应查明产生误差的原因及其规律性,采取减免误差的有效措施,从而不断提高分析测定的准确程度。一、误差的分类根据误差的来源和性质,可将误差分为两类:1.系统误差系统误差又称可测误差,是由某种固定的原因引起的误差。它们的突出特点是:A.单向性: 它对分析结果的影响比较固定,可使测定结果系统偏低或偏高。B.重现性: 当重复测定时,它会重复出现。增加测定次数不能使系统误差减小。C.可测性: 一般来说产生系统误差的具体原因都是可以找到的。因此也就能够测定它的大小,正负,至少在理论上说是可以测定的,所以又称为可测误差。根据系统误差产生的具体原因,又可把系统误差分为:(1)方法误差: 是由分析方法本身不够完善或有缺陷而造成的, 如滴定分析中所选用的指示剂指示的终点与计量点不相符;分析中干扰离子的影响未清除;重量分析中沉淀的溶解损失等。(2)仪器误差:由仪器本身不准确造成。如天平两臂不等,滴定管刻度不准,砝码未经校正。(3)试剂误差:所使用的试剂或蒸馏水不纯而造成的误差。(4)主观误差(操作误差):由操作人员一些生理上或习惯上的主观原因造成的。 如终点颜色的判断;重复滴定时,有人总想第二份滴定结果与第一份相吻合。在判断终点读数时,就有“先入为主”的影响。2.偶然误差(或称随机误差、未定误差)它是由无法避免和无法控制的偶然因素造成的。如测定时环境温度、湿度、仪器性能的微笑变化,或个人一时的辨别的差异而使读数不一致等。如天平和滴定管最后一位读数的不确定性。它的特点:大小和方向都不固定,也无法测量和校正,但多次测定也有规律性。A.对称性:经过多次重复测定,随机误差大小相等的正负误差出现的几率相等。B.单峰性:小误差出现的机会多,大误差出现的机会少。C.有界性:超出 3 的误差出现的机会很少,应属于过失。53第三章 分析化学中的数据处理3.过失误差由于分析人员工作上粗枝大叶不遵守操作规程等造成过失误差。如器皿不洁净、丢损试液,加错试剂,看错砝码,记录或计算错误等。二 、准确度和精密度1、准确度和误差准确度指测定值 x 和真实值 T 之间接近的程度, 两者越接近准确度越高。 用误差来衡量准确度的高低。绝对误差:E X T Ea X TaEa相对误差: 100%ErT绝对误差只反映误差的大小,而不能反映误差在真值中所占的百分率,所以相对误差更便于比较各种情况下测定结果的准确度。准确度的高低体现了在分析过程中,系统误差和随机误差对测定结果综合影响的大小,它决定了测定值的正确性。在实际工作中,真实值常常是不知道的,因此无法求出分析结果的准确度,因此不得不用另外一种方式来判断分析结果的好坏。2、精密度和偏差精密度指各次分析结果相互接近的程度,它反映了测定值的再现性。精密度的高低用偏差来衡量。偏差越小,精密度越高。常用的几种偏差表示方法为:(1)绝对偏差d x x (i =1,2,3,.n) 有“+”、“-”之分i in1x xini 1x x di i相对偏差 1 0 0 % 1 0 0 %drx x平均偏差d1 d2 . dn 1d x xin n无“+,-”之分相对平均d偏差 100%drx平均值虽然不是真值,但比单次测定结果更接近真值。而且平均值反映了测定数据的集中趋势,因此,测定值与平均值之差就体现了精密度的高低。通常以测定结果的相对平均偏差来衡量。(2)标准偏差与相对标准偏差使用平均偏差表示精密度比较简单,但这个表示方法有不足之处,因为在一系列的测定中,小偏差的测定总是占多数,大偏差占少数,按总的测定次数去求平均偏差,则大偏差得不到反映。因此,数理统计中,常采用标准偏差(标准差)来反映精密度。54第三章 分析化学中的数据处理在数理统计中,将一定条件下无限多次测定值称为总体,从总体中随机抽出的一组测定值称为样本,样本所含测定值的数目称为样本的大小或容量。若样本容量为 n,平行测定数据为x1,x2. xn ,则此样本平均值为 1x x ni当测定次数无限增多时,所得的平均值为总体平均值为:limnx当消除了系统误差后,得到的总体平均值 (n>30)即为待测组分的真值 T。当测定次数无限时,总体标准偏差 表示了各测定值 xi 对总体平均值的偏离程度。总体标准偏差2(xi )n2 :方差x 被平方,即强调了大偏差的作用。i一般测定次数 n< 20, 总体平均值不知道,则采用样本标准偏差来衡量该组数据的精密度:s2 2(x x) di in 1 n 1f=n-1:自由度(在 n 次测量中只有 n-1 个可变的偏差)s样本的相对标准偏差(变异系数 cv)为: sr 100%x以上反映了单位测定值的精密度。(3)平均值的标准偏差如果从同一总体中抽出容量相同的数个样本, 由此可以得到一系列样本的平均值x1,x2,.xn 。这些平均值也不会完全一致,但与任一样本中的各单位测定值相比,这些平均值的波动性更小,即精密度更高。x (n )nx :平均值的标准偏差;单次测定值的标准偏差有限次数的测定则有:sxsn55第三章 分析化学中的数据处理s :样本平均值的标准偏差。x*当n 时,x ,d (无限多次测定时的平均偏差)用统计学方法可以证明, n ,标准偏差与平均偏差有下列关系: 0.7979 0.80但如果测定次数少, d 与 s 与此相差较大。(4)极差R x xmax min相对极差= R 100%x偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。3、准确度与精密度的关系准确度用误差来表示,反映了测定结果的正确性,它与系统误差和随机误差都有关系,体现了系统误差和随机误差对测定结果综合影响的大小。精密度用偏差来表示,反映了测定值的再现性,偏差的大小仅与随机误差有关,体现了随机误差对测定结果的影响。显然,精密度好,是保证准确度高的先决条件。但精密度好却不一定准确度高。只有在消除了系统误差的前提下,精密度好其准确度必然高。三、误差的减免1、系统误差的消除可以采用一些校正的办法和制定标准规程的办法加以校正,使之接近消除。 (1)采用标准方法,找出校正数据 消除方法误差(2)实验前校正器皿和仪器 消除仪器误差(3)做空白实验 检验和消除试剂误差(4)做对照实验可以与标准试样的标准结果进行对照,与成熟的分析方法进行对照;由不同分析人员,不同实验室来进行对照实验。如对试样组分不完全清楚,可采用加标回收法。2、减小偶然误差由于多次测定后,偶然误差呈现一定规律性,故在消除系统误差的情况下,增加测定次数,取其平均值来消除或减小偶然误差。§ 3.2 随机误差的统计规律一、频数分布以下是在不涉及系统误差的情况下讨论的。56第三章 分析化学中的数据处理频数:每组内的数据个数根据测量数据的组值与响应的频数(或相对频数)绘制成频率分布直方图。相对频数 =频数样本容量由于随机误差的存在,分析数据具有分散性,又有向某个中心值集中的趋势,这种既分散又集中的特性就是随机误差分布的规律。二、正态分布当测量次数无限时,测量数据一般符合正态分布规律,其概论密度函数为:y=f(x)=12e2( x )22y 就是测定值 xi 出现的概论大小。:曲线的最高点对应的横坐标就是 ,即总体平均值,平均值出现的概论最大,消除了系统误差。 T:总体标准偏差, 是拐点之一到直线 x 的距离,表征测定值的分散程度。 小,峰瘦高; 大,峰胖矮(对于同一总体) 。一旦 、 确定,正态分布曲线的位置和形状也就确定了。所以 、 是正态分布的两个基本参数。这种正态分布用2N( 、 )表示。如果用 x 代替 x,就得到了随机误差的正态分布曲线。随机误差的特征:(1)对称性(2)单峰性(3)有界性:绝对值很大的误差出现的概率很小。57第三章 分析化学中的数据处理三、标准正态分布以标准偏差 为单位表示随机误差,引入变量 u。 xu正态分布曲线就变换为以标准偏差 为单位的 u值做横坐标的标准正态分布曲线,相应以 u 值为变量的函数 (u) 称为标准正态分布概率密度函数。1y (u) e22u2标准正态分布记为 N(0,1),标准正态分布曲线见图 3-3。四、随机误差概率的计算标准正态分布曲线与横坐标 到 之间的所夹的面积, 代表所有数据出现的总概率,其值为 100%即 1。因此落在 0 到 u 范围内的测量值出现的概率,就应为其所包围的面积与总面积之比。即概率=面积=u0(u)du不同 u 值时所占面积已用积分方法求得,并绘成各种形式的概率积分表,供查用。58第三章 分析化学中的数据处理例 1 计算测量值落在区间 1.64 内的概率。解: 概率=面积=u0( u)duxu x u查积分表 1.64 时,面积为 0.4495,求得测量值落在区间 1.64 内的概率P=2 0.4495=89.9%。同理,可求出测量值落在其它区间的概率为:面积 区间 概率%1.0 0.3413 68.31.96 0.4750 1.96 95.02.0 0.4773 2 95.52.58 0.4951 2.58 99.03.0 0.4987 3 99.7例 2 某班学生的 117 个数据基本遵从正态分布 N(66.62,0.212)求数据落在66.2067.08中的概率及大于 67.08的数据可能有几个?解: =66.62 =0.21当 x=66.20 时,x66.20 66.620.212.0查 2.19时,概率为 0.477359第三章 分析化学中的数据处理当 x=67.08 时x67.08 66.620.212.19查 2.19时,概率为 0.4857 缺图数据落在 66.2067.08内的概率为 0.4774+0.4857=96.3%数据大于 67.08 的概率为: P=0.5-0.4857=0.0143可能的个数为: 117 0.0143 2 个§ 3.3 少量数据的统计处理正态分布是无限测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限的测量。如何以统计的方法处理有限次测量数据,使其能合理地推断总体的特性?这是本节讨论的问题。一、t 分布曲线当测量数据不多时,总体标准偏差 是不知道的,只好用样本标准偏差 s来估计测定的分散情况。用 s 代替 ,必然引起正态分布的偏差,这时可用 t 分布来处理, t分布如图 3-4 所示,纵标仍为概率密度,但横坐标为统计量 t。t 定义为:t=x-st 分布曲线与正态分布曲线相似,只是 t 分布曲线随自由度 f 而改变。 f 时,t分布就趋近正态分布。与正态分布曲线一样, t 分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。不同的是 t 分布曲线形状不仅随 t 值而改变。 t 值已计算出来。60第三章 分析化学中的数据处理表中置信度用 P 表示,它表示在某一 t 值时,测定值落在 ( ts) 范围内的概率,落在此范围之外的概率为( 1-P)称为显著性水准,用 表示。由于 t 值与置信度及自由度有关,一般表示为t , 。p f例t0.05,10 ,表示置信度为 95%,自由度为 10 时的 t 值。理论上,只有当 f ,各置信度对应的 t 值才与相应的 u 值一致,实际上, f=20时,t 值与 u 值已十分接近了。二、平均值的置信区间由随机误差的区间概率可知,当用单次测量结果( x)来估计总体平均值 的范围,则 包括在 (x 1 ) 范围内的 P=68.3%,在(x 1.64 ) 范围内的概率 P=90%;在( x 1.96 ) 范围内的概率为 95%。它的数字表达式: x u不同置信度的 u 值可查表得到。若以样本平均值来估计总体平均值可能存在的区间,可按式 uxn对于少量数据,必须根据 t 分布进行统计处理。则有x ts xxtsn61第三章 分析化学中的数据处理它表示在一定置信度下,以平均值 x 为中心,包括总体平均值 的范围。这个范围就叫平均值的置信区间。对于置信区间的概念必须正确理解, 如 =47.50% 0.10%置信度为 95%,应当理解为在 47.50% 0.10%的区间内包括总体平均值 的概率为 95%。因为 是客观存在的,没有随机性 , 不能说它落在某一区间的概率为多少。例 3 对某未知试样中 Cl-的质量分数进行测定, 4 次结果为 47.64%、47.69%、47.52%、47.55%。计算置信度为 90%、95%、99%时,总体平均值 的置信区间。解: x 47.64% 47.69% 47.52% 47.55% 47.60%s2(x x)n 10.08%tsP=90%时 t0 . 1,0 =32.35 47.60% 0.01%xnP=95%时 t0 . 0 5=,3.18 =47.60 0.13%P=99%时 t0 . 0 1=,5.84 =47.60 0.23%可见,置信度越高,置信区间越大,即所估计的区间包括真值的可能性越大,在分析化学中一般将 P 定在 95%或 99%。三、显著性检验在实际工作中,经常遇到这样的情况,某一分析人员对标准试样进行分析,得到的平均值与标准值不完全一致;或同一分析人员采用两种不同方法对同一试样进行分析,得到的两组数据的平均结果不一致;或两个不同分析人员对同一试样进行分析时,两组数据的平均结果存在差异。这种差异是由随机误差引起的,还是它们之间有明显的系统误差?这类问题在统计学中属于“假设检验” 。如果分析结果之间存在“显著性差异” ,就认为它们之间有明显的系统误差;否则就认为没有系统误差,纯属偶然误差引起的,认为是正常的。显著性检验方法在分析化学中常用的有 t 种和 F 检验法。1t 检验法平均值与标准值的比较,目的就是检验平均值与标准之间是否有显著性差异。即检验分析方法或操作过程是否存在较大的系统误差。可对标准样品进行若干次分析,再利 用 t 检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。首先按下试计算 t 值:T xtsn62第三章 分析化学中的数据处理x Tt n s如果 t 值大于表中的 tp,f 值,则认为存在显著性差异,否则不存在。通常以 95%的置信度为检验、标准。也可以反过来理解,如果x tsn区间能将标准值 T 包括在其中,则即使 x 与 T 不完全一致,但也无显著性差异,因为按 t 分布规律这些差异是由随机误差引起的。例 4 采用某种新方法测定基准明矾中铝的质量分数,得到下列 9 个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%,已知明矾中铝含量的标准值(以理论值代替)为 10.77%。试问采用该新方法后,是否引 起系统误差 (P=95%)?解:n=9 f=9-1=8x =10.79%,s=0.042%xt ns1 0. 7 9 % 1 0. 7 7 %9 1. 4 30. 0 4 2 %查 P=0.95 f=8 时, t0 . 0 5=,2.31。 t t0.05,8 ,故 x与 之间不存在显著差异,即采用新方法后,没有引起明显的系统误差。2F 检验法和 t 检验法两组数据平均值的比较。不同分析人员或同一分析人员采用不同的方法,所得到的 平均值,一般是不相等的。判断这两个平均值之间是否存在显著性差异,可采用 F 检验法和 t 检验法。设两组数据为:n s1 x11n s2 x22(1)首先采用 F 检验法,判断两组数据的精密度有无明显差异。F2s大2s小F 检验的基本假设是如果两组测定值来自同一总体就应该具有相同或差异很小的方差,即 F 就接近于 1。根据两组数据的自由度,由 F 值表查出相应的 Fp, f ,与计算值 F比较,若 F Fp, f计 ,则以一定的置信度认为这两组数据的精密度存在显著性差异。可以63第三章 分析化学中的数据处理判断,其中某组数据具有较大的方差,即该组数据的精密度低,其准确度值得怀疑,因此不必再对两个 x 比较。如果 F计 Fp, f ,则 s1与s2 无显著性差异,那么再进行 t 检验。(2)用 t 检验判断两个平均值x 和1x 之间有无显著性差异,计算合并标准偏差 s:2s 偏差平方和 /总自由度=2 2(x x ) ( x x )1i 1 2 j 2n n1 22计算统计量 t 值:假设 x1和x2 属于同一总体,即 1 2x1tsn1= x2tsn2x x t1 2sn n1 2nn1 2tx x n n1 2 1 2s n n1 2查表如t计 t (表 3-3,t 值表),则认为两组数据不属于同一总体,有显著p,( n n1 2 2)性差异。若t计 t ,则上述假设成立,两组数据间无系统误差。p n n,( 1 2 2)表 3-4 置信度 95%时 F 值(单边)f sf s小大2 3 4 5 6 7 8 9 10 2 19.00 19.16 19.25 19.30 19.33 19.36 19.37 19.38 19.39 19.503 9.55 9.28 9.12 9.01 8.94 8.88 8.84 8.81 8.78 8.534 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.635 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.78 4.74 4.366 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 3.677 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.63 3.23894.464.264.073.863.843.633.693.483.583.373.503.293.443.233.393.183.343.132.932.7110 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.97 2.54 3.00 2.60 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.00f 大:大方差数据的自由度; f小:小方差数据的自由度。 表中所列 F 值用单侧检验时, 即检验某组数据的精密度是否大于或等于另一组数据的精密度,此时置信度为 95%(显著性水平为 0.05)。而用于判断两组数据的精密度是否有显著性差异时, 即一组数据的精密度可能大于、 等于或小于另一组数据的精密度时,64第三章 分析化学中的数据处理显著性水平为单侧检验时的两倍,即 0.10,因而此时的置信度 P=1-0.10=0.90(90%)。例 5 用两种方法测定合金中铌的质量分数,所得结果如下:第一法 1.26% 1.25% 1.22%第二法 1.35% 1.31% 1.33% 1.34%试问两种方法之间是否有显著性差异(置信度 90%)?n1 3 ,x1 1. 2 4 s%1 0. 0 2 1 %n2 4, x2 1.33%s2 0.017%解:2(0.021)F 1.53 查表 3-4,2(0.017)f =2 fs小 =3 F表 =9.55s大F F表,说明两组数据的标准偏差没有显著性差异,故求得合并标准偏差为s( x x ) (x x )i1 1 i 2 2n n1 220.019tx x n n1 2 1 2s n n1 21.24 1.33 3 40.019 3 46.21查表 3-4,当 P=0.90 时,f n1 n2 2 5 时,t0.10,5 =2.02。t t0.10,5 ,故两种分析方法之间存在显著性差异,必须找出原因,加以解决。例 6 在吸光光度分析中,用一台旧仪器测定溶液的吸光度 6 次,得标准偏差s =0.055;再用一台性能稍好的新仪器测定 4 次,得标准偏差 s2 =0.022。试问新仪器的1精密度是否显著地优于仪器的精密度?解: 在本题中,已知新仪器的性能较好,它的精密度不会比旧仪器的差,因此这是属于单边检验问题。n =6 , s1 =0.0551n =4, s2 =0.0222已知2 0.0552 0.0030s大2 0.0222 0.00048s小F2s大2s小0. 0 0 3 06. 2 50. 0 0 0 4 8查3-4 表,当 P=0.90 时, f n1 n2 2 5时,t0.10,5 2.02.t t0.10,5 ,故两种器皿之间不存在显著性差异, f 6 1 5 f 4 1 3F 9.01F F大 小 表 表例 7 采用两种不同的方法分析某种试样,用第一种方法分析 11 次,得标准偏差65第三章 分析化学中的数据处理s =0.21%;用第二种方法分析 9 次,得标准偏差 s2 =0.60%。试判断两种分析方法的精密1度之间是否有显著性差异?解 :在本例中,不论是第一种方法的精密度显著地优于或劣于第二种方法的精密度,都认为它们之间有显著性差异,因此,这是属于双边检验的问题。查表 3-4, f 9 1 8 表 , 表,故可以认为两大 , f小 11 1 10 ,F 3.07 F F种方法的精密度之间存在显著性差异。作出此种判断的置信度为 90%。四、异常值的取舍在实验中得到一组数据,往往个别数据离群较远,这一组数据称为异常值,又称可疑或极端值。如果这是由于过失造成的,如溶解试样有溶液溅出,滴定时加入了过量的滴定剂等等,则这一数据必须舍去。若并非这种情况,则对异常值不能随意取舍,特别是当测量数据较少时,异常值的取舍对分析结果产生很大的影响,必须慎重对待。对于不是因为过失而造成的异常值,应按一定的统计学方法进行处理。统计学处理异常值的方法有好几种,下面重点介绍处理方法较简单的 4d 法、Q 检验法及效果较好的格鲁布斯(Grubbs)法。1、4d 法根据正态分布规律,偏差超过 3 的个别测定值的概率小于 0.3%,故这一测量值通常可以舍去。而 0.80 ,3 4 ,即偏差超过 4 的个别测定值可以舍去。对于少量实验数据,只能用 s代替 ,用d 代替 ,故可粗略地认为,偏差大于 4d的个别测定值可以舍去。这样处理问题存在较大的误差,但是这种方法比较简单,不必查表,至今仍为人们所采用。当 4d 法与其他检验法矛盾时,应以其他法为基准。用4d 法判断异常值的取舍时, 首先求出异常值外的其余数据的平均值 x 和平均偏差d ,然后将异常值和平均值进行比较,如绝对差值大于 4d ,则将可疑值舍去,否则保留。例 8 测定某药物中钴的含量 (1g g ),得结果如下:1.25,1.27,1.31,1.40g g1试问 1.40 这个数据是否保留?解:首先不计异常值 1.40,求得其余数据的平均值 x 和平均偏差 d 为:x =1.28 d =0.023异常值与平均值的差的绝对值为 1.40 1.28 0.12 4d (0.092),故 1.40这一数据应舍去。66第三章 分析化学中的数据处理表 3-5 GP,n 值表n 置信度 P95% 97.5% 99%3 1.15 1.15 1.154 1.46 1.48 1.495 1.67 1.71 1.756 1.82 1.89 1.94 7 1.94 2.02 2.108 2.03 2.13 2.22 9 2.11 2.21 2.3210 2.18 2.29 2.4111 2.23 2.36 2.4812 2.29 2.41 32.55 13 2.33 2.46 2.6114 2.37 2.51 2.6315 2.41 2.55 2.7120 2.56 2.71 2.882、格鲁布斯( Grubbs)法有一组数据,从小到大排列为: x1, x2,. xn 1, xn ,其中 x1 或x2 可能是异常值。用格鲁布斯法判断时,首先计算出该组数据的平均值及标准偏差,再根据统计量 G进行判断。设x1是可疑的,则 Gx x1s若x 是可疑的,则nGx xns将计算所得 G 值与表 3-5 中相应数据比较,若 G Ga,n ,则异常值应舍去,否则保留。格鲁布斯法最大的优点,是在判断异常值的过程中,引入了正态分布中的两个最重要的两个样本参数 x 和s,故方法的准确性较好。这种方法的缺点是需要计算 x 和 s,手续稍麻烦。例 9 前一例中的实验数据, 用格鲁布斯法判断时, 1.40这个数据是否保留 (置信度95%)?解: x =1.31 s=0.066Gx xns1.40 1.310.0661.3667第三章 分析化学中的数据处理查表 3-5,G0.05,4 1.46, G G0.05,4 ,故 1.40 这个数据应该保留。此结论与前一例中用 4d 法判断所得结论不同。在这种情况下,一般取格鲁布斯法的结论,因为这种方法的可靠性较高。3、Q 检验法设一组数据,从小到大排列为:x1, x2,. xn 1, xn设x 为异常值,则统计量nQx xn nx xn 11如果x 为异常值,则1Qx x2 1x xn 1式中分子为异常值与其相邻的一个数值的差值, 分母为整组数据的极差。 Q 值越大,说明x 离群越远。Q 称为“舍弃商”。统计学家已经计算出不同置信度时的 Q 值(表 3-6),n当计算所得 Q 值大于表中的 Q 值时,该异常值即应舍去。否则应于保留。例 10 例 9 中的实验数据,用 Q 检验法判断时, 1.40 这个数据应保留否(置信度90%)?解:Q1.40 1.311.40 1.250.60已知 n=4,查表 3-6,Q =0.76,Q Q0.90 ,故 1.40这个数据应予保留。0.90表3-6 Q 值表测定次数 n 3 4 5 6 7 8 9 10置 90% 0.94 0.76 0.64 0.56 0.51 0.47 0.44 0.41信 95% 0.98 0.85 0.73 0.64 0.59 0.54 0.51 0.48度 99% 0.99 0.93 0.82 0.74 0.68 0.63 0.60 0.57最后应该指出。异常值的取舍是一项十分重要的工作。在实验过程中得到一组数据后,如果不能确定个别异常值确系由于“过失”引起的,我们就不能轻易地去掉这个数据,而是要用上述统计检验方法进行判断之后,才能确定取舍。在这一步工作完成后,我们就可以计算数据的平均值标准偏差以及进行其他有关数理统计工作。§ 3.5 有效数字及其运算规则一、有效数字的含义及位数为了得到准确的分析结果,不仅要准确地测量,而且还要正确的记录和运算,即记录的数字不仅表示数量的大小,而且要正确的反映测量的精密程度。如某物重 0.5180g、其中 0.518是准确的,“0”位可疑,即其有上下一个单位的误差,68第三章 分析化学中的数据处理也就是说此物重的绝对误差为 0.0001g相对误差为0.00010.5180100% 0.02%若写成 0.518g,则 d= 0.001 gdr0. 0 0 11 0 0 % 0. 2 %0. 5 1 8可见多一位或少一位零,从数字角度关系不大,却反映准确程度相差 10倍。有效数字分析工作中实际能测量到的数字,如:1.0005 0.5000 0.540 0.0054 0.556.230 10 31.05 1.86410 0.48% 0.002%有效数字位数 5 4 3 2 1 数字与数字之后的 “0”是有效数字。 如 0.2100;而数字前面的“0”只起定位作用,不是有效数字。如 0.0758。二、有效数字的运算规则1.加减法几个数相加减时, 和或差的有效数字的保留, 应以小数点后位数最少的数据为根据,即决定于绝对误差最大的那个数据。例如:0.0121+25.64+1.05782=26.70992,应依 25.64为依据,即:原式 =26.71小数点后位数的多少反映了测量绝对误差的大小,如小数后 1 位,它的绝对误差为0.1,而小数点有 2 位,绝对误差为 0.01。可见小数点具有相同位数的数字,其绝对误差的大小也相同。而且绝对误差的大小仅与小数部分有关,而与有效数字位数无关。所以在加减运算中,原始数据的绝对误差,决定了计算结果的绝对误差的大小,计算结果的绝对误差必然受到绝对误差最大的那个原始数据的制约而与之处在同一水平上。2.乘除法几个数相乘、除时,其积或商的有效数字应与参加运算的数字中,有效数字位数最少的那个数字相同。即所得结果的位数取决于相对误差最大的那个数字。例:0.0325 5.103 60.06139.80.0712504 =0.0713商应与 0.0325在同一水平上,即取 3 位有效数字。又如: 3.001 2.1 6.3有效数字的位数的多少反映了测量相对误差的大小。如 2 位有效数字 1.0 和 9.9 它们的绝对误差都是 0.1,相对误差分别为 10%和 1%,即两位有效数字的相对误差总在 1% 10%之间;三位有效数字的相对误差总在0.1% 1%之间;四位有效数字的相对误差总在 0.01% 0.1%之间。可见,相同有效数字位数的数字,其相对误差E 处在同一水平上,而且 Er 的大小,r69第三章 分析化学中的数据处理仅与有效数字位数有关,而与小数点位数无关。因此,积和商的相对误差必然受到相对误差最大的那个有效数字的制约,且在同一水平上。例如前例: 0.00010.0325 100% 0.3% 0.03255.103 0.02%60.06 0.02%139.8 0.07%0.0713 0.1%总之,不论是加减,还是乘除运算,都要遵循一个原则,即计量结果的精度取决于测量精度最差的那个原始数据的精度。而加减法和乘除法要从不同的角度分别考虑其原因,则与误差传递理论有关,已超出本课的讨论范围,在此不作介绍。3.数字的修约原则计算结果要按有效数字的计算规则保留适当位数修约去多余数字。(1)四舍五入规则 (2)四舍六入五成双:当尾数 4 时舍去,尾数 6 时进位;当尾数为 5 时,则看留下来的末位数是偶数还是奇数。末位数是奇数时, 5 进位,是偶数时, 5 舍去。如: 4.175,4.165,处理为三位有效数字时则为: 4.18 ,4.16当被修约的 5 后面还有数字时, 该数总比 5 大,这种情况下, 该数以进位为宜。如:2.451 2.5 83.5009 84注意 :在修约数字时, 只能对原始数据一次修约到所需位数, 而不能连续多次修约。如:要把 17.46 修约为两位,只能一次修约为 17。而不能 17.46 17.5 18对有效数字记录与运算要注意以下几点:(1)记录时保留一位可疑数字。(2)运算中,采用“四舍五入”或“四舍六入五成双”修约原则,先修约,后计算。 (3)首位数字大于或等于 8 的,则有效数字位数可多算一位(主要指乘除计算) ,如:8.37 是三位数,可看作四位。 0.9812 是四位数,可看作五位。8.37 的Er0.01 1.2 0 0.1%008.3710.00 的Er0.0110.000.1%