分析化学中的数据处理.docx
《分析化学中的数据处理.docx》由会员分享,可在线阅读,更多相关《分析化学中的数据处理.docx(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章 分析化学中的数据处理第三章 分析化学中的数据处理 3.1 误差及其表示方法定量分析(Quantitive Analysis)的目的是通过一系列的分析步骤,来获得被测组分的准确含量。但是,即使最可靠的分析方法,使用最精密的仪器,由技术最熟练的分析人员操作,也难获得绝对准确的结果。由同一个人,在同样条件下对同一试样进行多次测定,所得结果也不一定是一致的。即分析过程中误差是客观存在的。所以我们应根据实际需要对分析结果的可靠性和精确程度作出合理的评价和正确的表示。 同时还应查明产生误差的原因及其规律性,采取减免误差的有效措施,从而不断提高分析测定的准确程度。一、误差的分类根据误差的来源和性质,
2、可将误差分为两类:1.系统误差系统误差又称可测误差,是由某种固定的原因引起的误差。它们的突出特点是:A.单向性: 它对分析结果的影响比较固定,可使测定结果系统偏低或偏高。B.重现性: 当重复测定时,它会重复出现。增加测定次数不能使系统误差减小。C.可测性: 一般来说产生系统误差的具体原因都是可以找到的。因此也就能够测定它的大小,正负,至少在理论上说是可以测定的,所以又称为可测误差。根据系统误差产生的具体原因,又可把系统误差分为:(1)方法误差: 是由分析方法本身不够完善或有缺陷而造成的, 如滴定分析中所选用的指示剂指示的终点与计量点不相符;分析中干扰离子的影响未清除;重量分析中沉淀的溶解损失等
3、。(2)仪器误差:由仪器本身不准确造成。如天平两臂不等,滴定管刻度不准,砝码未经校正。(3)试剂误差:所使用的试剂或蒸馏水不纯而造成的误差。(4)主观误差(操作误差):由操作人员一些生理上或习惯上的主观原因造成的。 如终点颜色的判断;重复滴定时,有人总想第二份滴定结果与第一份相吻合。在判断终点读数时,就有“先入为主”的影响。2.偶然误差(或称随机误差、未定误差)它是由无法避免和无法控制的偶然因素造成的。如测定时环境温度、湿度、仪器性能的微笑变化,或个人一时的辨别的差异而使读数不一致等。如天平和滴定管最后一位读数的不确定性。它的特点:大小和方向都不固定,也无法测量和校正,但多次测定也有规律性。A
4、.对称性:经过多次重复测定,随机误差大小相等的正负误差出现的几率相等。B.单峰性:小误差出现的机会多,大误差出现的机会少。C.有界性:超出 3 的误差出现的机会很少,应属于过失。53第三章 分析化学中的数据处理3.过失误差由于分析人员工作上粗枝大叶不遵守操作规程等造成过失误差。如器皿不洁净、丢损试液,加错试剂,看错砝码,记录或计算错误等。二 、准确度和精密度1、准确度和误差准确度指测定值 x 和真实值 T 之间接近的程度, 两者越接近准确度越高。 用误差来衡量准确度的高低。绝对误差:E X T Ea X TaEa相对误差: 100%ErT绝对误差只反映误差的大小,而不能反映误差在真值中所占的百
5、分率,所以相对误差更便于比较各种情况下测定结果的准确度。准确度的高低体现了在分析过程中,系统误差和随机误差对测定结果综合影响的大小,它决定了测定值的正确性。在实际工作中,真实值常常是不知道的,因此无法求出分析结果的准确度,因此不得不用另外一种方式来判断分析结果的好坏。2、精密度和偏差精密度指各次分析结果相互接近的程度,它反映了测定值的再现性。精密度的高低用偏差来衡量。偏差越小,精密度越高。常用的几种偏差表示方法为:(1)绝对偏差d x x (i =1,2,3,.n) 有“+”、“-”之分i in1x xini 1x x di i相对偏差 1 0 0 % 1 0 0 %drx x平均偏差d1 d
6、2 . dn 1d x xin n无“+,-”之分相对平均d偏差 100%drx平均值虽然不是真值,但比单次测定结果更接近真值。而且平均值反映了测定数据的集中趋势,因此,测定值与平均值之差就体现了精密度的高低。通常以测定结果的相对平均偏差来衡量。(2)标准偏差与相对标准偏差使用平均偏差表示精密度比较简单,但这个表示方法有不足之处,因为在一系列的测定中,小偏差的测定总是占多数,大偏差占少数,按总的测定次数去求平均偏差,则大偏差得不到反映。因此,数理统计中,常采用标准偏差(标准差)来反映精密度。54第三章 分析化学中的数据处理在数理统计中,将一定条件下无限多次测定值称为总体,从总体中随机抽出的一组
7、测定值称为样本,样本所含测定值的数目称为样本的大小或容量。若样本容量为 n,平行测定数据为x1,x2. xn ,则此样本平均值为 1x x ni当测定次数无限增多时,所得的平均值为总体平均值为:limnx当消除了系统误差后,得到的总体平均值 (n30)即为待测组分的真值 T。当测定次数无限时,总体标准偏差 表示了各测定值 xi 对总体平均值的偏离程度。总体标准偏差2(xi )n2 :方差x 被平方,即强调了大偏差的作用。i一般测定次数 n 20, 总体平均值不知道,则采用样本标准偏差来衡量该组数据的精密度:s2 2(x x) di in 1 n 1f=n-1:自由度(在 n 次测量中只有 n-
8、1 个可变的偏差)s样本的相对标准偏差(变异系数 cv)为: sr 100%x以上反映了单位测定值的精密度。(3)平均值的标准偏差如果从同一总体中抽出容量相同的数个样本, 由此可以得到一系列样本的平均值x1,x2,.xn 。这些平均值也不会完全一致,但与任一样本中的各单位测定值相比,这些平均值的波动性更小,即精密度更高。x (n )nx :平均值的标准偏差;单次测定值的标准偏差有限次数的测定则有:sxsn55第三章 分析化学中的数据处理s :样本平均值的标准偏差。x*当n 时,x ,d (无限多次测定时的平均偏差)用统计学方法可以证明, n ,标准偏差与平均偏差有下列关系: 0.7979 0.
9、80但如果测定次数少, d 与 s 与此相差较大。(4)极差R x xmax min相对极差= R 100%x偏差和极差的数值都在一定程度上反映了测定中随机误差影响的大小。3、准确度与精密度的关系准确度用误差来表示,反映了测定结果的正确性,它与系统误差和随机误差都有关系,体现了系统误差和随机误差对测定结果综合影响的大小。精密度用偏差来表示,反映了测定值的再现性,偏差的大小仅与随机误差有关,体现了随机误差对测定结果的影响。显然,精密度好,是保证准确度高的先决条件。但精密度好却不一定准确度高。只有在消除了系统误差的前提下,精密度好其准确度必然高。三、误差的减免1、系统误差的消除可以采用一些校正的办
10、法和制定标准规程的办法加以校正,使之接近消除。 (1)采用标准方法,找出校正数据 消除方法误差(2)实验前校正器皿和仪器 消除仪器误差(3)做空白实验 检验和消除试剂误差(4)做对照实验可以与标准试样的标准结果进行对照,与成熟的分析方法进行对照;由不同分析人员,不同实验室来进行对照实验。如对试样组分不完全清楚,可采用加标回收法。2、减小偶然误差由于多次测定后,偶然误差呈现一定规律性,故在消除系统误差的情况下,增加测定次数,取其平均值来消除或减小偶然误差。 3.2 随机误差的统计规律一、频数分布以下是在不涉及系统误差的情况下讨论的。56第三章 分析化学中的数据处理频数:每组内的数据个数根据测量数
11、据的组值与响应的频数(或相对频数)绘制成频率分布直方图。相对频数 =频数样本容量由于随机误差的存在,分析数据具有分散性,又有向某个中心值集中的趋势,这种既分散又集中的特性就是随机误差分布的规律。二、正态分布当测量次数无限时,测量数据一般符合正态分布规律,其概论密度函数为:y=f(x)=12e2( x )22y 就是测定值 xi 出现的概论大小。:曲线的最高点对应的横坐标就是 ,即总体平均值,平均值出现的概论最大,消除了系统误差。 T:总体标准偏差, 是拐点之一到直线 x 的距离,表征测定值的分散程度。 小,峰瘦高; 大,峰胖矮(对于同一总体) 。一旦 、 确定,正态分布曲线的位置和形状也就确定
12、了。所以 、 是正态分布的两个基本参数。这种正态分布用2N( 、 )表示。如果用 x 代替 x,就得到了随机误差的正态分布曲线。随机误差的特征:(1)对称性(2)单峰性(3)有界性:绝对值很大的误差出现的概率很小。57第三章 分析化学中的数据处理三、标准正态分布以标准偏差 为单位表示随机误差,引入变量 u。 xu正态分布曲线就变换为以标准偏差 为单位的 u值做横坐标的标准正态分布曲线,相应以 u 值为变量的函数 (u) 称为标准正态分布概率密度函数。1y (u) e22u2标准正态分布记为 N(0,1),标准正态分布曲线见图 3-3。四、随机误差概率的计算标准正态分布曲线与横坐标 到 之间的所
13、夹的面积, 代表所有数据出现的总概率,其值为 100%即 1。因此落在 0 到 u 范围内的测量值出现的概率,就应为其所包围的面积与总面积之比。即概率=面积=u0(u)du不同 u 值时所占面积已用积分方法求得,并绘成各种形式的概率积分表,供查用。58第三章 分析化学中的数据处理例 1 计算测量值落在区间 1.64 内的概率。解: 概率=面积=u0( u)duxu x u查积分表 1.64 时,面积为 0.4495,求得测量值落在区间 1.64 内的概率P=2 0.4495=89.9%。同理,可求出测量值落在其它区间的概率为:面积 区间 概率%1.0 0.3413 68.31.96 0.475
14、0 1.96 95.02.0 0.4773 2 95.52.58 0.4951 2.58 99.03.0 0.4987 3 99.7例 2 某班学生的 117 个数据基本遵从正态分布 N(66.62,0.212)求数据落在66.2067.08中的概率及大于 67.08的数据可能有几个?解: =66.62 =0.21当 x=66.20 时,x66.20 66.620.212.0查 2.19时,概率为 0.477359第三章 分析化学中的数据处理当 x=67.08 时x67.08 66.620.212.19查 2.19时,概率为 0.4857 缺图数据落在 66.2067.08内的概率为 0.47
15、74+0.4857=96.3%数据大于 67.08 的概率为: P=0.5-0.4857=0.0143可能的个数为: 117 0.0143 2 个 3.3 少量数据的统计处理正态分布是无限测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限的测量。如何以统计的方法处理有限次测量数据,使其能合理地推断总体的特性?这是本节讨论的问题。一、t 分布曲线当测量数据不多时,总体标准偏差 是不知道的,只好用样本标准偏差 s来估计测定的分散情况。用 s 代替 ,必然引起正态分布的偏差,这时可用 t 分布来处理, t分布如图 3-4 所示,纵标仍为概率密度,但横坐标为统计量 t。t 定义为:t=x
16、-st 分布曲线与正态分布曲线相似,只是 t 分布曲线随自由度 f 而改变。 f 时,t分布就趋近正态分布。与正态分布曲线一样, t 分布曲线下面一定区间内的积分面积,就是该区间内随机误差出现的概率。不同的是 t 分布曲线形状不仅随 t 值而改变。 t 值已计算出来。60第三章 分析化学中的数据处理表中置信度用 P 表示,它表示在某一 t 值时,测定值落在 ( ts) 范围内的概率,落在此范围之外的概率为( 1-P)称为显著性水准,用 表示。由于 t 值与置信度及自由度有关,一般表示为t , 。p f例t0.05,10 ,表示置信度为 95%,自由度为 10 时的 t 值。理论上,只有当 f
17、,各置信度对应的 t 值才与相应的 u 值一致,实际上, f=20时,t 值与 u 值已十分接近了。二、平均值的置信区间由随机误差的区间概率可知,当用单次测量结果( x)来估计总体平均值 的范围,则 包括在 (x 1 ) 范围内的 P=68.3%,在(x 1.64 ) 范围内的概率 P=90%;在( x 1.96 ) 范围内的概率为 95%。它的数字表达式: x u不同置信度的 u 值可查表得到。若以样本平均值来估计总体平均值可能存在的区间,可按式 uxn对于少量数据,必须根据 t 分布进行统计处理。则有x ts xxtsn61第三章 分析化学中的数据处理它表示在一定置信度下,以平均值 x 为
18、中心,包括总体平均值 的范围。这个范围就叫平均值的置信区间。对于置信区间的概念必须正确理解, 如 =47.50% 0.10%置信度为 95%,应当理解为在 47.50% 0.10%的区间内包括总体平均值 的概率为 95%。因为 是客观存在的,没有随机性 , 不能说它落在某一区间的概率为多少。例 3 对某未知试样中 Cl-的质量分数进行测定, 4 次结果为 47.64%、47.69%、47.52%、47.55%。计算置信度为 90%、95%、99%时,总体平均值 的置信区间。解: x 47.64% 47.69% 47.52% 47.55% 47.60%s2(x x)n 10.08%tsP=90%
19、时 t0 . 1,0 =32.35 47.60% 0.01%xnP=95%时 t0 . 0 5=,3.18 =47.60 0.13%P=99%时 t0 . 0 1=,5.84 =47.60 0.23%可见,置信度越高,置信区间越大,即所估计的区间包括真值的可能性越大,在分析化学中一般将 P 定在 95%或 99%。三、显著性检验在实际工作中,经常遇到这样的情况,某一分析人员对标准试样进行分析,得到的平均值与标准值不完全一致;或同一分析人员采用两种不同方法对同一试样进行分析,得到的两组数据的平均结果不一致;或两个不同分析人员对同一试样进行分析时,两组数据的平均结果存在差异。这种差异是由随机误差引
20、起的,还是它们之间有明显的系统误差?这类问题在统计学中属于“假设检验” 。如果分析结果之间存在“显著性差异” ,就认为它们之间有明显的系统误差;否则就认为没有系统误差,纯属偶然误差引起的,认为是正常的。显著性检验方法在分析化学中常用的有 t 种和 F 检验法。1t 检验法平均值与标准值的比较,目的就是检验平均值与标准之间是否有显著性差异。即检验分析方法或操作过程是否存在较大的系统误差。可对标准样品进行若干次分析,再利 用 t 检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。首先按下试计算 t 值:T xtsn62第三章 分析化学中的数据处理x Tt n s如果 t 值大于表
21、中的 tp,f 值,则认为存在显著性差异,否则不存在。通常以 95%的置信度为检验、标准。也可以反过来理解,如果x tsn区间能将标准值 T 包括在其中,则即使 x 与 T 不完全一致,但也无显著性差异,因为按 t 分布规律这些差异是由随机误差引起的。例 4 采用某种新方法测定基准明矾中铝的质量分数,得到下列 9 个分析结果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%,已知明矾中铝含量的标准值(以理论值代替)为 10.77%。试问采用该新方法后,是否引 起系统误差 (P=95%)?解:n=9 f=9-1=8x =
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分析化学 中的 数据处理
限制150内