《误差与数据处理.pptx》由会员分享,可在线阅读,更多相关《误差与数据处理.pptx(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/2/19 (3 3)相对真值 是是指指采采用用多多种种可可靠靠的的分分析析方方法法,由由具具有有丰丰富富经经验验的的分分析析人人员员经经过过反反复复多多次次仔仔细细测测定定,得得出出的的比比较较准准确确的的结结果果,称称为为标标准准值值。一一般般用用此此值值代代表表该该组组分分的的真真实实含含量量,如如科科学学实实验验中中使使用用的的标标准准试试样样(标样)(标样)。2 2 平均值(平均值()算术平均值比单次测量值更接近真值,表示数据的集中趋势,一般以平均值报告分析结果 一组测量数据按大小顺序排列,中间一个数即为中位数。最接近平均值,粗略表示数据的集中趋势3 中位数()第1页/共55
2、页2023/2/19 (1)准确度(Accuracy)分析结果与真实值的接近程度 准确度的高低用误差的大小来衡量;4 准确度和误差(2)表示形式:绝对误差(Ea)测量值与真值之间的差值,有正负。相对误差(Er),误差在真值中所占的百分率,相对误差能更好的表明准确度的高低。第2页/共55页2023/2/19(1)精密度(Precision)多次测量值之间相互接近程度,表示数据的分散程度。精密度的好坏用偏差来表示,与平均值作比较(2)表示形式:5 精密度和偏差 绝对偏差:个别测定值与平均值之间的差值。相对偏差=平均偏差:相对平均偏差:第3页/共55页2023/2/19标准偏差:(n20)相对标准偏
3、差:(relative standard deviation,RSD)又称 变异系数(CV)标准偏差比平均偏差更灵敏的表示出较大偏差的存在和测定次数的影响 如有3组数据如下:1.25.98,26.02,26.02,25.98,25.98,25.98,26.02,26.022.25.98,26.02,25.98,26.023.26.02,26.01,25.96,26.01三组的平均偏差相同为0.02,而标准偏差s分别为0.021,0.023,0.027第4页/共55页2023/2/19估计误差的范围,粗略衡量精密度估计误差的范围,粗略衡量精密度,适用于少数几次测,适用于少数几次测定中。定中。极差
4、(R)相对极差:如果只有两个测量值,又称为相差和相对相差 例:实验数据处理中平均值和相对相差的应用6.重复性和再现性 重复性:同一分析人员在同一条件下所得测量值的精密度 再现性:不同分析人员或不同实验室之间在各自的条件下 所得分析结果的精密度第5页/共55页2023/2/19 例:A、B、C、D 四个分析工作者对同一铁标样(wFe=37.40%)中的铁含量进行测量,结果如图示,比较其准确度与精密度。36.00 36.50 37.00 37.50 38.00测量点平均值真值ABCD精密度低,表观准确度高精密度高,准确度高精密度高,准确度低精密度低,准确度低(不可靠)(不可靠)准确度和精密度的关系
5、第6页/共55页2023/2/19精密度和准确度的关系精密度和准确度的关系(1 1)精密度是保证准确度的先决条件;精密度是保证准确度的先决条件;(2 2)精密度高,不一定准确度高;精密度高,不一定准确度高;对一组数据的评价要从精密度和准确度两方面进行,在精密度高的情况下,再判断准确度的高低.第7页/共55页2023/2/191.系统误差:由某种固定原因引起,是影响准确度的主 要因素(1)特点 a.单向性 正负固定偏向一边;b.重复性 在同一条件下,平行测定重复出现 c.可测性 可检测并能校正 影响准确度,不影响精密度(2)产生原因系统误差和偶然误差 方法误差选择的方法不够完善 例:重量分析中沉
6、淀的溶解损失;滴定分析中指示剂选择不当第8页/共55页2023/2/19仪器误差和试剂误差仪器本身不够精确,所用试剂不纯 例:天平两臂不等,砝码未校正;滴定管,容量瓶未校正 例:去离子水不合格;试剂纯度不够(含待测组份或干扰离子)操作误差由分析人员所掌握的操作与正确的操作有差 别引起的 例:洗涤沉淀过分或未充分;灼烧温度过高或过低主观误差操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅;滴定管读数习惯性偏高或偏低。第9页/共55页2023/2/192.2.随机误差:随机误差:由一些随机的偶然的因素造成,不可测,由一些随机的偶然的因素造成,不可测,决定精密度决定精密度(1)特点 a.不恒定时
7、大,时小,时正,时负 b.难以校正 c.服从正态分布(统计规律)小误差出现的几率大,大误差出现的几率小,绝对值相等的正负误差出现的几率相等。(2)减小办法 适当增加测定次数3.过失误差 主要指工作中的差错,由于工作粗枝大叶,不按规程办事等原因造成第10页/共55页2023/2/19 公差 生产部门对于分析结果允许误差的一种表示方法 1.公差(相对误差):待测组分质量分数为20%,公差=1.0%,则允许:19.8%含量 20.2%2.公差(绝对误差):试样含S%=0.020%,公差=0.002%则允许:0.018%S%0.022%第11页/共55页2023/2/193.2 有效数字及其运算有效数
8、字1、有效数字:分析工作中实际能测到的数字。在一个数据中,除最后一位是不确定的外,其它各位都是确定的,一般认为一个数据的最后一位数有1的绝对误差2、有效数字位数的判断(1)零的作用,自然数前的“0”是定位,中间或后边的为有 效数字。如:0.0032050,为5位有效数字(2)一些常数,分数,如e,等有效数字为无限多位(3)对指数a10b,以a的有效数字为准。如2.0105,2位第12页/共55页2023/2/19(4)pH,pK,lgK等整数部分是方次,有效数字是小数部分 如pH=5.60,则H+=2.510-6,应为2位。(5)数字后的0含义不清楚时,最好用指数形式表示:1000(1.010
9、3,1.00103,1.000103)3 3、使用过程中注意问题使用过程中注意问题(1 1)根据分析方法和仪器准确度来决定,应使数值中只)根据分析方法和仪器准确度来决定,应使数值中只有最后一位数是可疑的。有最后一位数是可疑的。例如用分析天平称取试样时应写例如用分析天平称取试样时应写作作0.5000g,而称取试样而称取试样0.5g,则表示是用台秤称量;则表示是用台秤称量;从滴定管放出的溶液体积写作从滴定管放出的溶液体积写作24.00mL,用量筒量取的用量筒量取的体积写作体积写作24mL。(2 2)常量组成的重量法与滴定法测定,方法误差约常量组成的重量法与滴定法测定,方法误差约0.1%0.1%,一
10、,一 般取四位有效数字。般取四位有效数字。第13页/共55页2023/2/19有效有效数字修约规则数字修约规则 规定:规定:“四舍六入五成双四舍六入五成双”:4 4 舍去,舍去,6 6 进位进位 =5 =5 进位后为偶进位;进位后为偶进位;进位后为奇进位后为奇,舍去舍去 当当5 5后还有不为后还有不为0 0的数字时的数字时,进位进位 (3 3)仪器分析法结果一般保留)仪器分析法结果一般保留2-32-3位有效数字。位有效数字。(4 4)凡涉及化学平衡的有关计算,由于平衡常数的有效数)凡涉及化学平衡的有关计算,由于平衡常数的有效数字多为字多为2 2位,一般保留位,一般保留2 2位有效数字位有效数字
11、(5 5)原子量、分子量数值的使用,根据需要选取相应有效)原子量、分子量数值的使用,根据需要选取相应有效数字数字如7.557.457.4501只允许一次修约到位,不许分次修约 3.148()第14页/共55页2023/2/19 运算规则运算规则1 1、加加减减法法:几几个个数数据据相相加加减减时时,有有效效数数字字的的保保留留以以小小数数点后位数最少点后位数最少的数据为准的数据为准,因为这个数的绝对误差最大。因为这个数的绝对误差最大。0.0121+25.64+1.05782=0.01+25.64+1.06=26.0.0121+25.64+1.05782=0.01+25.64+1.06=26.7
12、1712 2、乘除法:、乘除法:在乘除法运算中,有效数字的位数与几个数在乘除法运算中,有效数字的位数与几个数中相对误差最大的数相对应,根据中相对误差最大的数相对应,根据有效数字位数最少有效数字位数最少的的数来修约。数来修约。0.012125.641.05782=0.012125.61.060.012125.641.05782=0.012125.61.06=0.328 0.328 第15页/共55页2023/2/19注:注:(1 1)在在乘乘除除法法运运算算中中,遇遇到到首首数数大大于于或或等等于于9 9的的数数字字,有有效效数数字字的的位位数数可可多多保保留留1 1位位,如如910910(四位
13、),(四位),9.839.83(四位)(四位)(2 2)使使用用计计算算器器运运算算时时,不不必必对对每每一一步步修修约约,但但应应 正正确确保保留留最最后后结结果果的的有有效效数数字字位数。位数。第16页/共55页2023/2/19例1 分析铁矿石中铁的质量分数,得如下数据:37.45%,37.20%,37.50%,37.30%,37.25%。计算此结果的平均值、中位数、极差、平均偏差、标准偏差、相对标准偏差。R=37.50%-37.20%=0.30%第17页/共55页2023/2/19第18页/共55页2023/2/19本部分学习要求一、掌握一、掌握 1 1、定量分析一般过程及每个步骤的基
14、本要点。、定量分析一般过程及每个步骤的基本要点。2 2、下列概念的含义,彼此间的相互关系及计算、下列概念的含义,彼此间的相互关系及计算 算算术术平平均均值值,绝绝对对偏偏差差和和相相对对偏偏差差,平平均均偏偏差差和和相相对对平平均均偏偏差差,标准标准 偏差与相对标准偏差(变异系数),中位数,极差。偏差与相对标准偏差(变异系数),中位数,极差。3 3、有效数字的意义及位数的确定,数字修约规则及有效数字运算、有效数字的意义及位数的确定,数字修约规则及有效数字运算规则规则二、理解二、理解 1 1、系统误差和随机误差的性质和特点。、系统误差和随机误差的性质和特点。2 2、准准确确度度与与误误差差,精精
15、密密度度与与偏偏差差的的含含义义以以及及准准确确度度与与精精密密度度的的关关系。系。3 3、误差产生的原因及提高分析结果准确度的方法。、误差产生的原因及提高分析结果准确度的方法。第19页/共55页2023/2/19数据处理的任务是数据处理的任务是研究如何以有效的方式收集、研究如何以有效的方式收集、整理和分析受到随机性影响的数据,以对所考察整理和分析受到随机性影响的数据,以对所考察的问题作出推断和预测,即的问题作出推断和预测,即由样本推断总体由样本推断总体。1.总体:总体:所研究对象的某特性值的全体叫总体所研究对象的某特性值的全体叫总体(母体),对分析化学来说,在指定条件下,作(母体),对分析化
16、学来说,在指定条件下,作无限次测量所得无限多的数据的集合,就叫作总无限次测量所得无限多的数据的集合,就叫作总体。体。2.样本:样本:从总体中随机抽取的一组数据。从总体中随机抽取的一组数据。样本来自总体并且代表和反映总体。对总体的反样本来自总体并且代表和反映总体。对总体的反映通过统计量来进行。映通过统计量来进行。3.样本大小(容量):样本大小(容量):数据的个数数据的个数3.3 分析化学中的数据处理 第20页/共55页2023/2/19 随机误差的正态分布1、频数分布 设有一矿石试样,在相同条件下用吸光光度法测定其中铜的质量分数,共有100个测量值。测量数据既有分散性又有集中性以总体平均值:表示
17、分散性若无系统误差,则总体平均值就是真值以总体标准偏差(均方根偏差)表示集中性第21页/共55页2023/2/19先将这组测量数据分组频数:每组数据的个数。相对频数:频数/数据的总和绘制相对频数分布直方图当测量数据非常多,组分得很细时,则相对频数分布直方图,趋向于一条平滑曲线,这条曲线即为正态分布曲线第22页/共55页2023/2/192、正态分布(1)测量值正态分布曲线(高斯分布)xy第23页/共55页2023/2/19y概率密度函数,测量值,标准偏差为总体均值,相应于曲线最高点的横坐标值。表示随机误差,表现为对 值的偏离表征数据分散程度,小,数据集中,曲线瘦高,测量值落在 值附近概率越大,
18、大,数据分散,曲线矮胖。正态分布曲线的形状决定于 、这样两个参数,记作正态分布曲线下所夹的面积,代表数据出现的概率,面积总和为1第24页/共55页2023/2/19(2)随机误差的正态分布曲线。以各个测量值x 相对于总体平均值 的误差 =为横坐标作图,则测量值正态 分布曲线变换为随机误差的正态分布曲线,称为 分布。0 x-第25页/共55页2023/2/19随机误差的规律性:小误差出现的概率大、大误差出现的概率小,正负误差出现的概率相等。分布曲线的最高点,对应于横坐标,概率密度第26页/共55页2023/2/19(3)随机误差的标准正态分布曲线 以 为单位表示随机误差的大小,定义 ,将正态分布
19、曲线的横坐标改用u值表示。则正态分布曲线都归结为一条曲线,即标准化。记为N(0,1)第27页/共55页2023/2/19称为U分布,U分布曲线下所夹的面积代表随机误差在某一区间出现的概率0y则由第28页/共55页2023/2/19(4)随机误差的区间概率区间概率:随机误差在某一区间出现的概率P可以取不同的u值然后对式 进行定积分求得。0u第29页/共55页2023/2/190u其在横坐标到之间所夹的面积,概率100%,其值为1。随机误差出现的区间,测量值出现的区间 概率68.3%95.0%95.5%99.0%99.7%第30页/共55页2023/2/191、平均值的标准偏差 1组:2组:3组:
20、样本平均值比单次测量值更接近总体平均值,容量大的样本平均值比小的更接近总体平均值。总体平均值的估计平均值的标准偏差与测定次数的平方根成反比,平均值的标准偏差越小,说明平均值越接近总体均值对于总体:;样本:第31页/共55页2023/2/19在实际中一般平行测定3-4次第32页/共55页2023/2/19少量数据的统计处理一、t分布曲线1、t分布曲线 少量数据,未知,用t分布代替U分布来处理 或第33页/共55页2023/2/192、U与t分布比较:相同点:纵坐标均为概率密度,曲线下的面积为概率不同点:U分布,只一条曲线,横坐标以 为单位,u值一定,则概率一定 t分布:,f 值不同,曲线不同,横
21、坐标以s为单位,概率与t值、f 值有关。联系:当测量次数为无限多时,t分布即为u分布第34页/共55页2023/2/192、置信度:P表示 表示在某一t值时,测定值落在 范围内的概率。-t0t第35页/共55页2023/2/193、显著性水准:在某一、显著性水准:在某一t值时,测定值落在值时,测定值落在 范围以外的概率,用范围以外的概率,用 表示。表示。t值与置信度和自由度有关,表示为值与置信度和自由度有关,表示为 t0.05,10表示置信度为表示置信度为95%,自由度为自由度为10时的时的t值值.-t 0 t双边第36页/共55页2023/2/192用平均值估计一定概率下包括用平均值估计一定
22、概率下包括 值的范围值的范围有限数据:平均值的置信区间:在一定置信度下,以平均值为中心,包括总体平均值 在内的范围(区间)第37页/共55页2023/2/19例题:对某未知试样中的Cl-的质量分数进行测定,四次测定结果为47.64%,47.69%,47.52%,47.55%,计算置信度为95%,总体平均值的置信区间。解:注意有效数字的使用第38页/共55页2023/2/193.4、显著性检验、显著性检验 常用的有常用的有t检验法检验法检验法检验法 平均值与标准值的比较平均值与标准值的比较检查分析数据是否存在较大的系统误检查分析数据是否存在较大的系统误差差根据根据 计算出计算出t值,然后与一定置
23、信度(值,然后与一定置信度(P=95%)和相应自由度下和相应自由度下t表表相比较,相比较,如如t计计t表表 无显著差异。无显著差异。t计计t表表 有显著差异,存在系统有显著差异,存在系统误差。误差。第39页/共55页2023/2/19例题例题 用一种新的方法测定基准明矾中铝的用一种新的方法测定基准明矾中铝的含量(含量(%),得以下),得以下9个数据:个数据:10.74,10.77,10.77,10.77,10.81,10.82,10.73,10.86,10.81。明矾中铝的含量标。明矾中铝的含量标准值(准值(%)为)为10.77,向这种新的方法有无系,向这种新的方法有无系统误差?(统误差?(解
24、:解:平均值平均值=0.042%查得:因,采用新方法后,没有明显的系统误差。第40页/共55页2023/2/191、格鲁布斯法、格鲁布斯法(1)将数据从小到大排列)将数据从小到大排列(2)计算)计算 或或(3)与表中)与表中T值比较,若值比较,若 舍去舍去3.5异常值的取舍第41页/共55页2023/2/192、Q检验法检验法 从小到大排列从小到大排列 计算计算Q Q比较比较Q计计Q表表保留,否则舍去。保留,否则舍去。第42页/共55页2023/2/193.6 回归分析法一、一元线性回归方程在分析化学中,常常需要作工作曲线,若吸光度和浓度的关系直线能通过有实验点,在统计学上就说溶液的吸光度和浓
25、度有最密切的线性关系,吸光度完全依赖于浓度的改度而变,偶然因素无影响,无实验误差,这种关系称为确定性关系或函数关系,这时作工作曲线简单。第43页/共55页2023/2/19但是在实验中不可避免的有误差存在,误差较大时,实验点分散,并不在一条直线上,作图困难,凭直觉难以判断,哪一条才是最好的工作曲线?第44页/共55页2023/2/19此时吸光度和浓度之间有着密切的关系,但不存在确定性关系,称这类变量之间的关系为相关关系,对相关关系较差的数据,最好的办法是对数据进行回归分析,求回归方程,然后作图,这样可以得到对各数据点误差最小,因而是最好的一条工作曲线。回归分析是研究随机现象中变量之间关系的一种
26、数理统计方法,x、y之间的关系,自变量只有一个,称为一元线性回归。第45页/共55页2023/2/19一、回归方程的确定用(xi,yi)表示n个数据点,任意一条直线可写为:y*=a+bx对每个数据点来说,其相对于这条直线的误差(残差ei)为:第46页/共55页2023/2/19令各数据点的误差的平方的加和(差方和)为,则是总的残差平方和:回归直线就是在所有直线中,差方和最小的一条直线,即,回归直线的系数b和a应使达到最小,对上式分别a、b求偏微分,令它们等于零,于是a、b满足:第47页/共55页2023/2/19求解得:第48页/共55页2023/2/19a是截距,b是斜率则回归直线为:又因为
27、存在:为各数据点平均值回归直线是一条通过各数据点平均值的直线因上述确定回归直线的原则是使所有误差的平方和达到最小值,平方运算也称二乘运算,因为称最小二乘法。在作图时,先给出点,然后任取,由回归方程求出,则由两点可确定一条直线。第49页/共55页2023/2/19二、相关系数 用来判断变量之间线性关系的好坏第50页/共55页2023/2/19r=1,所有的yi都在回归线上r=0,y与x之间完全不存在线性关系0 r1,存在一定的线性关系,r越 接近1,线性关系越好 r 一般保留4位有效数字第51页/共55页2023/2/193.7 提高分析结果准确度的方法提高分析结果准确度的方法 1.选择合适的分
28、析方法选择合适的分析方法 含量高含量高 用滴定分析用滴定分析、重量分析,准确、重量分析,准确度高,相对误差小。度高,相对误差小。含量低含量低 用仪器分析,灵敏度高,用仪器分析,灵敏度高,相相对误差较大。对误差较大。2.减少测量误差减少测量误差 3、消除系统误差 (1)对照实验:检验方法、操作步骤是否存在系统误差第52页/共55页2023/2/19与标准试样的标准结果对照与标准试样的标准结果对照 或用或用 管理样,人工合成样管理样,人工合成样与成熟的分析方法结果对照与成熟的分析方法结果对照(国家标准方法或经(国家标准方法或经典方法),或不同分析人员对照(内检)、不同典方法),或不同分析人员对照(
29、内检)、不同实验室对照(外检)实验室对照(外检)加入回收法实验加入回收法实验 进行对照实验时,如对试样的组成不清楚,进行对照实验时,如对试样的组成不清楚,这时可向试样中加入已知量的被测组分,然后进这时可向试样中加入已知量的被测组分,然后进行对照实验,看看加入的被测组分能否被定量回行对照实验,看看加入的被测组分能否被定量回收,以此判断分析过程是否存在系统误差。收,以此判断分析过程是否存在系统误差。第53页/共55页2023/2/19(2)空白试验:检查试剂、器皿等带进杂质所)空白试验:检查试剂、器皿等带进杂质所造成的系统误差。造成的系统误差。就是在不加待测组分的情况下,按照待就是在不加待测组分的情况下,按照待测组分析同样的操作手续和条件进行试验,试测组分析同样的操作手续和条件进行试验,试验所得结果为空白值,从分析结果中扣除空白验所得结果为空白值,从分析结果中扣除空白值,就得到比较可靠的分析结果。值,就得到比较可靠的分析结果。(3)校准仪器)校准仪器(4)分析结果的核正)分析结果的核正4.减少随机误差增加平行测定次数,2-4次,不超过10次第54页/共55页2023/2/19感谢您的观看!第55页/共55页
限制150内