分析化学中的误差与数据精.ppt
分析化学中的误差与数据第1页,本讲稿共66页教学目的教学目的 通过本章的教学,使学生掌握分析化学中有关的数据处理方法,学习并掌握标准偏差、变异系数和平均值的置信区间的计算,掌握显著性差异和极端值的取舍的处理方法及其应用,了解误差传递和回归分析法等知识。教学重点与难点教学重点与难点 标准偏差、变异系数和平均值的置信区间的计算,显著性差异和极端值的取舍的处理方法。第2页,本讲稿共66页3.1 分析化学中的误差分析化学中的误差3.1.1误差与偏差误差与偏差1.误差误差 测量值(X)与真值(XT)之间的差值(E)。(1)绝对误差:)绝对误差:表示测量值与真值(XT)的差。=(2)相对误差:)相对误差:表示误差在真值中所占的百分率。r。测量值大于真实值,误差为正误值;测量值大于真实值,误差为正误值;测量值小于真实值,误差为负误值。测量值小于真实值,误差为负误值。误差越小,测量值的准确度越好;误差越小,测量值的准确度越好;误差越大,测量值的准确度越差。误差越大,测量值的准确度越差。第3页,本讲稿共66页 2.2.真值真值T(True value)某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的。(1)理论真值理论真值(如化合物的理论组成)(如化合物的理论组成)(2)计量学约定真值计量学约定真值(如国际计量大会确定的长度、质量、(如国际计量大会确定的长度、质量、物质的量单位等等)物质的量单位等等)(3)相对真值相对真值(如高一级精度的测量值相对于低一级精度(如高一级精度的测量值相对于低一级精度的测量值)的测量值)第4页,本讲稿共66页 3.3.平均值平均值Mean value n 次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,次测量值的算术平均值虽不是真值,但比单次测量结果更接近真值,它表示一组测定数据的集中趋势。它表示一组测定数据的集中趋势。d=x-x 4.4.中位数(中位数(XM)Median value 一组测量数据按大小顺序排列,中间一个数据即为中位数一组测量数据按大小顺序排列,中间一个数据即为中位数,当测量值的个数位偶数时,中位数为中间相邻两个测量值的平当测量值的个数位偶数时,中位数为中间相邻两个测量值的平均值。均值。它的优点是能简单直观说明一组测量数据的结果,且不受两它的优点是能简单直观说明一组测量数据的结果,且不受两端具有过大误差数据的影响;缺点是不能充分利用数据,因而端具有过大误差数据的影响;缺点是不能充分利用数据,因而不如平均值准确。不如平均值准确。第5页,本讲稿共66页5.偏差偏差 测量值与平均值的差值用于衡量所得结果的精密度测量值与平均值的差值用于衡量所得结果的精密度单次测定结果的平均偏差:d=1/ndi 单次测定结果的相对平均偏差:d r=d/x 100%标准偏差:相对标准偏差:又称变异系数极差:又称全距 R=x max-xmin第6页,本讲稿共66页3.1.2 准确度与精密度准确度与精密度1.准确度准确度 Accuracy 准确度表征测量值与真实值的符合程度。准确度用误准确度表征测量值与真实值的符合程度。准确度用误差表示。差表示。2.精密度精密度 precision 精密度表征平行测量值的相互符合程度。精密度精密度表征平行测量值的相互符合程度。精密度用偏差表示。用偏差表示。第7页,本讲稿共66页准确度与精密度的关系准确度与精密度的关系例例:A、B、C、D 四个分析工作者对同一铁标样四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比中的铁含量进行测量,得结果如图示,比较其准确度与精密度。较其准确度与精密度。36.00 36.50 37.00 37.50 38.00测量点测量点平均值平均值真值真值DCBA表观准确度高,精密度低表观准确度高,精密度低准确度高,精密度高准确度高,精密度高准确度低,精密度高准确度低,精密度高准确度低,精密度低准确度低,精密度低(不可靠)(不可靠)第8页,本讲稿共66页准确度与精密度的关系:准确度与精密度的关系:结论:结论:1、精密度是保证准确度的前提。、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。、精密度高,不一定准确度就高。第9页,本讲稿共66页3.1.3系统误差与随机误差系统误差与随机误差1.系统误差系统误差 由某种固定的原因造成的,具有重复性、单向性。又称可测误差。A.方法误差 B.仪器和试剂误差 C.操作误差 D.主观误差2.随机误差随机误差 又称偶然误差。由某些难以控制的且无法避免的偶然因素造成的。3.过失误差过失误差 在分析过程中由于疏忽或差错引起的所谓过失。第10页,本讲稿共66页系统误差与随机误差的比较:系统误差与随机误差的比较:项目项目系统误差系统误差随机误差随机误差产生原因产生原因固定因素,有时不存在固定因素,有时不存在不定因素,总是存在不定因素,总是存在分类分类方法误差、仪器与试剂方法误差、仪器与试剂误差、主观误差误差、主观误差环境的变化因素、主环境的变化因素、主观的变化因素等观的变化因素等性质性质重现性、单向性(或周重现性、单向性(或周期性)、可测性期性)、可测性服从概率统计规律、服从概率统计规律、不可测性不可测性影响影响准确度准确度精密度精密度消除或减消除或减小的方法小的方法校正校正增加测定的次数增加测定的次数第11页,本讲稿共66页3.1.4 公差公差 生产部门对分析结果误差允许的一种限量。公差范围的确定与很多因素有关:1.根据实际情况对分析结果准确度的要求而定。2.依试样组成及待测组分含量而不同。第12页,本讲稿共66页3.1.5 误差的传递误差的传递 分析结果通常是经过一系列测量步骤之后获得的,其中每一步骤的测量误差都会反映到分析结果中去。设分析结果Y 由测量值A、B、C 计算获得,测量值的系统误差分别为 A、B、C,标准偏差分别为SA、SB、SC。ki为常数。第13页,本讲稿共66页1.系统误差的传递系统误差的传递(1)加减法(2)乘除法(3)指数关系(4)对数关系 第14页,本讲稿共66页2.随机误差的传递随机误差的传递(1)加减法(2)乘除法(3)指数关系(4)对数关系 第15页,本讲稿共66页3.极值误差极值误差 第16页,本讲稿共66页3.2.1 有效数字有效数字 significant figure 实际能测到的数字。在有效数字中实际能测到的数字。在有效数字中,只有最后一位数是不确定的,只有最后一位数是不确定的,可疑的。可疑的。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。有效数字位数由仪器准确度决定,它直接影响测定的相对误差。3.2.2有效数字的修约规则有效数字的修约规则 “四舍六入五成双四舍六入五成双”规则:当测量值中修约的那个数字等于或小规则:当测量值中修约的那个数字等于或小于于4时,该数字舍去;等于或大于时,该数字舍去;等于或大于6时,进位;等于时,进位;等于5时(时(5后面无数据后面无数据或是或是0时),如进位后末位数为偶数则进位,舍去后末位数位偶数则舍去。时),如进位后末位数为偶数则进位,舍去后末位数位偶数则舍去。5后面有数时,进位。修约数字时,只允许对原测量值一次修约到所需后面有数时,进位。修约数字时,只允许对原测量值一次修约到所需要的位数,不能分次修约要的位数,不能分次修约。3.2 有效数字及其运算规则有效数字及其运算规则第17页,本讲稿共66页 有效数字的修约有效数字的修约:0.32554 0.3255 0.36236 0.3624 10.2150 10.22 150.65 150.6 75.5 76 16.0851 16.09第18页,本讲稿共66页3.2.3 3.2.3 运算规则运算规则1.1.有效数字位数的确定有效数字位数的确定(1)零的作用)零的作用 *在在1.0008中,中,“0”是有效数字;是有效数字;*在在0.0382中,中,“0”定位作用,不是有效数字;定位作用,不是有效数字;*在在0.0040中,前面中,前面3个个“0”不是有效数字,不是有效数字,后面一个后面一个“0”是有效数字。是有效数字。*在在3600中,一般看成是中,一般看成是4位有效数字,但它可能是位有效数字,但它可能是2位或位或3位位有效数字,分别写有效数字,分别写3.6103,3.60103或或3.600103较好。较好。第19页,本讲稿共66页 (2)倍数、分数关系:无限多位有效数字。)倍数、分数关系:无限多位有效数字。(3)pH,pM,lgc,lgK等对数值,有效数字的位数取等对数值,有效数字的位数取决于小数部分(尾数)位数,因整数部分代表该数的决于小数部分(尾数)位数,因整数部分代表该数的方次。如方次。如 pH=11.20,有效数字的位数为两位。有效数字的位数为两位。(4)9以上数,以上数,9.00,9.83,4位有效数字位有效数字。第20页,本讲稿共66页2.加减法加减法 当几个数据相加减时,它们和或差的有效数字位数,应以当几个数据相加减时,它们和或差的有效数字位数,应以小数点后位数最少的数据位依据,因小数点后位数最少的数据小数点后位数最少的数据位依据,因小数点后位数最少的数据的绝对误差最大。的绝对误差最大。例:例:0.0121+25.64+1.05782=?绝对误差绝对误差 0.0001 0.01 0.000010.0001 0.01 0.00001 在加合的结果中总的绝对误差值取决于在加合的结果中总的绝对误差值取决于25.6425.64。0.01+25.64+1.06=26.71第21页,本讲稿共66页3.乘除法乘除法 当几个数据相乘除时,它们积或商的有效数当几个数据相乘除时,它们积或商的有效数字位数,应以有效数字位数最少的数据位依据,字位数,应以有效数字位数最少的数据位依据,因有效数字位数最少的数据的相对误差最大。因有效数字位数最少的数据的相对误差最大。例:例:0.0121 25.64 1.05782=?相对误差相对误差 0.8%0.4%0.009%0.8%0.4%0.009%结果的相对误差取决于结果的相对误差取决于 0.0121,因它的相对误差最,因它的相对误差最大,所以大,所以 0.012125.61.06=0.32825.61.06=0.328第22页,本讲稿共66页 3.2.4 分析化学中数据处理分析化学中数据处理 1.记录测量结果时,只保留一位可疑数据。记录测量结果时,只保留一位可疑数据。分析天平称量质量:分析天平称量质量:0.000Xg 滴定管体积滴定管体积:0.0X mL 容量瓶容量瓶:100.0mL,250.0mL,50.0mL 吸量管吸量管,移液管移液管:25.00mL,10.00mL,5.00mL,1.00mL pH:0.0X 单位单位 吸光度吸光度:0.00X第23页,本讲稿共66页2.2.分析结果表示的有效数字分析结果表示的有效数字 高含量(大于高含量(大于10%):):4位有效数字位有效数字 含量在含量在1%至至10%:3位有效数字位有效数字 含量小于含量小于1%:2位有效数字位有效数字3.3.分析中各类误差的表示分析中各类误差的表示 通常取通常取1 至至 2位有效数字。位有效数字。4.4.各类化学平衡计算各类化学平衡计算 2至至3位有效数字。位有效数字。第24页,本讲稿共66页3.4 3.4 分析化学中的数据统计处理分析化学中的数据统计处理总体与样本:总体与样本:(1)总体:在统计学中,对于所考察的对象的全体,)总体:在统计学中,对于所考察的对象的全体,称为总体(或母体)。称为总体(或母体)。(2)个体:组成总体的每个单元。)个体:组成总体的每个单元。(3)样样本本(子子样样):自自总总体体中中随随机机抽抽取取的的一一组组测测量量值值(自总体中随机抽取的一部分个体)。(自总体中随机抽取的一部分个体)。(4)样本容量:样品中所包含个体的数目,用)样本容量:样品中所包含个体的数目,用n表示。表示。第25页,本讲稿共66页例例如如:分分析析延延河河水水总总硬硬度度,依依照照取取样样规规则则,从从延延河河中中取取来来供供分分析析用用2000ml样样品品水水,这这2000ml样样品品水水是是供供分分析析用用的的总总体体,如如果果从从样样品品水水中中取取出出20个个试试样样进进行行平平行行分分析析,得得到到20个个分分析析结结果果,则则这这组组分分析析结结果果就就是是延延河河样样品水的一个品水的一个随机样本随机样本,样本容量样本容量为为20。随随机机变变量量 来来自自同同一一总总体体的的无无限限多多个个测测量量值值都都是是随随机机出出现现的,叫随机变量。的,叫随机变量。第26页,本讲稿共66页 设样本容量为设样本容量为n,则其平均值则其平均值 为:为:当测定次数无限增多时,所得平均值即为总体平均值当测定次数无限增多时,所得平均值即为总体平均值:若没有系统误差,则总体平均值若没有系统误差,则总体平均值就是真值就是真值 此时,单次测此时,单次测量的平均偏差量的平均偏差为为第27页,本讲稿共66页 总体标准偏差:总体标准偏差:当测定次数为无限多次时,各测量值对总体平均值当测定次数为无限多次时,各测量值对总体平均值的偏离,用总体标准偏差的偏离,用总体标准偏差表示:表示:计算标准偏差时,对单次测量加以平方,这样计算标准偏差时,对单次测量加以平方,这样做不仅能避免单次测量偏差相加时正负抵消,更重做不仅能避免单次测量偏差相加时正负抵消,更重要的是大偏差能显著地反应出来,因而可以更好地要的是大偏差能显著地反应出来,因而可以更好地说明数据的分散程度。说明数据的分散程度。第28页,本讲稿共66页标准偏差与平均偏差:标准偏差与平均偏差:用统计学方法可以证明,当测定次数非用统计学方法可以证明,当测定次数非常多(例如大于常多(例如大于20)时,标准偏差与平均偏)时,标准偏差与平均偏差有下列关系:差有下列关系:=0.9790.80,但应当指,但应当指出:当测定次数较少出:当测定次数较少 时,时,与与S之间的关系之间的关系就可能与此式相差颇大了。就可能与此式相差颇大了。第29页,本讲稿共66页 1.频数分布频数分布 测定某样品测定某样品100次,次,因有偶然误差存在,故分析结果因有偶然误差存在,故分析结果有高有低,有两头小、中间大的变化趋势,即在平均值附近的数有高有低,有两头小、中间大的变化趋势,即在平均值附近的数据出现机会最多据出现机会最多。3.3.1 随机误差的正态分布随机误差的正态分布第30页,本讲稿共66页 2.正正态态分分布布:测测量量数数据据一一般般符符合合正正态态分分布布规规律律,即即高高斯斯分分布布,正正态态分布曲线数学表达式为:分布曲线数学表达式为:y:概率密度;:概率密度;x:测量值:测量值:总总体体平平均均值值,即即无无限限次次测测定定数数据据的的平平均均值值,无无系系统统误误差差时时即即为为真值;反映测量值分布的集中趋势。真值;反映测量值分布的集中趋势。:标准偏差,反映测量值分布的分散程度;:标准偏差,反映测量值分布的分散程度;x-x-:随机误差:随机误差第31页,本讲稿共66页 正态分布曲线规律:正态分布曲线规律:*x=时时,y y值值最最大大,体体现现了了测测量量值值的的集集中中趋趋势势。大大多多数数测测量量值值集集中中在在算算术术平平均均值值的的附附近近,算算术术平平均均值值是是最最可可信信赖赖值值,能能很很好好反反映映测测量量值值的的集集中中趋趋势势。反反映映测测量量值值分分布布集中趋势。集中趋势。*曲曲线线以以x=这这一一直直线线为为其其对对称称轴轴,说说明明正正误误差差和和负负误误差差出现的概率相等。出现的概率相等。*当当x趋趋于于或或时时,曲曲线线以以轴轴为为渐渐近近线线。即即小小误误差差出出现现概概率率大大,大大误误差差出出现现概概率率小小,出出现现很很大大误误差差概概率率极极小小,趋趋于于零。零。*越越大大,测测量量值值落落在在附附近近的的概概率率越越小小。即即精精密密度度越越差差时时,测测量量值值的的分分布布就就越越分分散散,正正态态分分布布曲曲线线也也就就越越平平坦坦。反反之之,越越小小,测测量量值值的的分分散散程程度度就就越越小小,正正态态分分布布曲曲线线也也就就越越尖尖锐锐。反反映映测测量量值值分分布布分分散散程程度。度。第32页,本讲稿共66页标准正态分布曲线:标准正态分布曲线:横坐标改为横坐标改为u,纵坐标,纵坐标为概率密度,此时曲线的为概率密度,此时曲线的形状与形状与大小无关,不同大小无关,不同的曲线合为一条。的曲线合为一条。X-u=-第33页,本讲稿共66页3.随机误差的区间概率随机误差的区间概率 正态分布曲线与横坐标正态分布曲线与横坐标-到到+之间所夹的面积,代表所有数据出之间所夹的面积,代表所有数据出现概率的总和,其值应为现概率的总和,其值应为1,即概率,即概率P为:为:第34页,本讲稿共66页随机误差出现的区间随机误差出现的区间 测量值出现的区间测量值出现的区间 概率概率(以以为单位为单位)u=1 x=1 68.3%u=1.96 x=1.96 95.0%u=2 x=2 95.5%u=2.58 x=2.58 99.0%u=3 x=3 99.7%第35页,本讲稿共66页例例1 已知某试样中山质量分数的标准值为已知某试样中山质量分数的标准值为1.75%,=0.10%,又,又已知测量时没有系统误差,求分析结果落在已知测量时没有系统误差,求分析结果落在(1.750.15)%范围范围内的概率。内的概率。解:解:例例2 同上例,求分析结果大于同上例,求分析结果大于2.00%的概率。的概率。解:属于单边检验问题。解:属于单边检验问题。阴影部分的概率为阴影部分的概率为0.4938。整个正态分布曲线右侧的概率。整个正态分布曲线右侧的概率为为1/2,即为,即为0.5000,故阴影部分以外的概率为,故阴影部分以外的概率为0.50000.4938=0.62%,即分析结果大于,即分析结果大于2.00%的概率为的概率为0.62%。第36页,本讲稿共66页少量实验数据的统计处理:少量实验数据的统计处理:(1)t 分布曲线分布曲线 正态分布是无限次测量正态分布是无限次测量数据的分布规律,而对有数据的分布规律,而对有限次测量数据则用限次测量数据则用t 分布曲分布曲线处理。线处理。用用s代替代替,纵坐纵坐标仍为概率密度,但横坐标仍为概率密度,但横坐标则为统计量标则为统计量t。t定义为:定义为:3.3.2 总体平均值的估计总体平均值的估计1.平均值的标准偏差平均值的标准偏差第37页,本讲稿共66页自由度自由度f degree of freedom (f=n-1)t分布曲线与正态分布曲线相似,只是分布曲线与正态分布曲线相似,只是t分布曲线随自由度分布曲线随自由度f而改变。而改变。当当f趋近趋近时,时,t分布就趋近正态分布分布就趋近正态分布。置信度置信度P Pconfidence degree 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围内的概率。范围内的概率。置信水平置信水平confidence level 在某一在某一t值时,测定值落在值时,测定值落在(+ts)范围以外的概率范围以外的概率(lP)ta,f :t值与置信度值与置信度P及自由度及自由度f关系。关系。例:例:t005,10表示置信度为表示置信度为95%,自由度为,自由度为10时的时的t值。值。t001,5表示置信度为表示置信度为99%,自由度为,自由度为5时的时的t值。值。第38页,本讲稿共66页第39页,本讲稿共66页(2)平均值的置信区间平均值的置信区间(confidence interval)当当n趋近趋近时:时:单次测量结果:单次测量结果:以样本平均值来估计总体平均值可能存在的区间:以样本平均值来估计总体平均值可能存在的区间:对于少量测量数据,即当对于少量测量数据,即当 n有限时,必须根据有限时,必须根据t分布进行统计处分布进行统计处理:理:它表示在一定置信度下,以平均值为中心,包括总体平均值的它表示在一定置信度下,以平均值为中心,包括总体平均值的范围。这就叫平均值的置信区间范围。这就叫平均值的置信区间。第40页,本讲稿共66页例例 对其未知试样中对其未知试样中Cl-的质量分数进行测定,的质量分数进行测定,4次结果为次结果为47.64%,47.69%,47.52%,47.55%。计算置信度为。计算置信度为90%,95%和和99%时,总体平时,总体平均值均值的置信区间。的置信区间。解:解:置信度越高,置信区间就越大,所估计的区间包括真值的可能置信度越高,置信区间就越大,所估计的区间包括真值的可能性就越大。置信度一般定为性就越大。置信度一般定为95或或90。第41页,本讲稿共66页3.4 显著性检验显著性检验 Significance testt检验法检验法 t test *平均值与标准值的比较平均值与标准值的比较 *两组平均值的比较两组平均值的比较F检验法检验法 F test 比较两组数据的方差比较两组数据的方差s2第42页,本讲稿共66页 3.4.1 t 检验法检验法 1.平均值与标准值的比较平均值与标准值的比较 为为了了检检查查分分析析数数据据是是否否存存在在较较大大的的系系统统误误差差,可可对对标标准准试试样样进进行行若若干干次次分分析析,再再利利用用t检检验验法法比比较较分分析析结结果果的的平平均均值值与与标标准准试试样样的的标准值之间是否存在显著性差异。标准值之间是否存在显著性差异。进行进行t检验时,首先按下式计算出检验时,首先按下式计算出t值:值:若若t计算计算t,f,存在显著性差异,否则不存在显著性差异。通常,存在显著性差异,否则不存在显著性差异。通常以以95%的置信度为检验标准,即显著性水准为的置信度为检验标准,即显著性水准为5%。第43页,本讲稿共66页例例 采采用用某某种种新新方方法法测测定定基基准准明明矾矾中中铝铝的的质质量量分分数数,得得到到下下列列9个个分分 析析 结结 果果:10.74%,10.77%,10.77%,10.77%,10.81%,10.82%,10.73%,10.86%,10.81%。已已知知明明矾矾中中铝铝含含量量的的标标准准值值(以以理理论论值值代代)为为10.77%。试试问问采采用用该该新新方方法法后后,是是否否引引起起系系统统误误差差(置信度置信度95%)?解:解:n=9,f=91=8 查查表表,P=0.95,f=8时时,t0.05,8=2.31。tt表表两两组组平均值存在显著性差异。平均值存在显著性差异。tt表表,则不存在显著性差异。,则不存在显著性差异。第45页,本讲稿共66页例例 用两种方法测定合金中铝的质量分数,所得结果如下用两种方法测定合金中铝的质量分数,所得结果如下:第一法第一法 1.26%1.25%1.22%第二法第二法 1.35%1.31%1.33%试问两种方法之间是否有显著性差异试问两种方法之间是否有显著性差异(置信度置信度90%)?解解 n1=3,x1=1.24%s1=0.021%n2=4,x2=1.33%s2=0.017%f大大=2 f小小=3 F表表=955 F t010,5,故两种分析方法之间存在显著性差异故两种分析方法之间存在显著性差异.第46页,本讲稿共66页 3.4.2 F 检验法检验法 比较两组数据的方差比较两组数据的方差s2,以确定它们的精密度是否有显著性差,以确定它们的精密度是否有显著性差异的方法。统计量异的方法。统计量F定义为两组数据的方差的比值,分子为大的方定义为两组数据的方差的比值,分子为大的方差,分母为小的方差。差,分母为小的方差。两组数据的精密度相差不大,则两组数据的精密度相差不大,则F值趋近于值趋近于1;若两者之间存;若两者之间存在显著性差异,在显著性差异,F值就较大。值就较大。在一定的在一定的P(置信度置信度95%)及及f时,时,F计算计算F表表,存在显著性差异,否,存在显著性差异,否则,不存在显著性差异。则,不存在显著性差异。第47页,本讲稿共66页第48页,本讲稿共66页例例1 在吸光光度分析中,用一台旧仪器测定溶液的吸光度在吸光光度分析中,用一台旧仪器测定溶液的吸光度6次,得标准次,得标准偏差偏差s1=0.055;再用一台性能稍好的新仪器测定再用一台性能稍好的新仪器测定4次,得标准偏差次,得标准偏差s2=0.022。试问新仪器的精密度是否显著地优于旧仪器的精密度。试问新仪器的精密度是否显著地优于旧仪器的精密度?解解 已已知知新新仪仪器器的的性性能能较较好好,它它的的精精密密度度不不会会比比旧旧仪仪器器的的差差,因因此此,这这是是属于单边检验问题。属于单边检验问题。已知已知 n1=6,s1=0.055 n2=4,s2=0.022 查查表表,f大大=6-1=5,f小小=4-1=3,F表表=901,FF表表,故故认认为为两两种种方方法法的的精精密密度度之之间间存存在在显显著著性性差差异异。作作出出此此种种判判断断的的置置信信度度为为90%。第50页,本讲稿共66页 3.5 可疑值(可疑值(cutlier)取舍)取舍 在实验中得到一组数据,个别数据离群较远,这一数在实验中得到一组数据,个别数据离群较远,这一数据称为异常值、可疑值或极端值。若是过失造成的,则这据称为异常值、可疑值或极端值。若是过失造成的,则这一数据必须舍去。否则异常值不能随意取舍,特别是当测一数据必须舍去。否则异常值不能随意取舍,特别是当测量数据较少时。量数据较少时。处理方法有处理方法有4d法、格鲁布斯法、格鲁布斯(Grubbs)法和法和Q检验法。检验法。第51页,本讲稿共66页 3.5.1.4d法法 根据正态分布规律,偏差超过根据正态分布规律,偏差超过3的个别测定值的概率小于的个别测定值的概率小于0.3%,故这一测量值通常可以舍去。而,故这一测量值通常可以舍去。而=0.80,34,即偏差超即偏差超过过4的个别测定值可以舍去的个别测定值可以舍去。用用4d法法判判断断异异常常值值的的取取舍舍时时,首首先先求求出出除除异异常常值值外外的的其其余余数数据据的的平平均均值值和和平平均均偏偏差差d,然然后后将将异异常常值值与与平平均均值值进进行行比比较较,如绝对差值大于如绝对差值大于4d,则将可疑值舍去,否则保留。,则将可疑值舍去,否则保留。当当4d法与其他检验法矛盾时,以其他法则为准。法与其他检验法矛盾时,以其他法则为准。第52页,本讲稿共66页例例 测测定定某某药药物物中中钴钴的的含含量量如如(g/g),得得结结果果如如下下:1.25,1.27,1.31,1.40。试问。试问1.40这个数据是否应保留这个数据是否应保留?解解:首首先先不不计计异异常常值值1.40,求求得得其其余余数数据据的的平平均均值值x和和平平均均偏偏差差d为为 异常值与平均值的差的绝对值为:异常值与平均值的差的绝对值为:|1.40一一1.28|=0.124 d(0.092)故故1.40这一数据应舍去。这一数据应舍去。第53页,本讲稿共66页 3.5.2 格鲁布斯格鲁布斯(Grubbs)法法 有一组数据,从小到大排列为有一组数据,从小到大排列为:x1,x2,xn-1,xn 其中其中x1或或xn可能是异常值。可能是异常值。用用格格鲁鲁布布斯斯法法判判断断时时,首首先先计计算算出出该该组组数数据据的的平平均均值及标准偏差,再根据统计量值及标准偏差,再根据统计量T进行判断。进行判断。若若TTa,n,则异常值应舍去,否则应保留。,则异常值应舍去,否则应保留。第54页,本讲稿共66页第55页,本讲稿共66页例例:前前一一例例中中的的实实验验数数据据,用用格格鲁鲁布布斯斯法法判判断断时时,1.40这这个个数数据据应保留否应保留否(置信度置信度95%)?解:解:平均值平均值 x=1.31,s=0.066 查表查表T005,4=1.46,TQ表表时,异常值应舍去,否则应予保留。时,异常值应舍去,否则应予保留。第57页,本讲稿共66页第58页,本讲稿共66页3.6 3.6 回归分析法回归分析法3.6.1 一元线性回归方程一元线性回归方程(linear regression)及及回归直线回归直线 式式中中x,y分分别别为为x和和y的的平平均均值值,a为为直直线线的的截截矩矩,b为为直直线线的的斜斜率率,它们的值确定之后,一元线性回归方程及回归直线就定了它们的值确定之后,一元线性回归方程及回归直线就定了。第59页,本讲稿共66页 3.6.2 相关系数相关系数-correlation coefficient 相关系数的物理意义如下:相关系数的物理意义如下:a.当所有的认值都在回归线上时,当所有的认值都在回归线上时,r=1。b.当当y与与x之间完全不存在线性关系时,之间完全不存在线性关系时,r=0。c.当当r值在值在0至至1之间时,表示例与之间时,表示例与x之间存在相关关系。之间存在相关关系。r值愈接值愈接近近1,线性关系就愈好。,线性关系就愈好。第60页,本讲稿共66页例例 用用吸吸光光光光度度法法测测定定合合金金钢钢中中Mn的的含含量量,吸吸光光度度与与Mn的的含含量量间间有有下下列关系列关系:Mn的质量的质量g 0 0.02 0.04 0.06 0.08 0.10 0.12 未知样未知样吸光度吸光度A 0.032 0.135 0.187 0.268 0.359 0.435 0.511 0.242 试列出标准曲线的回归方程并计算未知试样中试列出标准曲线的回归方程并计算未知试样中Mn的含量。的含量。解解 此此组组数数据据中中,组组分分浓浓度度为为零零时时,吸吸光光度度不不为为零零,这这可可能能是是在在试试剂中含有少量剂中含有少量Mn,或者含有其它在该测量波长下有吸光的物质。,或者含有其它在该测量波长下有吸光的物质。设设Mn含量值为含量值为x,吸光度值为,吸光度值为y,计算回归系数,计算回归系数a,b值。值。a=0.038 b=3.95 标准曲线的回归方程为标准曲线的回归方程为 y=0.38+3.95x r=0.9993r99%,f标准曲线具有很好的线性关系未知试样中含标准曲线具有很好的线性关系未知试样中含Mn 0.052g。第61页,本讲稿共66页3.7 3.7 提高分析结果准确度的方法提高分析结果准确度的方法1.选择合适的分析方法选择合适的分析方法(1)根据试样的中待测组分的含量选择分析方法。高含量组分根据试样的中待测组分的含量选择分析方法。高含量组分用滴定分析或重量分析法;低含量用仪器分析法。用滴定分析或重量分析法;低含量用仪器分析法。(2)充分考虑试样中共存组分对测定的干扰,充分考虑试样中共存组分对测定的干扰,采用适当的采用适当的掩蔽或分离方法。掩蔽或分离方法。(3)对于痕量组分,分析方法的灵敏度不能满足分析的对于痕量组分,分析方法的灵敏度不能满足分析的要求,可先定量富集后再进行测定。要求,可先定量富集后再进行测定。第62页,本讲稿共66页 2.减小测量误差减小测量误差 分析天平的称量误差为分析天平的称量误差为0.0002g,为了使测量时的相对,为了使测量时的相对误差在误差在0.1%以下,试样质量必须在以下,试样质量必须在0.2 g以上。以上。滴定管读数常有滴定管读数常有0.0l mL的误差,在一次滴定中,读数两次,的误差,在一次滴定中,读数两次,可能造成可能造成0.02 mL的误差。为使测量时的相对误差小于的误差。为使测量时的相对误差小于0.1%,消耗滴定剂的体积必须在消耗滴定剂的体积必须在20 mL以上,最好使体积在以上,最好使体积在25 mL左右,一般在左右,一般在20至至30mL之间。之间。微量组分的光度测定中,可将称量的准确度提高约一个数量级微量组分的光度测定中,可将称量的准确度提高约一个数量级。第63页,本讲稿共66页3.消除系统误差消除系统误差 由由于于系系统统误误差差是是由由某某种种固固定定的的原原因因造造成成的的,因因而而找找出出这这一原因,就可以消除系统误差的来源。有下列几种方法一原因,就可以消除系统误差的来源。有下列几种方法:(1)对照试验)对照试验a.与标准试样的标准结果进行对照与标准试样的标准结果进行对照;标准试样、管理样、合成样、加入回收法。标准试样、管理样、合成样、加入回收法。b.与其它成熟的分析方法进行对照与其它成熟的分析方法进行对照;国家标准分析方法或公认的经典分析方法。国家标准分析方法或公认的经典分析方法。c.由不同分析人员,不同实验室来进行对照试验。由不同分析人员,不同实验室来进行对照试验。内检、外检。内检、外检。第64页,本讲稿共66页 (2)空白试验)空白试验 空空白白实实验验:在在不不加加待待测测组组分分的的情情况况下下,按按照照试试样样分分析析同同样样的的操操作作手手续续和和条条件件进进行行实实验验,所所测测定定的的结结果果为为空空白白值,从试样测定结果中扣除空白值,来校正分析结果。值,从试样测定结果中扣除空白值,来校正分析结果。消消除除由由试试剂剂、蒸蒸馏馏水水、实实验验器器皿皿和和环环境境带带入入的的杂杂质质引引起起的的系统误差,但空白值不可太大。系统误差,但空白值不可太大。(3)校准仪器)校准仪器 仪仪器器不不准准确确引引起起的的系系统统误误差差,通通过过校校准准仪仪器器来来减减小小其其影影响响。例例如如砝砝码码、移移液液管管和和滴滴定定管管等等,在在精精确确的的分分析析中中,必必须须进进行行校校准准,并在计算结果时采用校正值。并在计算结果时采用校正值。第65页,本讲稿共66页(4)分析结果的校正)分析结果的校正 校校正正分分析析过过程程的的方方法法误误差差,例例用用重重量量法法测测定定试试样样中中高高含含量量的的SiO2,因因硅硅酸酸盐盐沉沉淀淀不不完完全全而而使使测测定定结结果果偏偏低低,可可用用光光度度法法测测定定滤液中少量的硅,而后将分析结果相加。滤液中少量的硅,而后将分析结果相加。4.减小随机误差减小随机误差 在在消消除除系系统统误误差差的的前前提提下下,平平行行测测定定次次数数愈愈多多,平平均均值值愈愈接接近近真真实实值值。因因此此,增增加加测测定定次次数数,可可以以提提高高平平均均值值精精密密度度。在在化化学学分分析析中中,对对于于同同一一试试样样,通通常常要要求求平平行测定(行测定(parallel determination)24次。次。第66页,本讲稿共66页