误差及数据分析的统计处理幻灯片.ppt
误差及数据分析的统计处理第1页,共58页,编辑于2022年,星期二第二章 误差及分析数据的统计处理内容:2.1定量分析中的误差2.2分析结果的数据处理2.3有效数据及其运算规则在任何测量中误差都是客观存在的第2页,共58页,编辑于2022年,星期二2.1定量分析中的误差2.1.1误差与准确度误差与准确度误差是测定值误差是测定值xi与真值与真值之差之差,可分为绝对误差可分为绝对误差E和相对误差和相对误差Er相对误差表示占真值的百分率相对误差表示占真值的百分率绝对误差和相对误差有正负之分绝对误差和相对误差有正负之分,正误差表示分析结果偏高正误差表示分析结果偏高,负误差负误差表示分析结果偏低表示分析结果偏低.在实际应用中一般用在实际应用中一般用准确度准确度来表示测定结果的可靠性,即来表示测定结果的可靠性,即平均值与平均值与真值接近的程度真值接近的程度.第3页,共58页,编辑于2022年,星期二例例:滴定的体积误差滴定的体积误差VEEr20.00 mL 0.02 mL 0.1%2.00 mL 0.02 mL 1%称量误差称量误差mEEr0.2000 g 0.2 mg 0.1%0.0200 g 0.2 mg 1%滴定剂体积应为滴定剂体积应为2030mL称样质量应大于称样质量应大于0.2g用相对误差表示各种测定结果的准确度更为确切些第4页,共58页,编辑于2022年,星期二例例1 测定含铁样品测定含铁样品中中w(Fe),比较结果的准确度。比较结果的准确度。A.铁矿中,铁矿中,B.Li2CO3试样中试样中,A.B.第5页,共58页,编辑于2022年,星期二2.1.2偏差与精密度 偏差是指个别测定结果xi与几次测定结果的平均值之间的差别.分为绝对偏差和相对偏差,其定义式:2-32-4第6页,共58页,编辑于2022年,星期二平均偏差的表示方法有以下几种:1.算术平均偏差(单次测定的平均偏差):各偏差值的绝对值的平均值。其数学式:那么单次测定的相对平均偏差可表示为:2-52-6第7页,共58页,编辑于2022年,星期二2.标准偏差(均方根偏差),分为总体标准偏差(n)和样本标准偏差s(n为有限次数)2-72-8(n-1)表示n个测定中具有独立偏差的数目,又称自由度第8页,共58页,编辑于2022年,星期二标准偏差常用的计算公式:2-9相对标准偏差2-10Sr如用百分率表示又称为变异系数CV第9页,共58页,编辑于2022年,星期二 两种计算偏差的方法中用标准偏差更合理,因为它能将较大的偏差显著地表现出来。精密度是指在确定条件下将测试方法实施多次求出所得结果之间的一致程度,其大小常用偏差来表示。也可用重复性和再现性来表示。例:两组测定数据 甲:2.9 2.9 3.0 3.1 3.1 乙:2.8 3.0 3.0 3.0 3.2判断其精密度的差异。解:平均值:甲=3.0 平均偏差:d甲=0.08 标准偏差:S甲=0.08 乙=3.0 d乙=0.08 s乙=0.14两组数据平均偏差相同,但数据离散程度不同。乙更分散,说明有时候平均偏差不能 反应客观情况,而是用标准偏差来判断。第10页,共58页,编辑于2022年,星期二2.1.3 准确度与精密度的关系图2-1 不同工作者分析同一试样的结果第11页,共58页,编辑于2022年,星期二准确度和精密度准确度和精密度分析结果的衡量指标。分析结果的衡量指标。(1)1)准确度准确度分析结果与真实值的接近程度分析结果与真实值的接近程度 准确度的高低用误差的大小来衡量;准确度的高低用误差的大小来衡量;误差一般用绝对误差和相对误差来表示。误差一般用绝对误差和相对误差来表示。(2)(2)精密度精密度几次平行测定结果相互接近程度几次平行测定结果相互接近程度 精密度的高低用偏差来衡量,精密度的高低用偏差来衡量,偏差是指个别测定值与平均值之间的差值。偏差是指个别测定值与平均值之间的差值。(3)(3)两者的关系两者的关系 精密度是保证准确度的先决条件;精密度是保证准确度的先决条件;精密度高不一定准确度高;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。两者的差别主要是由于系统误差的存在。第12页,共58页,编辑于2022年,星期二2.1.4 误差分类及避免误差的方法1.1.系统误差系统误差(可测误差)(可测误差)(1)特点特点单向性单向性 a.对分析结果的影响比较恒定;b.在同一条件下,重复测定,重复出现;c.影响准确度,不影响精密度;d.可以消除。产生的原因产生的原因?第13页,共58页,编辑于2022年,星期二(2)产生的原因 a.a.方法误差方法误差选择的方法不够完善 例:重量分析中沉淀的溶解损失、共沉淀现象、灼烧时沉淀分解或挥发等;滴定分析中反应进行不完全、干扰离子影响、计量点和滴定终点不符合、副反应的发生等。这些因素系统地导致测定结果的偏低或偏高。b.b.仪器误差仪器误差仪器本身的缺陷 例:砝码重量、容量器皿刻度不准确、天平两臂不等;砝码、滴定管、容量瓶未校正。第14页,共58页,编辑于2022年,星期二c.试剂误差试剂误差所用试剂有杂质 例:去离子水不合格;试剂纯度不够 (含待测组份或干扰离子)。d.操作误差操作误差操作人员主观因素造成 例:对指示剂颜色辨别偏深或偏浅;滴定管读数不准;灼烧沉淀时温度过高或过低等;第15页,共58页,编辑于2022年,星期二 2.偶然(随机)误差 (1)(1)特点特点 a.不恒定(时大时小时正时负)b.难以校正 c.服从正态分布(统计规律)(2)(2)产生的原因产生的原因偶然因素:测量时环境的温度、湿度、气压的微小波动,仪器的微小变化,分析人员处理时的微小差别等3.3.过失误差过失误差粗枝大叶、不按操作规程办事等造成的,完全可以避免的第16页,共58页,编辑于2022年,星期二4 4.误差的减免误差的减免 (1)(1)系统误差的减免系统误差的减免 (1)方法误差 采用标准方法,对比实验 (2)仪器误差 校正仪器 (3)试剂误差 作空白实验 (2)偶然误差的减免 增加平行测定的次数第17页,共58页,编辑于2022年,星期二2.1.5随机误差分布服从正态分布无限多次测定68.3%95.5%99.7%u -3s s -2s s -s s 0 s s 2s s 3s s x-m m m m-3s s m m-2s s m m-s s m m m m+s s m m+2s s m m+3s s x y图2-2 标准正态分布曲线y:概率密度概率密度 x:测量值测量值 :总体平均值总体平均值x-:随机误差随机误差 :总体标准差总体标准差第18页,共58页,编辑于2022年,星期二随机误差分布的性质:1.对称性2.单峰性3.有界性4.抵偿性 特点特点:1.极大值在极大值在 x=处处.2.拐点在拐点在 x=处处.3.于于x=对称对称.4.x 轴为渐近线轴为渐近线.第19页,共58页,编辑于2022年,星期二表2-1 随机误差的区间概率随机误差随机误差u出现的区间出现的区间(以以 为单位为单位)测量值出现的区间测量值出现的区间概概 率率 p(-1,+1)(-1,+1)68.3%(-1.96,+1.96)(-1.96,+1.96)95.0%(-2,+2)(-2,+2)95.5%(-2.58,+2.58)(-2.58,+2.58)99.0%(-3,+3)(-3,+3)99.7%测定值或误差出现的概率称为置信度或置信水平,其意义可以理解为某一定范围的测定值(或误差)出现的概率称为置信区间:真实值在指定概率下出现的区间第20页,共58页,编辑于2022年,星期二2.1.6有限测定中随机误差服从t分布总体总体样本样本数据数据抽样抽样观测观测统计处理统计处理样本容量样本容量n:样本所含的个体数样本所含的个体数.第21页,共58页,编辑于2022年,星期二有限次测定中随机误差服从t分布(类似于正态分布)f=n-1 f=f=10 f=2 f=1-3-2-10123t图2-3 t 分布曲线t分布曲线与正态分布相似,随自由度f(f=n-1)而变,当f20时二者接近定义式2-132-14第22页,共58页,编辑于2022年,星期二表表 2-2 t 分布值表分布值表f置信度置信度16.3112.7163.6622.924.309.9332.353.185.8442.132.784.6052.022.574.0361.942.453.7171.902.373.5081.862.313.36201.732.092.851.641.962.58第23页,共58页,编辑于2022年,星期二由t的定义式可衍生得:在一定置信度下,对于有在一定置信度下,对于有限次测量:限次测量:,n,s,真值(总体均值)将在测真值(总体均值)将在测定平均值附近的一个区间(如下)定平均值附近的一个区间(如下)存在。存在。x即:在一定的置信度下,真值(总体平均值)为2-15第24页,共58页,编辑于2022年,星期二例3 测定SiO2的质量分数,得到下列数据(%):28.62,28.59,28.51,28.48,28.52,28.63。求平均值,标准偏差及置信度分别为90%和95%时总体平均值的置信区间。解:=28.52%s=0.06%查表2-2,置信度为90%,n=6时,t=2.015,因此同理,对于置信度95%,可得第25页,共58页,编辑于2022年,星期二2.1.7 公差公差是生产部门对于分析结果允许误差的一种表示方法如果分析结果超出允许的公差范围称为超差,该项分析结果应该重做第26页,共58页,编辑于2022年,星期二.分析结果的数据处理 偏差较大数据的取舍,所测平均值与真值或标准值的差异是否合理,同种方法测的两组数据或不同方法对同一试样测得的两组数据间的差异是否在允许的范围内等。.可疑数据的取舍 当个别测定值离群太远就要检查是否有操作错误,或过失误差,不能随意舍弃以提高精密度,而应该进行统计处理第27页,共58页,编辑于2022年,星期二.Grubbs法步骤:步骤:将测定数据由小到大排列,其中最小值将测定数据由小到大排列,其中最小值x1或最大或最大值值xn可疑,可疑,如果如果x1可疑按照可疑按照2-16计算。计算。如果如果xn可疑按照可疑按照2-17第28页,共58页,编辑于2022年,星期二表2-3 G(p,n)值表n置信度(置信度(P)95%97.5%99%31.151.151.1541.461.481.4951.671.711.7561.821.891.9471.942.022.1082.032.132.2292.112.212.32102.182.292.41112.232.362.48122.292.412.55132.332.462.61142.372.512.66152.412.552.71202.562.712.88第29页,共58页,编辑于2022年,星期二例:例:1.25,1.27,1.31,1.40(P=95%)用格鲁布斯法判断时,)用格鲁布斯法判断时,1.40这个数值应保留否?这个数值应保留否?1.40这个数值应该保留这个数值应该保留第30页,共58页,编辑于2022年,星期二2.值检验法表2-4 Q值表测量次数测量次数n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49第31页,共58页,编辑于2022年,星期二例例 测定某溶液浓度测定某溶液浓度(molL-1),得结果得结果:0.1014,0.1012,0.1016,0.1025,问问:0.1025是否应弃去是否应弃去?(置信度为置信度为90%)0.1025应该保留应该保留.第32页,共58页,编辑于2022年,星期二2.2.2 平均值与标准值的比较(检查方法的准确度)t 检验法检验法如果 表明被检验的方法存在系统误差第33页,共58页,编辑于2022年,星期二例例 已知已知w(CaO)=30.43%,测得结果为测得结果为:n=6,=30.51%,s=0.05%.问此测定有无系统误差问此测定有无系统误差?(置信度置信度95%)解解 查查t 表表,t0.05(5)=2.57,t计计 t表表 此测定存在系统误差此测定存在系统误差.第34页,共58页,编辑于2022年,星期二2.2.3 两个平均值的比较1.F 检验检验精密度差异检验精密度差异检验2-20如果如果F计算计算F表表,说明两组值的精密度没有大的差别;再用,说明两组值的精密度没有大的差别;再用t检验检验判断两组数据的平均值是否有显著性差异。反之,不能用此判断两组数据的平均值是否有显著性差异。反之,不能用此法判断。法判断。判断两个平均值是否有显著性差异时,判断两个平均值是否有显著性差异时,首先要求这两个平均值的精密度没有大的差别。首先要求这两个平均值的精密度没有大的差别。然后再利用然后再利用t检验法判断两个平均值是否有显著性差异。检验法判断两个平均值是否有显著性差异。第35页,共58页,编辑于2022年,星期二自由度分分 子子 f1 (大大 )234567f2 小小219.0019.1619.2519.3019.3319.3619.5039.559.289.129.018.948.888.5346.946.596.396.266.166.095.6355.795.415.195.054.954.884.3665.144.764.534.394.284.213.6774.744.354.123.973.873.793.2384.464.073.843.693.583.502.9394.263.863.633.483.373.292.713.002.602.372.212.102.011.00表2-5 置信度95%时F值第36页,共58页,编辑于2022年,星期二第二步第二步:t t 检验检验比较比较 与与 2-212-22如果t计算t表(n1+n2-2),则两种不同的方法间存在显著性差异第37页,共58页,编辑于2022年,星期二例例6用两种方法测定用两种方法测定w(Na2CO3)第38页,共58页,编辑于2022年,星期二F计计F表表(3,4)=6.59,1 和和2 无显著差异;无显著差异;2.t 检验检验(给定给定 =0.05)两种方法不存在系统误差。两种方法不存在系统误差。1.F 检验检验解:解:第39页,共58页,编辑于2022年,星期二例例 用两种不同方法测定合金中铌的质量分数,所得结果如下:用两种不同方法测定合金中铌的质量分数,所得结果如下:第一法第一法 1.26 1.25 1.22第二法第二法 1.35 1.31 1.33 1.34试问两种方法之间是否有显著性差异(置信度试问两种方法之间是否有显著性差异(置信度90)?)?解:解:n1=3,=1.24 s1=0.021 n2=4 =1.33%s2=0.017%F=0.0212/0.0172=1.53F表表(说明两组数据的标准偏差无显著性差异)(说明两组数据的标准偏差无显著性差异)第40页,共58页,编辑于2022年,星期二判断一种新方法所得数据是否可靠:1.可疑值取舍2.方法可靠性检验(标准方法对照或加标回收)3.用置信区间表示测定结果,用重复性表示平行测定之间的允许差第41页,共58页,编辑于2022年,星期二系统误差系统误差 a.加减法加减法 R=mA+nB-pC ER=mEA+nEB-pEC b.乘除法乘除法 R=mAnB/pC ER/R=EA/A+EB/B-EC/C c.指数运算指数运算 R=mAn ER/R=nEA/A d.对数运算对数运算 R=mlgA ER=0.434mEA/A2-3 误差的传递误差的传递第42页,共58页,编辑于2022年,星期二随机误差随机误差-用标准偏差表示用标准偏差表示 a.加减法加减法 R=mA+nB-pC sR2=m2sA2+n2sB2+p2sC2 b.乘除法乘除法 R=mAnB/pC sR2/R2=sA2/A2+sB2/B2+sC2/C2 c.指数运算指数运算 R=mAn sR/R=nsA/A d.对数运算对数运算 R=mlgA sR=0.434msA/A第43页,共58页,编辑于2022年,星期二极值误差极值误差 最大可能误差最大可能误差 R=A+B-C ER=|EA|+|EB|+|EC|RAB/C ER/R=|EA/A|+|EB/B|+|EC/C|第44页,共58页,编辑于2022年,星期二2.4 有效数字及其运算规则有效数字及其运算规则1.有效数字:有效数字:包括全部可靠数字及一位不确定数字在内包括全部可靠数字及一位不确定数字在内 m 台秤台秤(称至称至0.1g):12.8g(3),0.5g(1),1.0g(2)分析天平分析天平(称至称至0.1mg):12.8218g(6),0.5024g(4),0.0500g(3)V 滴定管滴定管(量至量至0.01mL):26.32mL(4),3.97mL(3)容量瓶容量瓶:100.0mL(4),250.0mL(4)移液管移液管:25.00mL(4);量筒量筒(量至量至1mL或或0.1mL):26mL(2),4.0mL(2)第45页,共58页,编辑于2022年,星期二1.数字前的数字前的0不计不计,数字后的计入数字后的计入:0.02450(4位位)2.数字后的数字后的0含义不清楚时含义不清楚时,最好用指数形式表示最好用指数形式表示:1000(1.0103,1.00103,1.000 103)3.自然数可看成具有无限多位数自然数可看成具有无限多位数(如倍数关系如倍数关系2、分数关、分数关系系1/2);常数亦可看成具有无限多位数,如;常数亦可看成具有无限多位数,如 几项规定几项规定第46页,共58页,编辑于2022年,星期二4.数据的第一位数大于等于数据的第一位数大于等于8 的的,可按多一位有效数字对待,可按多一位有效数字对待,如如 9.45104,95.2%,8.6 5.对数与指数的有效数字位数按尾数计,对数与指数的有效数字位数按尾数计,如如 10-2.34(2位位);pH=11.02,则则H+=9.510-126.误差只需保留误差只需保留12位有效数字;位有效数字;7.化学平衡计算中化学平衡计算中,结果一般为两位有效数字结果一般为两位有效数字(由于由于K值一值一般为两位有效数字般为两位有效数字);8.常量分析法一般为常量分析法一般为4 位有效数字位有效数字(Er0.1%),微量分),微量分析为析为23位位.第47页,共58页,编辑于2022年,星期二2 修约规则修约规则四舍六入五成双四舍六入五成双注意:一次修到所需要的位数,不能连续多次修约注意:一次修到所需要的位数,不能连续多次修约例如例如,要修约为四位有效数字时要修约为四位有效数字时:尾数尾数4时舍时舍,0.52664-0.5266 尾数尾数6时入时入,0.36266-0.3627 尾数尾数5时时,若后面数为若后面数为0,舍舍5成双成双:10.2350-10.24,250.650-250.6 若若5后面还有不是后面还有不是0的任何数皆入的任何数皆入:18.0850001-18.09第48页,共58页,编辑于2022年,星期二3.运算规则运算规则 加减法加减法:结果的绝对误差应不小于各项中绝对误差结果的绝对误差应不小于各项中绝对误差最大的数最大的数.(与小数点后位数最少的数一致与小数点后位数最少的数一致)50.1 50.1 1.46 1.5 +0.5812 +0.6 52.1412 52.2 52.1一般计算方法一般计算方法:先计算,后修约先计算,后修约.第49页,共58页,编辑于2022年,星期二结果的相对误差应与各因数中相对误差最大的结果的相对误差应与各因数中相对误差最大的数相适应数相适应.(即与有效数字位数最少的一致即与有效数字位数最少的一致)例例 0.012125.661.05780.328432 0.328 乘除法乘除法:注意:在表示分析结果时,组分含量大于10%时用四位有效数字,1%-10%用3位有效数字,表示误差大小时有效数字取一位,最多两位。第50页,共58页,编辑于2022年,星期二报告结果报告结果:与方法精度一致与方法精度一致,由误差由误差 最大的一步确定最大的一步确定.如如 称样称样0.0320g,则则w(NaCl)=99%(3位位);称样称样0.3200g,则则w(NaCl)=99.2%(4位位);光度法测光度法测w(Fe),测量误差约测量误差约5%,则则 w(Fe)=0.064%(2位位)要求称样准至要求称样准至3位有效数字即可位有效数字即可.合理安排操作程序,实验既准又快!合理安排操作程序,实验既准又快!第51页,共58页,编辑于2022年,星期二2-5一元线性回归分析一元线性回归分析Abc若直线能通过所有的实验点若直线能通过所有的实验点统计上认为统计上认为A与与c有密切的线性关系有密切的线性关系一、一元线性回归方程一、一元线性回归方程用(用(xi,yi)表示)表示n个实验点(个实验点(i=1,2,n)任一条直线方程为:任一条直线方程为:y*a +bx 则对每个数据点来说,测量值的误差为:则对每个数据点来说,测量值的误差为:yiy*yiabxi总的误差平方和总的误差平方和回归直线是在所有直线中回归直线是在所有直线中Q最小的一条直线最小的一条直线根据微积分求极值的原理:令根据微积分求极值的原理:令第52页,共58页,编辑于2022年,星期二第53页,共58页,编辑于2022年,星期二回归直线特点:回归直线特点:(1)必定通过()必定通过()点)点(2)对所有实验点来说,误差最小)对所有实验点来说,误差最小(3)不一定通过所有的实验点)不一定通过所有的实验点第54页,共58页,编辑于2022年,星期二r物理意义:物理意义:(1)当)当r1时,所有的实验点都落在直线上,称时,所有的实验点都落在直线上,称x与与y完全线性相关完全线性相关(2)当)当r0时,则时,则b0,回归直线平行,回归直线平行x轴,称轴,称x与与y毫无线性相关毫无线性相关(3),测量有误差,测量有误差,越接近越接近1,则,则x与与y线性关系越好线性关系越好第55页,共58页,编辑于2022年,星期二第二章小结第二章小结一一、误差的分类和表示误差的分类和表示(准确度:准确度:x、T、E、Er、di、dr、s s、s sr r;精密度精密度);二、二、随机误差的分布随机误差的分布:规律、区间概率、规律、区间概率、p 三、三、有限数据的统计处理:有限数据的统计处理:1.t、f 第56页,共58页,编辑于2022年,星期二2.平均值的置信区间平均值的置信区间:-u、s t四、分析结果的数据处理四、分析结果的数据处理1.离群值的取舍离群值的取舍:Grubbs 法、法、Q值检验法值检验法2.显著性检验显著性检验:t 检验法、(检验法、(F检验检验+t 检验)检验)法法五、五、有效数字有效数字:位数确定、运算规则、修位数确定、运算规则、修约规则约规则.第57页,共58页,编辑于2022年,星期二作业习题:2、4、6、8、10、12第58页,共58页,编辑于2022年,星期二