分析结果的数据处理培训(PPT 35页).ppt
http:/大量资料大量资料天天更新天天更新2-2分析结果的数据处理分析结果的数据处理一、一、置信度与置信区间置信度与置信区间二、二、可疑数据的取舍可疑数据的取舍三、三、平均值与标准值的比较平均值与标准值的比较四、四、两组平均值的比较两组平均值的比较2021/9/271http:/大量资料大量资料天天更新天天更新如何用测量值如何用测量值来估计真实值来估计真实值?一、置信度与置信区间一、置信度与置信区间若用单次测量值若用单次测量值若用单次测量值若用单次测量值x x来估计真实值来估计真实值来估计真实值来估计真实值 真值真值真值真值 被包括在被包括在被包括在被包括在x x11 内的可能性内的可能性内的可能性内的可能性p p=68.3%=68.3%,同理同理同理同理真值真值真值真值 被包括在被包括在被包括在被包括在x x22 内的可能性内的可能性内的可能性内的可能性p p=95.5%,=95.5%,真值真值真值真值 被包括在被包括在被包括在被包括在x x33 内的可能性内的可能性内的可能性内的可能性p p=99.7%=99.7%。真值被包括的区间可表示为:真值被包括的区间可表示为:=x叫单次测量结果的置信区间,叫单次测量结果的置信区间,p叫置信度。叫置信度。http:/大量资料大量资料天天更新天天更新 若用平均值若用平均值若用平均值若用平均值估计真值估计真值估计真值估计真值叫平均值的置信区间。叫平均值的置信区间。p=68.3%p=95.5%p=99.7%其中其中由由可见可见,平均值的置信区间比单次测量结果的平均值的置信区间比单次测量结果的置信区间要小,亦即用平均值估计真值的准确度比单置信区间要小,亦即用平均值估计真值的准确度比单次测量值更高,即平均值更接近于真值。次测量值更高,即平均值更接近于真值。http:/大量资料大量资料天天更新天天更新有限次测量有限次测量有限次测量有限次测量结果平均值的置信区间为:结果平均值的置信区间为:结果平均值的置信区间为:结果平均值的置信区间为:其其其其中中中中,tt置置置置信信信信因因因因子子子子,是是是是试试试试验验验验次次次次数数数数n n、置置置置信信信信度度度度p p的的的的函函函函数数数数。由由由由p14p14表表表表2-22-2可以查到可以查到可以查到可以查到。p15.例例3:测定:测定SiO2的百分含量,得到下列数据:的百分含量,得到下列数据:28.62、28.59、28.51、28.42、28.52、28.63。求平均值、标准偏差、置信度分别。求平均值、标准偏差、置信度分别为为90%和和95%时平均值的置信区间。时平均值的置信区间。解:解:http:/大量资料大量资料天天更新天天更新p15例例4测定钢中含铬量时,先测定两次,得到测定钢中含铬量时,先测定两次,得到1.12%和和1.15%;以后又补测了三次为以后又补测了三次为1.11%、1.16%和和1.12%。试分别按两次和按。试分别按两次和按五次测定的数据计算平均值的置信区间(五次测定的数据计算平均值的置信区间(p=95%)。解:两次测定时解:两次测定时http:/大量资料大量资料天天更新天天更新通过给出的这两条例题通过给出的这两条例题,可得到如下结论:,可得到如下结论:测定次数一定时测定次数一定时,置信度越高置信度越高,则则t越大越大,置信区间越宽。置信区间越宽。置信度和精密度一定时置信度和精密度一定时,测定次数越多测定次数越多,越小越小,置信区间越置信区间越窄窄,结果较可靠。结果较可靠。http:/大量资料大量资料天天更新天天更新 测测测测定定定定铁铁铁铁矿矿矿矿中中中中 FeFe的的的的百百百百分分分分含含含含量量量量,求求求求得得得得置置置置信信信信度度度度为为为为 9595时时时时平平平平均均均均值值值值的的的的置置置置信信信信区区区区间间间间为为为为35.210.1035.210.10。对对对对此此此此表表表表达达达达式式式式的的的的正确理解是正确理解是正确理解是正确理解是 真值不是随机变真值不是随机变量。所以,不能用出量。所以,不能用出现概率来描述。现概率来描述。(A)在已测定的数据中有在已测定的数据中有95的数据在此区间内的数据在此区间内(B)若再作测定,则数据有若再作测定,则数据有95将落入此区间内将落入此区间内(C)真值真值在此区间出现的概率为在此区间出现的概率为95(D)用此区间估计真值用此区间估计真值的把握有的把握有95http:/大量资料大量资料天天更新天天更新二、可疑数据的取舍二、可疑数据的取舍22.3822.38,22.3922.39,22.3622.36,22.4022.40,22.4422.44这这这这组组组组测测测测量量量量数数数数据据据据中中中中22.4422.44精精精精密密密密度度度度较较较较差差差差,而而而而又又又又没没没没有有有有什什什什么明确理由舍弃它时,怎么办?么明确理由舍弃它时,怎么办?么明确理由舍弃它时,怎么办?么明确理由舍弃它时,怎么办?例例1,以,以90%的置信度,用的置信度,用Q检验法检验下列数据中检验法检验下列数据中22.44是否参加平均值的计算。是否参加平均值的计算。22.38,22.39,22.36,22.40,22.441.Q检验法检验法http:/大量资料大量资料天天更新天天更新 将数据从小到大排序:将数据从小到大排序:将数据从小到大排序:将数据从小到大排序:22.3622.36,22.3822.38,22.3922.39,22.4022.40,22.4422.44 求极差求极差求极差求极差;x xn nx x1 1=22.44-22.36=0.08=22.44-22.36=0.08 求可疑值的邻差求可疑值的邻差求可疑值的邻差求可疑值的邻差(或或或或);x xn nx xn-1n-1=22.44-22.40=0.04=22.44-22.40=0.04 求求求求QQ值:值:值:值:或或或或;将将将将Q Q值与值与值与值与p18p18表表表表2-42-4给出的给出的给出的给出的Q Q表表表表进行比较。进行比较。进行比较。进行比较。n n=5=5,Q Q0.900.90=0.64=0.640.50.5,则,则,则,则22.4422.44给予保留参加平均。给予保留参加平均。给予保留参加平均。给予保留参加平均。如果如果Q Q表表则舍弃则舍弃可疑值可疑值Q Q表表则补则补12个实验数据后个实验数据后再检验再检验http:/大量资料大量资料天天更新天天更新2.Grubbs法法 例例例例22测定某药物中测定某药物中测定某药物中测定某药物中CoCo的质量分数的质量分数的质量分数的质量分数(10(10-6-6)得到结果如得到结果如得到结果如得到结果如下:下:下:下:1.25,1.27,1.31,1.401.25,1.27,1.31,1.40。用。用。用。用GrubbsGrubbs法判断法判断法判断法判断1.40101.4010-6-6这这这这个数据是否保留。个数据是否保留。个数据是否保留。个数据是否保留。查查查查p17p17值表值表值表值表2-32-3G G(p p,n n),置信度选,置信度选,置信度选,置信度选9595,n n=4=4,G G表表表表=1.46=1.46,G G计计计计算算算算 G G表表表表,故,故,故,故1401014010-6-6应保留。应保留。应保留。应保留。解:用解:用GrubbsGrubbs法,法,=1.3110 =1.3110-6-6,s s=O.06610=O.06610-6-6用用用用QQ值检验法:可疑值为值检验法:可疑值为值检验法:可疑值为值检验法:可疑值为x xn n。查表查表查表查表2-42-4,置信度选,置信度选,置信度选,置信度选9090,n n=4=4,Q Q表表表表=0.76=0.76,Q Q计算计算计算计算 B B和和和和 C C,则,则,则,则 R RA A,即计算结果的绝,即计算结果的绝,即计算结果的绝,即计算结果的绝对误差取决于对误差取决于对误差取决于对误差取决于 绝对误差最大的绝对误差最大的绝对误差最大的绝对误差最大的 A A。http:/大量资料大量资料天天更新天天更新 对于乘、除运算:对于乘、除运算:对于乘、除运算:对于乘、除运算:测量值测量值测量值测量值A A、B B、C C的误差对分析结果的误差对分析结果的误差对分析结果的误差对分析结果R R 的影响为:的影响为:的影响为:的影响为:如果误差为有限量,则:如果误差为有限量,则:如果误差为有限量,则:如果误差为有限量,则:极端情况下,有:极端情况下,有:极端情况下,有:极端情况下,有:若若若若 ,则则则则 ,即即即即计计计计算算算算结结结结果果果果的的的的相相相相对对对对误误误误差差差差由由由由相相相相对对对对误差最大的误差最大的误差最大的误差最大的决定决定决定决定。http:/大量资料大量资料天天更新天天更新二、随机误差的传递规律二、随机误差的传递规律 在加、减运算中在加、减运算中 由此可见,在加减运算中分析结果的方差,取决于测量值由此可见,在加减运算中分析结果的方差,取决于测量值中方差最大者。中方差最大者。在乘、除运算中在乘、除运算中由此可见,在乘除运算中分析结果的相对标准偏差的平方取由此可见,在乘除运算中分析结果的相对标准偏差的平方取决于参加运算的测量值中相对标准偏差的平方最大者。决于参加运算的测量值中相对标准偏差的平方最大者。http:/大量资料大量资料天天更新天天更新2-4有效数字及其运算规则有效数字及其运算规则一、有效数字的概念一、有效数字的概念一、有效数字的概念一、有效数字的概念 有效数字有效数字有效数字有效数字 通过实验仪器所能测量到的数字通过实验仪器所能测量到的数字通过实验仪器所能测量到的数字通过实验仪器所能测量到的数字。例如:例如:例如:例如:滴定管的体积读数滴定管的体积读数滴定管的体积读数滴定管的体积读数20.52mL20.52mL;分析天平称出的质量读数分析天平称出的质量读数分析天平称出的质量读数分析天平称出的质量读数0.5180g0.5180g;分光光度计的吸光度读数分光光度计的吸光度读数分光光度计的吸光度读数分光光度计的吸光度读数0.2350.235等等。等等。等等。等等。有效数字与其他数字的区别有效数字与其他数字的区别有效数字与其他数字的区别有效数字与其他数字的区别 不仅表示数值的大小,还表示所用仪器的精度。不仅表示数值的大小,还表示所用仪器的精度。不仅表示数值的大小,还表示所用仪器的精度。不仅表示数值的大小,还表示所用仪器的精度。例如,用分析天平称某物体的质量,应读准到小数点后例如,用分析天平称某物体的质量,应读准到小数点后第四位:第四位:正确正确不正确不正确记录数据记录数据0.5180g0.518g绝对误差绝对误差0.0001g0.001g相对误差相对误差0.02%0.2%http:/大量资料大量资料天天更新天天更新实验数据的表示应当注意实验数据的表示应当注意实验数据的表示应当注意实验数据的表示应当注意:在在在在实实实实验验验验数数数数据据据据的的的的所所所所有有有有有有有有效效效效数数数数字字字字中中中中,只只只只允允允允许许许许最最最最后后后后一一一一位位位位是是是是可疑值。可疑值。可疑值。可疑值。数数数数据据据据中中中中的的的的“0”“0”是是是是否否否否为为为为有有有有效效效效数数数数字字字字,取取取取决决决决于于于于它它它它所所所所起起起起的的的的作作作作用用用用。起起起起定定定定位位位位作作作作用用用用的的的的“0”“0”不不不不是是是是有有有有效效效效数数数数字字字字,与与与与测测测测定定定定精精精精度有关的度有关的度有关的度有关的“0”“0”均是有效数字均是有效数字均是有效数字均是有效数字。只起定位作用只起定位作用0.5180g=518.0mg=518000g=5.180105g在用有效数字表示大于在用有效数字表示大于1 1的整数时,应采用科学记的整数时,应采用科学记数法。数法。http:/大量资料大量资料天天更新天天更新25.00mL25mL0.02500L2.50010-2L例:下列数据各包含几位有效数字例:下列数据各包含几位有效数字例:下列数据各包含几位有效数字例:下列数据各包含几位有效数字0.0376 1.2067 0.2180 0.00400.0376 1.2067 0.2180 0.0040 1.810 1.810-5-5 0.005 2.0100.005 2.0103 3 1000 1000 10.98%10.98%3位位5位位4位位4位位2位位2位位1位位2位位含糊含糊http:/大量资料大量资料天天更新天天更新因测量误差的存在,所以实验数据的最后一因测量误差的存在,所以实验数据的最后一位是可疑数字,而用它进行运算的结果也只能位是可疑数字,而用它进行运算的结果也只能保留一位可疑数字。保留一位可疑数字。二、有效数字的运算规则二、有效数字的运算规则1.加减运算加减运算 运算结果的绝对误差,应当与运算结果的绝对误差,应当与参加运算参加运算数据中数据中绝对误差最大者一致。绝对误差最大者一致。26.71R=0.0001+0.01+0.000010.010.0121+25.64+1.05782=26.70992http:/大量资料大量资料天天更新天天更新0.0325RE%=0.30.0325RE%=0.3,5.103RE%=0.025.103RE%=0.02,60.06RE%=0.0260.06RE%=0.02,139.8RE%=0.07139.8RE%=0.07。2.乘除运算乘除运算 运算结果的有效数字位数,应当与参加运算结果的有效数字位数,应当与参加运算数据中相对误差最大者一致。运算数据中相对误差最大者一致。0.0712503630.3%=0.00020.0713http:/大量资料大量资料天天更新天天更新化学计量系数、得失电子数、质子转移数、倍化学计量系数、得失电子数、质子转移数、倍化学计量系数、得失电子数、质子转移数、倍化学计量系数、得失电子数、质子转移数、倍数等的有效数字位数应视为足够多。数等的有效数字位数应视为足够多。数等的有效数字位数应视为足够多。数等的有效数字位数应视为足够多。第一位数字大于等于第一位数字大于等于第一位数字大于等于第一位数字大于等于8 8的数据,其有效数字的的数据,其有效数字的的数据,其有效数字的的数据,其有效数字的位数可比该数据的实际位数多算一位,例如,位数可比该数据的实际位数多算一位,例如,位数可比该数据的实际位数多算一位,例如,位数可比该数据的实际位数多算一位,例如,8.338.33可可可可以当作以当作以当作以当作4 4位有效数字处理。位有效数字处理。位有效数字处理。位有效数字处理。计算的中间结果可计算的中间结果可计算的中间结果可计算的中间结果可多保留一位有效数字多保留一位有效数字多保留一位有效数字多保留一位有效数字,最终,最终,最终,最终结果则应按四舍五入规则舍弃其他多余的可疑值,结果则应按四舍五入规则舍弃其他多余的可疑值,结果则应按四舍五入规则舍弃其他多余的可疑值,结果则应按四舍五入规则舍弃其他多余的可疑值,只保留一位可疑值。只保留一位可疑值。只保留一位可疑值。只保留一位可疑值。在全分析中应采用在全分析中应采用在全分析中应采用在全分析中应采用“四舍六入五成双四舍六入五成双四舍六入五成双四舍六入五成双”的规则的规则的规则的规则对数据进行修约。对数据进行修约。对数据进行修约。对数据进行修约。3.3.取舍有效数字应注意取舍有效数字应注意http:/大量资料大量资料天天更新天天更新涉及到平衡常数的计算,其结果的有效数涉及到平衡常数的计算,其结果的有效数字一般保留两位。字一般保留两位。对数和对数和pH值值的有效数字是小数点后的部分,的有效数字是小数点后的部分,小数点前的部分起定位作用,不是有效数字。小数点前的部分起定位作用,不是有效数字。误差和偏差最多用两位有效数字表示。误差和偏差最多用两位有效数字表示。常量组分分析中,含量常量组分分析中,含量10%的结果用四的结果用四位有效数字表示;含量在位有效数字表示;含量在110%的用三位有效的用三位有效数字表示;微量组分分析通常用两到三位有效数字表示;微量组分分析通常用两到三位有效数字表示分析结果。数字表示分析结果。http:/大量资料大量资料天天更新天天更新从上述计算可知:从上述计算可知:例如:例如:HAc-NaAc浓度均为浓度均为0.100mol/L时溶液的时溶液的pH值。值。涉及平衡常数的计算,结果一般取两位有效数字。涉及平衡常数的计算,结果一般取两位有效数字。对数的有效数字是小数点后的数字。对数的有效数字是小数点后的数字。http:/大量资料大量资料天天更新天天更新例题例题p2610(1)计算计算计算计算2.1870.854+9.6102.1870.854+9.610-5-50.03260.008140.03260.00814原式原式原式原式1.861.867777+9.+9.6 61010-5-50.000260.000265454=1.86=1.86783178311.861.868 8计算计算计算计算 http:/大量资料大量资料天天更新天天更新例:把下列数据以例:把下列数据以“四舍六入五成双四舍六入五成双”的方法修约的方法修约为为2位有效数字:位有效数字:3.34862.65023.0506.360.735007.54991.250001.250013.32.73.06.40.747.51.21.3四舍六入五成双四舍六入五成双尾数大于尾数大于5的数的数进位进位,尾数小于,尾数小于5的数的数舍弃舍弃。尾数等于尾数等于5的数,若前一位数是偶数或的数,若前一位数是偶数或0,则,则5应应舍弃舍弃;前一位数是奇数,则;前一位数是奇数,则5应应进位进位。0.365510.3660.365340.365http:/大量资料大量资料天天更新天天更新2-5一元回归分析一元回归分析我们在实验中常常会遇到两组数之间存在直线关我们在实验中常常会遇到两组数之间存在直线关我们在实验中常常会遇到两组数之间存在直线关我们在实验中常常会遇到两组数之间存在直线关系的情况。如果用作图法表示这组数间的关系,系的情况。如果用作图法表示这组数间的关系,系的情况。如果用作图法表示这组数间的关系,系的情况。如果用作图法表示这组数间的关系,n n个个个个人人人人就有可能给出就有可能给出就有可能给出就有可能给出n n条条条条斜率和截距各不相同的斜率和截距各不相同的斜率和截距各不相同的斜率和截距各不相同的直线直线直线直线。xyhttp:/大量资料大量资料天天更新天天更新为实验为实验点,点,为为线上点。线上点。1.最小二乘法原理最小二乘法原理最小二乘法是拟合实验数据的常用方法。它处理线性实最小二乘法是拟合实验数据的常用方法。它处理线性实最小二乘法是拟合实验数据的常用方法。它处理线性实最小二乘法是拟合实验数据的常用方法。它处理线性实验数据的中心思想是:验数据的中心思想是:验数据的中心思想是:验数据的中心思想是:选择恰当的斜率选择恰当的斜率选择恰当的斜率选择恰当的斜率b b和截距和截距和截距和截距a a,使确立的,使确立的,使确立的,使确立的直线方程直线方程直线方程直线方程 与所有实验点与所有实验点与所有实验点与所有实验点 y yi i 间的间的间的间的“差方和差方和差方和差方和”最小。最小。最小。最小。即即即即http:/大量资料大量资料天天更新天天更新2.相关系数相关系数r实验数据的线性相关程度,用实验数据的线性相关程度,用实验数据的线性相关程度,用实验数据的线性相关程度,用相关系数相关系数相关系数相关系数 r r 来定来定来定来定量描述。量描述。量描述。量描述。当当当当r r=1=1,两变量间完全线性相关;,两变量间完全线性相关;,两变量间完全线性相关;,两变量间完全线性相关;当当当当r r=0=0,两变量间无线性相关关系;,两变量间无线性相关关系;,两变量间无线性相关关系;,两变量间无线性相关关系;当当当当0 0|r r|11,两变量间有一定线性相关性,这时,两变量间有一定线性相关性,这时,两变量间有一定线性相关性,这时,两变量间有一定线性相关性,这时 r r 只只只只有大于有大于有大于有大于p26p26表表表表2-62-6中的临界值,相关性才显著。中的临界值,相关性才显著。中的临界值,相关性才显著。中的临界值,相关性才显著。sx和和sy分别是分别是x 和和y的标准偏差的标准偏差http:/大量资料大量资料天天更新天天更新p26例例酚含量酚含量酚含量酚含量x x0.0050.0050.0100.0100.0200.0200.0300.0300.0400.0400.0500.050吸光度吸光度吸光度吸光度y y0.0200.0200.0460.0460.1000.1000.1200.1200.1400.1400.1800.180p26p26表表表表2-62-6,p=95%p=95%时时时时r r=0.811=0.811,小于,小于,小于,小于0.9940.994,说明建立的回归方程说明建立的回归方程说明建立的回归方程说明建立的回归方程有意义。有意义。有意义。有意义。