误差与分析数据的处理 (2).ppt
(1)第二章 误差与分析数据的处理2.1有关误差的一些基本概念有关误差的一些基本概念2.1.1准确度与精密度准确度与精密度2.1.2误差与偏差误差与偏差2.1.3系统误差与随机误差系统误差与随机误差2.1.4系统误差与准确度系统误差与准确度2.2随机误差的分布随机误差的分布2.2.1频率分布频率分布2.2.2正态分布正态分布2.2.3随机误差的区间概率随机误差的区间概率要点要点2.3 2.3 有限数据的统计处理有限数据的统计处理 2.3.1 2.3.1 集中趋势和分散趋势的表示集中趋势和分散趋势的表示 2.3.2 2.3.2 平均值的置信区间平均值的置信区间 2.3.3 2.3.3 显著性检验显著性检验 2.3.4 2.3.4 离群值的取舍离群值的取舍 讨论讨论讨论讨论2.1.1准确度与精密度准确度与精密度l准确度准确度Accuracy准确度表征测量值与真实值的符合程度。准确度准确度表征测量值与真实值的符合程度。准确度用误差表示。用误差表示。l精密度精密度precision精密度表征平行测量值的相互符合程度。精密度表征平行测量值的相互符合程度。精密度用偏差表示。精密度用偏差表示。2.1.1 准确度与精密度准确度与精密度l准确度与精密度的关系准确度与精密度的关系例:例:A、B、C、D四个分析工作者对同一铁标样四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,中的铁含量进行测量,得结果如图示,比较其准确度与精密度。比较其准确度与精密度。36.0036.5037.0037.5038.00测量点测量点平均值平均值真值真值DCBA表观准确度高,精密度低表观准确度高,精密度低准确度高,精密度高准确度高,精密度高准确度低,精密度高准确度低,精密度高准确度低,精密度低准确度低,精密度低(不可靠)(不可靠)准确度与精密度的关系准确度与精密度的关系l结论:结论:1、精密度是保证准确度的前提。、精密度是保证准确度的前提。2、精密度高,不一定准确度就高。、精密度高,不一定准确度就高。2.1.2 误差与偏差误差与偏差误差(误差(Error):表示准确度高低的量。表示准确度高低的量。对一对一B物质客观存在量为物质客观存在量为T 的分析对象进行分析,得到的分析对象进行分析,得到n个个个别测定值个别测定值x1、x2、x3、xn,对,对n个测定值进行平均,个测定值进行平均,得到测定结果的平均值,那么:得到测定结果的平均值,那么:个别测定的误差为:个别测定的误差为:测定结果的绝对误差为:测定结果的绝对误差为:测定结果的相对误差为:测定结果的相对误差为:2.1.2 2.1.2 误差与偏差误差与偏差误差与偏差误差与偏差真值真值T(Truevalue)某一物理量本身具有的客观存在的真实值。真值是未知某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下的、客观存在的量。在特定情况下认为认为是已知的:是已知的:1、理论真值(如化合物的理论组成)、理论真值(如化合物的理论组成)2、计量学约定真值(如国际计量大会确定的长度、质、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等)量、物质的量单位等等)3、相对真值(如高一级精度的测量值相对于低一级精、相对真值(如高一级精度的测量值相对于低一级精度的测量值)度的测量值)例如,标准样品的标准值例如,标准样品的标准值2.1.2 2.1.2 误差与偏差误差与偏差误差与偏差误差与偏差偏差(偏差(deviation):表示精密度高低的量。偏差表示精密度高低的量。偏差小,精密度高。小,精密度高。偏差的表示有:偏差的表示有:偏差偏差di极极差差R标准偏差标准偏差S相对标准偏差相对标准偏差(变异系数)(变异系数)CV具体定义和计算在后续内容中介绍。具体定义和计算在后续内容中介绍。平均偏差平均偏差2.1.3 系统误差与随机误差系统误差与随机误差l系统误差系统误差 (Systematicerror)某种固定的因某种固定的因素造成的误差。素造成的误差。l随机误差随机误差 (Randomerror)不定的因素造成不定的因素造成的误差的误差l过失误差过失误差 (Grosserror,mistake)系统误差与随机误差的比较系统误差与随机误差的比较项目项目系统误差系统误差随机误差随机误差产生原因产生原因固定因素,有时不存在固定因素,有时不存在不定因素,总是存在不定因素,总是存在分类分类方法误差、仪器与试剂方法误差、仪器与试剂误差、主观误差误差、主观误差环境的变化因素、主环境的变化因素、主观的变化因素等观的变化因素等性质性质重现性、单向性(或周重现性、单向性(或周期性)、可测性期性)、可测性服从概率统计规律、服从概率统计规律、不可测性不可测性影响影响准确度准确度精密度精密度消除或减消除或减小的方法小的方法校正校正增加测定的次数增加测定的次数系统误差的校正系统误差的校正l方法系统误差方法系统误差方法校正方法校正l主观系统误差主观系统误差对照实验(外检)对照实验(外检)l仪器系统误差仪器系统误差对照实验对照实验l试剂系统误差试剂系统误差空白实验空白实验如何判断是否存在系统误差?如何判断是否存在系统误差?如何判断是否存在系统误差?如何判断是否存在系统误差?系统误差与准确度系统误差与准确度 Bias and accuracy测量值的误差:测量值的误差:可以写成:可以写成:注:系统误差注:系统误差systematicerror或者或者bias对单一测量值对单一测量值:误差误差 =随机误差随机误差 +系统误差系统误差Error=randomerror+bias由足够多的单一测量求得的由足够多的单一测量求得的“稳定稳定”的平均值:的平均值:绝对误差绝对误差 =系统误差系统误差系统误差与准确度系统误差与准确度 Bias and accuracy无限次测量求平均值,得到的总体平均值无限次测量求平均值,得到的总体平均值 绝对误差绝对误差=总体平均值总体平均值真值真值=系统误差系统误差系统误差影响结果的准确度系统误差影响结果的准确度系统误差影响结果的准确度系统误差影响结果的准确度误差的分配误差的分配误差的分配误差的分配误差的分配误差的分配系统误差系统误差=实验室系统误差实验室系统误差+方法系统误差方法系统误差注:实验室系统误差指单一实验室内重复测量所表现出注:实验室系统误差指单一实验室内重复测量所表现出的系统误差。的系统误差。有有j 个实验室对同一样品进行分析,每个实验个实验室对同一样品进行分析,每个实验室得到室得到i 个个测量值,将单一测量值表示为测量值,将单一测量值表示为xij实验室实验室1实验室实验室2实验室实验室j误差分配示意图误差分配示意图单一实验室的误差分配单一实验室的误差分配实验室间误差分配实验室间误差分配随机误差随机误差再现性再现性Reproducibitity重现性重现性 Repeatability 正态分布的正态分布的实验室内随机误差实验室内随机误差正态分布正态分布的实验室的实验室系统误差系统误差方法系统误差方法系统误差正态分布的正态分布的实验室内随机误差实验室内随机误差方法系统误差方法系统误差+实验室系统误差实验室系统误差实验室1实验室2实验室 j2.2.12.2.1频率分布频率分布频率分布频率分布No分组分组频数频数(ni)频率频率(ni/n)频率密度频率密度(ni/n s)115.8410.0050.17215.8710.0050.17315.9030.0150.51415.9380.0401.35515.96180.0913.03615.99340.1725.72716.02550.2789.26816.06400.2026.73916.09200.1013.371016.12110.0561.851116.1550.0250.841216.1820.0100.341316.2100.0000.00厦门大学的学生对海水中厦门大学的学生对海水中的卤素进行测定,得到的卤素进行测定,得到74.24%88.38%数据集中与分散的趋势数据集中与分散的趋势海水中卤素测定值频率海水中卤素测定值频率海水中卤素测定值频率海水中卤素测定值频率密度直方图密度直方图密度直方图密度直方图海水中卤素测定值频率密海水中卤素测定值频率密海水中卤素测定值频率密海水中卤素测定值频率密度分布图度分布图度分布图度分布图问题问题问题问题测量次数趋近于无穷大时的频率分布?测量次数趋近于无穷大时的频率分布?测量次数趋近于无穷大时的频率分布?测量次数趋近于无穷大时的频率分布?测量次数少时的频率分布?测量次数少时的频率分布?测量次数少时的频率分布?测量次数少时的频率分布?某段频率分布曲线下的面积具有什么意义?某段频率分布曲线下的面积具有什么意义?某段频率分布曲线下的面积具有什么意义?某段频率分布曲线下的面积具有什么意义?测量值与随机误差的正态分布测量值与随机误差的正态分布测量值与随机误差的正态分布测量值与随机误差的正态分布测量值正态分布测量值正态分布N(,2)的概率密度函数:的概率密度函数:1=0.047 2=0.023 xy 概率密度概率密度x 个别测量值个别测量值 总体平均值,表总体平均值,表示无限次测量值集示无限次测量值集中的趋势。中的趋势。总体标准偏差,总体标准偏差,表示无限次测量分表示无限次测量分散的程度。散的程度。x-随机误差随机误差随机误差的正态分布随机误差的正态分布测量值的正态分布测量值的正态分布0 0 x-总体标准偏差总体标准偏差 相同,相同,总体平均值总体平均值 不同不同总体平均值总体平均值 相同,总相同,总体标准偏差体标准偏差 不同不同原因:原因:1、总体不同、总体不同2、同一总体,存在系统、同一总体,存在系统误差误差原因:原因:同一总体,精密度不同同一总体,精密度不同测量值和随机误差的正态分布体现了随机误差的概率统计规律测量值和随机误差的正态分布体现了随机误差的概率统计规律测量值和随机误差的正态分布体现了随机误差的概率统计规律测量值和随机误差的正态分布体现了随机误差的概率统计规律1、小误差出现的概率大,大误差出现的概率小;特、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。别大的误差出现的概率极小。2、正误差出现的概率与负误差出现的概率相等。、正误差出现的概率与负误差出现的概率相等。3、x=时,时,y 值最大,体现了测量值的集中趋势。值最大,体现了测量值的集中趋势。集中的程度与集中的程度与 有关。有关。平均值平均值结论:增加平行测量结论:增加平行测量次数可有效减小随机次数可有效减小随机误差。误差。x标准正态分布曲线标准正态分布曲线标准正态分布曲线标准正态分布曲线 N N N N(0,1)(0,1)(0,1)(0,1)令:令:正态分布函数转换成标准正态分布函数:正态分布函数转换成标准正态分布函数:68.3%95.5%99.7%u随机误差的区间概率随机误差的区间概率随机误差的区间概率随机误差的区间概率|u|u|面积面积|u|u 面积面积|u|u 面积面积|u|u 面积面积0.6740.6740.25000.25001.0001.0000.34130.34131.6451.6450.45000.45001.9601.9600.47500.47502.0002.0000.47730.47732.5762.5760.49500.49503.0003.0000.49870.4987 0.50000.5000正态分布概率积分表(部分数值)正态分布概率积分表(部分数值)随机误差出现的随机误差出现的区间区间u(以以 为为单位)单位)测量值出现的区测量值出现的区间间概率概率%(-1,+1)(-1,+1)68.3(-1.96,+1.96)(-1.96,+1.96)95.0(-2,+2)(-2,+2)95.5(-2.58,2.58)(-2.58,+2.58)99.0(-3,+3)(-3,+3)99.7测量值与随机误差的区间概率测量值与随机误差的区间概率测量值与随机误差的区间概率测量值与随机误差的区间概率正态分布概率积分表(部分数值)正态分布概率积分表(部分数值)|u|面积面积|u面积面积|u面积面积|u面积面积0.6740.25001.0000.34131.6450.45001.9600.47502.0000.47732.5760.49503.0000.4987 0.50000.5000.19151.5000.43322.5000.4938例题例题例题例题2-12-1:(1)解解查表查表:u=1.5时,概率为:时,概率为:2 0.4332=0.866=86.6%(2)解)解查表查表:u2.5时,概率为:时,概率为:0.50.4938=0.0062=0.62%一样品,标准值为一样品,标准值为1.75%,测得,测得=0.10,求结果落在求结果落在(1 1)1.75 0.15%概率;概率;(2 2)测量值大于测量值大于2%的概率。的概率。86.6%0.62%PaaP+a=1a显著性水平显著性水平P置信度置信度有限数据的统计处理有限数据的统计处理有限数据的统计处理有限数据的统计处理总体总体样本样本甲甲样本容量样本容量平均值平均值500g500g乙乙平行测定平行测定 3 3 次次平行测定平行测定 4 4 次次丙丙平行测定平行测定 4 4次次有限数据的处理:有限数据的处理:计算计算估计估计 显著性检验显著性检验没有系统误差,没有系统误差,=T有系统误差,有系统误差,T2.3.12.3.1数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示数据集中趋势和分散程度的表示数据集中趋势的表示:数据集中趋势的表示:对一对一B物质客观存在量为物质客观存在量为T 的分析对象进行分析,得到的分析对象进行分析,得到n个个别测定值个个别测定值x1、x2、x3、xn,平均值平均值Average中位数中位数Median有限次测量:测量值向有限次测量:测量值向平均值平均值 集中集中无限次测量:测量值向无限次测量:测量值向总体平均值总体平均值 集中集中对对对对 和和和和 的估计的估计的估计的估计数据分散程度的表示数据分散程度的表示数据分散程度的表示数据分散程度的表示极差极差R R Range相对极差相对极差R R偏差偏差 Deviation平均偏差平均偏差 Meandeviation相对平均偏差相对平均偏差 relativemeandeviation标准偏差标准偏差 standarddeviation相对标准偏差相对标准偏差(变异系数变异系数)Relativestandarddeviation(Coefficientofvariation,CV)总体标准偏差与标准偏差的比较总体标准偏差与标准偏差的比较总体标准偏差与标准偏差的比较总体标准偏差与标准偏差的比较总体标准偏差总体标准偏差标准偏差标准偏差无限次测量,无限次测量,对总体平均值的离散对总体平均值的离散有限次测量有限次测量对平均值的离散对平均值的离散自由度自由度计算一组数据分散计算一组数据分散度的独立偏差数度的独立偏差数自由度的理解:例如,有三个测量值,求得平均值,也知自由度的理解:例如,有三个测量值,求得平均值,也知道道x1和和x2与平均值的差值,那么,与平均值的差值,那么,x3与平均值的差值就是与平均值的差值就是确定的了,不是一个独立的变数。确定的了,不是一个独立的变数。平均值的标准偏差平均值的标准偏差平均值的标准偏差平均值的标准偏差设有一样品,设有一样品,m个分析工作者对其进行分析,每人测个分析工作者对其进行分析,每人测n次,计次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。算出各自的平均值,这些平均值的分布也是符合正态分布的。试样总体试样总体样本样本1样本样本2样本样本m平均值的总体标准偏差:平均值的总体标准偏差:对对有限次测量:有限次测量:对对有限次测量:有限次测量:1、增加测量次数、增加测量次数可以提高精密度。可以提高精密度。2、增加(过多)、增加(过多)测量次数的代价不测量次数的代价不一定能从减小误差一定能从减小误差得到补偿。得到补偿。结论:结论:测量次数测量次数2.3.2 2.3.2 总体平均值的置信区间总体平均值的置信区间总体平均值的置信区间总体平均值的置信区间对对 的区间的估计的区间的估计对一对一样品分析,报告出:样品分析,报告出:估计估计问题:问题:例如例如在在 的的某个范围某个范围 内包含内包含 的的把握把握 有多大?有多大?无限次测量无限次测量对有限次测量对有限次测量1 1、把握程度,多少把握、把握程度,多少把握2 2、区间界限,多大区间、区间界限,多大区间置信水平置信水平 Confidencelevel置信度置信度 DegreeofconfidenceProbabilitylevel置信区间置信区间 Confidenceinterval置信界限置信界限 Confidencelimit必然的联系必然的联系平均值的置信区间的问题平均值的置信区间的问题这个问题涉及两个方面:这个问题涉及两个方面:总体平均值的置信区间总体平均值的置信区间概率概率区间大小区间大小例:例:包含在包含在 包含在包含在把握相对大把握相对大把握把握相对小相对小100%的把握的把握无意义无意义 包含在包含在随机误差随机误差随机误差随机误差1.1.对一个样品进行无限次测定,可以得到对一个样品进行无限次测定,可以得到 和和,测量值和随机,测量值和随机误差遵从正态分布规律。误差遵从正态分布规律。2.2.若用若用 u表示随机误差,可得到一个随机误差的标准正态分布表示随机误差,可得到一个随机误差的标准正态分布.3.3.根据随机误差的标准正态分布,可求得随机误差出现在某一区根据随机误差的标准正态分布,可求得随机误差出现在某一区间的概率,根据间的概率,根据u 的定义,也可求出的定义,也可求出x出现在某一区间的概率。出现在某一区间的概率。1=0.047 2=0.023 x0 x-随机误差随机误差 测量值测量值 u区间概率与置信区间区间概率与置信区间区间概率与置信区间区间概率与置信区间例例2-2查表查表若若用单用单次次测量值来估计测量值来估计 的区间:的区间:v这是一个在一定置信度下总体平均值的置信区间的问题,这是一个在一定置信度下总体平均值的置信区间的问题,是说是说有有95%的把握说的把握说 包含在包含在的范围内。的范围内。则则v这是一个区间概率的问题,是说测量值落在这是一个区间概率的问题,是说测量值落在范围内的概率为范围内的概率为95%。即即v实际分析工作中通常是以样本平均值估计总体平均值实际分析工作中通常是以样本平均值估计总体平均值是说是说有一定的把握说有一定的把握说 包含在包含在的范围内。的范围内。1 1、t t 分布曲线分布曲线无限次测量,得到无限次测量,得到 u u 分布曲线分布曲线有限次测量,得到有限次测量,得到s st t 分布曲线分布曲线 t t 分布值表分布值表分布值表分布值表自由度自由度f=(n-1)显著水平显著水平 0.500.100.050.0111.006.31 12.71 63.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.85 0.671.651.962.58P=1-,置信度置信度,显著性水平显著性水平返回例题返回例题2-4返回例题返回例题2-31返回例题返回例题2-32返回例题返回例题2-56次次测量,随机误差落测量,随机误差落在在2.57范围内的范围内的概率为概率为95%。无限次测量,随机误无限次测量,随机误差落在差落在1.96 范围内范围内的概率为的概率为95%。t t t t 分布值表分布值表分布值表分布值表自由度自由度f=(n-1)显著水平显著水平 0.500.100.050.0111.006.3112.7163.6620.822.924.309.9330.762.353.185.8440.742.132.784.6050.732.022.574.0360.721.942.453.7170.711.902.373.5080.711.862.313.3690.701.832.263.25100.701.812.233.17200.691.732.092.85 0.671.651.962.582 2、置信区间、置信区间、置信区间、置信区间有限次测量有限次测量服从自由度服从自由度f 的的t 分布分布时时t 代入,得代入,得改写为改写为置信度为(置信度为(1-)100%的的 的置信区间为的置信区间为例题例题例题例题2-32-32-32-3分析铁矿中的铁的质量分数,得到如下数据:分析铁矿中的铁的质量分数,得到如下数据:37.4537.45,37.2037.20,37.5037.50,37.3037.30,37.2537.25(%)。)。(1 1)计算此结果的平均值、中位值、极差、平均偏差、标准)计算此结果的平均值、中位值、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。偏差、变异系数和平均值的标准偏差。(2 2)求置信度分别为)求置信度分别为95%95%和和99%99%的置信区间。的置信区间。解(解(1 1)解题过程解题过程分析结果分析结果例题例题例题例题2-3 2-3 解(解(解(解(1 1)例题例题2-32-3续解(续解(1 1):):分析结果:分析结果:解(解(解(解(2 2 2 2)求置信度分别为求置信度分别为求置信度分别为求置信度分别为95%95%95%95%和和和和99%99%99%99%的置信区间。的置信区间。的置信区间。的置信区间。置信度为置信度为95%95%,即,即1-=0.95,=0.05,查表查表查表查表t 0.05,4=2.78 的的95%95%置信区间:置信区间:(1 1)的结果)的结果置信度为置信度为99%99%,即,即1-=0.99,=0.01,查表查表查表查表t 0.01,4=4.60 的的99%99%置信区间置信区间结论结论结论结论结论结论l置信度高,置信区间大。区间的大小反置信度高,置信区间大。区间的大小反映估计的精度,置信度的高低说明估计映估计的精度,置信度的高低说明估计的把握程度。的把握程度。总体标准偏差已知情况下的总体平均值的置信区间总体标准偏差已知情况下的总体平均值的置信区间总体标准偏差已知情况下的总体平均值的置信区间总体标准偏差已知情况下的总体平均值的置信区间常规例行分析,每天进行,可认为常规例行分析,每天进行,可认为n n,是已知的,是已知的,t t 分分布还原为布还原为 u u 分布,总体平均值的置信区间为:分布,总体平均值的置信区间为:比较总体标准偏差已知与未知情况下的总体平均值的置信区间比较总体标准偏差已知与未知情况下的总体平均值的置信区间置信度为置信度为95%95%,t 0.05,4=2.78 未知未知置信度为置信度为95%95%,u 0.05=1.96 已知已知置信区间概念的应用置信区间概念的应用置信区间概念的应用置信区间概念的应用置信区间概念的应用置信区间概念的应用置信区间概念的应用置信区间概念的应用Ananalystisaskedtodetermineleadinaconsignmentoffruitjuice.Theclientspecifiesthattheleadcontentisoftheorderof100 g/kg(ppb)andthatherequiresan“accuracy”of5 g/kgandacceptsa95%confidencelevel.Calculatethesamplesizenecessarytosatisfythisrequestassumingthat,atthespecifiedconcentrationlevel,theprecisionoftheanalyticalmethodusedisknowntobe8 g/kg.对某海区沉积物中的油进行分析,为使分析误差不超过对某海区沉积物中的油进行分析,为使分析误差不超过 2s,问问问问至少应采集多少个样?(置信度至少应采集多少个样?(置信度至少应采集多少个样?(置信度至少应采集多少个样?(置信度95%95%)2.3.3 2.3.3 2.3.3 2.3.3 显著性检验显著性检验显著性检验显著性检验 Significant TestSignificant Test(1 1)对含量真值为)对含量真值为T T的某物质进行分析,得到平均值的某物质进行分析,得到平均值(2 2)用两种不同的方法、或两台不同的仪器、或两个不同的实验)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值室对同一样品进行分析,得到平均值问题:是问题:是由由随机误差引起,或存在系统误差?随机误差引起,或存在系统误差?显著性显著性检验检验显著性差异显著性差异非显著性差异非显著性差异系统误差系统误差校正校正随机误差随机误差正常正常显著性检验显著性检验但但但但但但1.1.1.1.平均值与标准值的比较平均值与标准值的比较平均值与标准值的比较平均值与标准值的比较t t 检验法检验法假设不存在系统误差,那么假设不存在系统误差,那么是由随机误差引起的,测量误差应满足是由随机误差引起的,测量误差应满足t t 分布,分布,根据根据 计算出的计算出的t t 值应落在指定值应落在指定的概率区间里。否则,假的概率区间里。否则,假设不满足,表明存在着显设不满足,表明存在着显著性差异。著性差异。t t 检验法的方法检验法的方法1 1、根据、根据 算出算出t t 值值;2 2、给出显著性水平或置信度、给出显著性水平或置信度3 3、将计算出的、将计算出的t t 值与表上查得值与表上查得的的t t 值进行比较,若值进行比较,若表示表示 落在落在 为中心为中心的某一指定概率之外。在一的某一指定概率之外。在一次测定中,这样的几率是极次测定中,这样的几率是极小的,故认为是不可能的,小的,故认为是不可能的,拒绝接受。拒绝接受。习惯上说习惯上说 表明有系统误差存在。表明有系统误差存在。例题例题例题例题2-42-42-42-4某某化验室测定化验室测定CaO的质量分数为的质量分数为30.43%的某样品中的某样品中CaO的含的含量,得如下结果:量,得如下结果:问此问此测定有无系统误差?测定有无系统误差?(给定给定=0.05%)解解查表查表查表查表比较:比较:说明说明 和和T T 有显著差异,此有显著差异,此测定有系统误差。测定有系统误差。假设:假设:=T=T 单单单单 边与双边边与双边边与双边边与双边2 2、两组平均值的比较、两组平均值的比较、两组平均值的比较、两组平均值的比较两个两个实验室对同一标样进行分析,得到:实验室对同一标样进行分析,得到:和和假设不存在系统误差,那么:假设不存在系统误差,那么:是由于随机误差引起的,应满足自由度是由于随机误差引起的,应满足自由度 f=(n1+n22)的的t 分布,分布,两组平均值的比较的方法两组平均值的比较的方法两组平均值的比较的方法两组平均值的比较的方法1、F 检验法检验两组实验数据的精密度检验法检验两组实验数据的精密度S1和和S2之间有无之间有无显著差异:显著差异:查表查表精密度无显著差异。精密度无显著差异。2、t检验确定两组平均值之间有无显著性差异检验确定两组平均值之间有无显著性差异3、查表、查表4、比较、比较非非显著差异,无系统误差显著差异,无系统误差具体计算见教材的例题。具体计算见教材的例题。置信度置信度置信度置信度95%95%时部分时部分时部分时部分F F值(单边)值(单边)值(单边)值(单边)置信度置信度置信度置信度90%90%时部分时部分时部分时部分F F值(双边)值(双边)值(双边)值(双边)f大 f小23456219.0019.1619.2519.30 19.3339.559.289.129.018.94 46.946.596.396.166.0955.795.415.195.054.9565.144.764.534.394.282.3.4 2.3.4 异常值的检验异常值的检验异常值的检验异常值的检验 Outlier rejectionOutlier rejection异常值的检验方法:异常值的检验方法:1.Q检验法检验法DixonsQ-test(1)将测量的数据按大小顺序排列。)将测量的数据按大小顺序排列。(2)计算测定值的极差)计算测定值的极差R。(3)计算可疑值与相邻值之差(应取绝对值)计算可疑值与相邻值之差(应取绝对值)d。(4)计算)计算Q值:值:(5)比较:)比较:舍弃。舍弃。舍弃商舍弃商Q值值测定次数测定次数n345678910Q0.900.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.491、法法(1)将可疑值除外,求其余数据的平均值和平均偏差)将可疑值除外,求其余数据的平均值和平均偏差;(2)求可疑值)求可疑值x与平均值与平均值之间的差的绝对值之间的差的绝对值(3)判断)判断舍弃。舍弃。统计学方法证明,当测定次数非常多(例如大于统计学方法证明,当测定次数非常多(例如大于20时,总体时,总体标准偏差与总体平均偏差标准偏差与总体平均偏差 有下列关系有下列关系=0.7979 0.80 4 3,偏差超过,偏差超过4 的测量值可以舍弃。的测量值可以舍弃。ReturnReturn测定碱灰总碱量(测定碱灰总碱量(%Na2O)得到得到6个数据,按其大小顺序排列为个数据,按其大小顺序排列为40.02,40.12,40.16,40.18,40.18,40.20。第一个数据可疑,。第一个数据可疑,判断是否应舍弃?(置性度为判断是否应舍弃?(置性度为90%)。)。解解查表查表n=6,Q表表=0.56舍弃舍弃例题例题例题例题2-62-6:2.法法3、格鲁布斯(格鲁布斯(Grubbs)法法3、格鲁布斯、格鲁布斯Grubbs)法法(1)将测量的数据按大小顺序排列。)将测量的数据按大小顺序排列。(2)设第一个数据可疑,计算设第一个数据可疑,计算或或设第设第n个数据可疑,计算个数据可疑,计算(3)查表:)查表:T计算计算 T表表,舍弃。舍弃。ReturnReturn1用一种测定用一种测定DDT的方法分析未喷洒过杀虫剂的方法分析未喷洒过杀虫剂(DDT)的植物的植物叶子试样叶子试样,测得测得DDT的含量(的含量(g/g)为)为0.2,0.4,0.8,0.5,0.2;今有一植物叶子试样今有一植物叶子试样,测得测得DDT的含量(的含量(g/g)为)为0.4,0.5,0.8,1.0,0.5,该植物是否喷洒过该植物是否喷洒过DDT?显著水平为显著水平为0.05,t(0.05,8)=2.31,t(0.10,8)=1.86单边检验单边检验t t 分布曲线分布曲线 未知样品的测量未知样品的测量未知样品的测量未知样品的测量值总是大于已知值总是大于已知值总是大于已知值总是大于已知样品的测量值。样品的测量值。样品的测量值。样品的测量值。2.某炼铁厂生产的铁水,从长期经验知道它的碳含量服某炼铁厂生产的铁水,从长期经验知道它的碳含量服从正态分布,从正态分布,T为为4.55%,为为0.08%。现在又生产了。现在又生产了5炉铁水,炉铁水,其碳含量分别为其碳含量分别为4.28%,4.40%,4.42%,4.35%,4.37%。试问。试问均值有无变化?均值有无变化?(给定给定=0.05%)双边检验双边检验双边检验双边检验 均值可能大于或小于T讨论讨论1.1.如何理解置信区间如何理解置信区间Ananalyticalprotocolexhibitsa95%confidenceintervalof0.06.Ifa90%confidencelimitof0.06isrequiredbyregulations,couldtheprotocolstillbeused?表示测定结果的不确定性表示测定结果的不确定性表示测定结果的不确定性表示测定结果的不确定性2.2.单边检验与双边检验单边检验与双边检验(2)2.3 2.3 有限数据的统计处理有限数据的统计处理 2.3.5 2.3.5 误差的传递误差的传递 2.3.6 2.3.6 标准曲线及线性回归标准曲线及线性回归2.4 2.4 提高分析准确度的方法提高分析准确度的方法 2.4.1 2.4.1 减小测量误差减小测量误差 2.4.2 2.4.2 控制随机误差控制随机误差 2.4.3 2.4.3 消除系统误差消除系统误差第二章第二章 误差与分析数据的处理误差与分析数据的处理2.5 2.5 有效数字有效数字2.6 2.6 分析测试的质量保证分析测试的质量保证 2.6.1 2.6.1 2.6.1 2.6.1 测试过程中的质量保证测试过程中的质量保证 2.6.2 2.6.2 2.6.2 2.6.2 有效测量系统有效测量系统2.3.5 2.3.5 2.3.5 2.3.5 误差的传递误差的传递误差的传递误差的传递 PropagationofErrorPropagationofError误差传递的方式取决于误差的性质(系统误差或随机误差),误差传递的方式取决于误差的性质(系统误差或随机误差),取决于分析结果与测量值之间的化学计量关系(计算方式)。取决于分析结果与测量值之间的化学计量关系(计算方式)。AAsampleisweighedanddissolved.Theanalyteistheonlycoloredspeciesandthesamplescontentismeasuredbyabsorbance.Separationmeasurementsaremadeforablankandsample.ThealgebraicexpressionisCanalyte=(Asample Ablank)/beachstepisassociatedwithsomeerror(randomordetermiate)1.1.1.1.系统误差的传递系统误差的传递系统误差的传递系统误差的传递k ki i为常数为常数设设分析结果分析结果Y 由测量值由测量值A、B、C 计算获得,测计算获得,测量值的系统误差分别为量值的系统误差分别为 A A、B B、C C,标准偏差标准偏差分别为分别为sA、sB、sC。2 2 2 2、随机误差的传递、随机误差的传递、随机误差的传递、随机误差的传递设设分析结果分析结果Y 由测量值由测量值A、B、C 计算获得,测量值的计算获得,测量值的系统误差分别为系统误差分别为 A、B、C,标准偏差分别为标准偏差分别为sA、sB、sC。3 3 3 3、极值误差、极值误差、极值误差、极值误差例题例题例题例题2-72-72-72-7天平称量的标准偏差天平称量的标准偏差s=0.10mg,求称量试样时的标准偏差求称量试样时的标准偏差。解:称一个样需读两次平衡点,解:称一个样需读两次平衡点,例题例题2-82-8滴定管的初读数为(滴定管的初读数为(0.050.01)mL,末读数为(末读数为(22.100.01)mL,问滴定剂的体积可能在多大范围内波动?问滴定剂的体积可能在多大范围内波动?解:极值误差解:极值误差 V=0.01+0.01=0.02滴定剂体积为:滴定剂体积为:(22.10-0.05)0.02mL=22.05 0.02mL2.3 6 2.3 6 2.3 6 2.3 6 标准曲线及线性回归标准曲线及线性回归标准曲线及线性回归标准曲线及线性回归No.标样浓度标样浓度 g/L吸收吸收值值15.000.045210.00.093320.00.140430.00.175540.00.2366试样试样0.200问题问题1、每个测量值都有误差,标准曲线应怎样作才合理?、每个测量值都有误差,标准曲线应怎样作才合理?2、应怎样估计线性的好坏?、应怎样估计线性的