分析化学中的数据处理.pdf
《分析化学中的数据处理.pdf》由会员分享,可在线阅读,更多相关《分析化学中的数据处理.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、河南师范大学 第7章 分析化学中的数据处理 教学目的:用数理统计的方法处理实验数据,将会更好地表达结果,既能显示出测量的精密度,又能表达出结果的准确度;介绍显著性检验的方法,用于检验样本值与标准值的比较、两个平均值的比较和可疑值的取舍。教学重点:总体平均值的估计;t检验法 教学难点:对随机变量正态分布的理解;各种检验法的正确使用,双侧和单侧检验如何查表。1.总体与样本 1.总体与样本 总体:总体:在统计学中,对于所考察的对象的全体,称为总体(或母体)。个体:组成总体的每个单元。样本(子样)样本(子样):自总体中随机抽取的一组测量值(自总体中随机抽取的一部分个体)。样本容量样本容量:样品中所包含
2、个体的数目,用 n 表示。例题:分析延河水总硬度,依照取样规则,从延河取来供分析用 2000ml 样品水,这 2000ml 样品水是供分析用的总体总体,如果从样品水中取出 20 个试样进行平行分析,得到 20 个分析结果,则这组分析结果就是延河样品水的一个随机样本,样本容量随机样本,样本容量为 20。2随机变量 2随机变量 来自同一总体的无限多个测量值都是随机出现的,叫随机变量。1ixxn=,1liminxn=(总体平均值),xn=(单次测量的平均偏差)7.1 标准偏差标准偏差 7.1.1 总体标准偏差(无限次测量)总体标准偏差(无限次测量)()21niixn=n测量次数 7.1.2 样本标准
3、偏差(有限次测量)样本标准偏差(有限次测量)21()1niixxSn=(n1)自由度 7.1.3 相对标准偏差相对标准偏差 相对标准偏差(变异系数)100%sCVx=100%dx=相对平均偏差 7.1.4 标准偏差与平均偏差标准偏差与平均偏差 当测定次数非常多(n 大于 20)时,0.7970.8=,但是00.8dS 7.1.5 平均值的标准偏差平均值的标准偏差 统计学可证明 平均值的标准偏差与单次测量结果的标准偏差存在下列关系:xn=,xn=(无限次测量)增加测定次数,可使平均值的标准偏差减少,但测定次数增加到一定程度时,这种减少作用不明显,因此在实际工作中,一般平行测定 3-4 次即可;当
4、要求较高时,可适当增加平行测量次数 xssn=,xddn=(有限次测量)1河南师范大学 7.2 随机误差的正态分布 7.2 随机误差的正态分布 7.2.1 频数分布频数分布 频数:每组中数据的个数。相对频数:频数在总测定次数中所占的分数。频数分布直方图:以各组分区间为底,相对频数为高做成的一排矩形。特点:1.离散特性离散特性:测定值在平均值周围波动。波动的程度用总体标准偏差表示。2.集中趋势集中趋势:向平均值集中。用总体平均值表示。在确认消除了系统误差的前提下,总体平均值就是真值。7.2.2 正态分布(无限次测量)正态分布(无限次测量)1正态分布曲线:如果以 x-(随机误差)为横坐标,曲线最高
5、点横坐标为 0,这时表示的是随机误差的正态分布曲线。()2221()2xyf xe=,记为:N(,2),决定曲线在 X 轴的位置 决定曲线的形状,小曲线高、陡峭,精密度好;曲线低、平坦,精密度差。随机误差符合正态分布:(1)大误差出现的几率小,小误差出现的几率大;(2)绝对值相等的正负误差出现的几率相等;(3)误差为零的测量值出现的几率最大。(4)x=时的概率密度为 12xy=2标准正态分布 N(0,1)令xu=,()222211()22uuyf xeyue=7.2.3 随机误差的区间概率 7.2.3 随机误差的区间概率 所有测量值出现的概率总和应为 1,即2221(,)12uPe+dx+=求
6、变量在某区间出现的概率,2221(,)2ubaP a bedx=概率积分表,p248。注意:表中列出的是单侧概率,求u 间的概率,需乘以 2。随机误差出现的区间 测量值出现的区间 概率 u1 x1 0.3413268.26 u2 x2 0.4773295.46 u3 x3 0.4987299.74 结论结论:1.随机误差超过 3的测量值出现的概率仅占 0.3%。2.当实际工作中,如果重复测量中,个别数据误差的绝对值大于 3,则这些测量值可舍去。例:已知某试样中 Fe 的标准值为 3.78%,=0.10,又已知测量时没有系统误差,求 1)分析结果落在(3.780.20)%范围内的概率;2)分析结
7、果大于 4.0%的概率。解:1)0.202.00.10 xuu=查表,求得概率为 2*0.4773=0.9546=95.46%2)分析结果大于 4.0%的概率,4.003.782.20.10 xuu=,查表求得分析结果落在3.78-4.00%以内的概率为 0.4861,那么分析结果大于 4.00%的概率为 0.5000-0.4861=1.39%2河南师范大学 7.3 少量数据的统计处理 7.3 少量数据的统计处理 7.3.1 t 分布曲线(有限次测量中随机误差服从分布曲线(有限次测量中随机误差服从 t 分布)分布)有限次测量,用 S 代替,用 t 代替 u xxxtnss=置信度(置信度(P)
8、:):表示的是测定值落在xtS范围内的概率,当 f,t 即为 u 显著性水平()显著性水平()=1-P:表示测定值落在xtS范围之外的概率。t 值与置信度及自由度有关,一般表示为,ft,见 p250,表 73(双侧表)7.3.2 平均值的置信区间平均值的置信区间 Sxtn=意义:意义:表示在一定的置信度下,以平均值为中心,包括总体平均值的范围。从公式可知只要选定置信度 P,根据 P(或)与 f 即可从表中查出 t,f值,从测定的x,s,n 值就可以求出相应的置信区间。分析某固体废物中铁含量得如下结果:x=15.78%,s=0.03%,n=4,求 1)置信度为 95%时平均值的置信区间;2)置信
9、度为 99%时平均值的置信区间解:置信度为 95%,查表得 t0.05,3=3.18,那么0.0315.783.1815.780.05%4Sxtn=置信度为 99%,查表得 t0.05,3=5.84,那么0.0315.785.8415.780.09%4Sxtn=对上例结果的理解:1.正确的理解1.正确的理解:在 15.780.05%的区间内,包括总体平均值的的概率为 95%。2.错误的理解2.错误的理解:a.未来测定的实验平均值有 95%落入 15.780.05%区间内 b.真值落在 15.780.05%区间内的概率为 95%从该例可以看出,置信度越高,置信区间越大。例 1 下列有关置信区间的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分析化学 中的 数据处理
限制150内