信息处理与数据挖掘技术.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《信息处理与数据挖掘技术.ppt》由会员分享,可在线阅读,更多相关《信息处理与数据挖掘技术.ppt(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 计算机与仪器分析 一、化学计量学介绍a brief introduction of chemometrics二、信息评价information appraise三、信号与噪声signal and noise四、信号的处理技术technology of signal process 五、多元分析方法polybasis analysis methods第三节 信息处理与数据挖掘技术computer and instrument analysis information process and technology of date excavate5/15/2023一、化学计量学简介a br
2、ief introduction of chemometrics化学计量学:化学与计算机结合的产物1974年,Kowalski 与Wold 提出建立国际化学计量学协会任务:运用数学和统计的方法设计或选择最佳测试过程和实验 通过化学数据分析提供更多化学信息。范畴:纯化学与量子化学之间凡涉及计算和计算机的所有领域。应用举例:大连湾海水污染物与污染源之间的关系;控制 由尿样获取身体健康状况的全部信息;简化 化合物性质数据结构,结构与性质的关系;新药 产品质量检验生产中的问题;决策 犯罪现场的烟雾分析:香烟牌号,种类;破案5/15/2023 二、信息评价 information appraise 分析
3、仪器是分析化学家为获取化学信息所使用的工具,因此可以由信息理论来评价仪器的性能。1.信息量和熵 设有一事件有几种可能性,他们各自的概率为pi,Shannon定义信息熵:在信息理论中,习惯取“2”作为对数的底,此时单位为bit(e为底,nat)。设有一具有两种可能性的等概率事件:5/15/2023信息量和熵 熵是事件不确定程度的度量,不确定程度越大,熵就越大。对于一个概率密度为p(x)的连续型分布熵的定义为:信息的概念是与事件发生的概率相联系的,出现小概率事件所包含的信息量大,因此可定义信息量:I=-lgpi 如果事件发生后的概率不等于1,即它是不确定的,则信息量可表示为:I=lg(qi/pi)
4、式中 qi 是事件发生后的概率。5/15/20232.信息量与熵的关系 如果通过某些方法获取信息使原来事件的不确定程度减小,所得到的信息的数量就是信息量,故信息量就是熵减少的量:I=H0-H式中 H0 和H 分别表示获取“情报”前后,事件不确定程度。在分析化学中则是实验前后的熵。若经过实验后的结果完全确定,即实验后的熵=0,则:I=H0=Hmax即经过这样一个实验后,可能得到的最大信息量。5/15/20233.分析化学实验中的信息量与熵 在定性分析实验中,判断某一组分是否存在。实验前:概率:各为1/2(实验前并无任何信息)H0=1 bit实验后:H=0故信息量:I=H0-H=1 bit如果采用
5、仪器分析定性,不能将全部组分检测出,如何确定?例:原子吸收测定含铜、锌试样(组成未知)。仅测定出Cu2+时的信息量,测定出Cu2+、Zn2+时的信息量分别是多少?(阴离子不能检测)。5/15/20234.定量分析中有关参数与信息量 在定量分析实验中,如果实验前知道某一组分的大致范围时,即p(x)均匀地分布在(x1,x2)区间内,则:由于分析中偶然误差的存在,结果不可能是一定值而成正态分布。设其标准偏差为,则:5/15/2023于是:越小,信息量越大。实验中增大信息量的途径?减少干扰、提高仪器灵敏度、减小噪声、增加测定次数等。5/15/20235.仪器的最大信息量 分析仪器通常有一测定限cmin
6、,待测试样浓度低于此值时,不能用该仪器测定。该仪器实验前的熵为:c 为仪器能分辨的最小浓度差,实际的信息量:5/15/2023 对于多通道的仪器,可以有n个通道同时测定n种组分,其总的信息量是各通道的信息量之和:单位时间内信息量的变化称为信息流:理想的分析仪器应该在很短的时间内获得很大的信息量。5/15/20236.仪器的效率和剩余度 仪器的效率可用剩余度来衡量。剩余度的定义:R=Hman H 剩余度是熵偏离其最大值的度量。熵的一个重要性质是当所有的可能性都是等概率时,熵有最大值。在定量分析中,如果试样中待测组分的含量完全是未知的,则其可能的含量为0100%,故:5/15/2023仪器的效率和
7、剩余度 在分析仪器中,剩余度常被定义为:R=Iman I 即它是分析过程中被保留,未被利用的信息量的度量。剩余度大表示该仪器的效率低。分析时,一般样品的大致含量范围总是知道的,设其范围为x1x2。故:则:5/15/2023三、信号与噪声signal and noise本底信号:没有试样时,仪器产生的信号;随机噪声;空白信号:试样中无待测组分时,仪器产生的信号;试样预处理:空白信号接近本底信号;5/15/20231.检出限 样品的信号能被检出的最低限;由于存在随机噪声(正态分布),有误判的可能;如何规定检出限使误判产生的几率符合要求(统计学),1969年,国际原子吸收光谱会议;yB+3B 197
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 信息处理 数据 挖掘 技术
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内