化学传感器阵列的计算机数据分析方法和发展趋势.pdf
《化学传感器阵列的计算机数据分析方法和发展趋势.pdf》由会员分享,可在线阅读,更多相关《化学传感器阵列的计算机数据分析方法和发展趋势.pdf(5页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、化学传感器阵列的计算机数据分析方法和发展趋势陈四海,周敬良!(湖南大学化学化工学院,化学!生物传感与计量学国家重点实验室,湖南长沙#$%&)摘要:化学传感器阵列是由一系列具有非特异性、低选择性、交叉敏感性和稳定性的化学传感器组成的分析仪器。作为利用化学传感器阵列进行准确可靠的定性和定量分析所不可或缺的条件,合适的模式识别和多元校正等数据处理方法已经成为化学传感器阵列的有机组成部分。该文着重介绍了常用的化学传感器阵列数据的计算机处理方法,并且展望了该领域的发展趋势。关键词:化学传感器阵列;计算机数据分析;模式识别;多元校正;趋势()*+,-./0,0 01023454 6(.78-)5702 4
2、-14(.0.03/-957-4:)-,8(/401/0/9017-4!#$%&(&)*+,-&$./&($.!0%1(1#2#3 4(5+6(1+63+7!#8+9:&+;#$;&$.($!#8&=(/?$.&$#6&$.),$($A$&B#6;&13)!($.;(CDEEFG)!&$(H;4,.07,:I=#8&=(/;#$;+6(66(3&;($($(/31&=(/&$;16,8#$1=+$;&;1&$.+7($(66(3+7=#8&=(/;#$;+6;J&1$+$K;L#=&7&=&13)/+J;#/#=1&B&13)=6+;K;#/#=1&B&13($;1(5&/&13M I;($&
3、$1#.6(/L(61+7(=#8&=(/;#$;+6(66(3);#/#=1&$.1#(LL6+L6&(1#L(11#6$6#=+.$&1&+$+6 9($8,/1&B(6&(1#=(/&56(1&+$8#1+;7+6(1($(/3;&;&;&$&;L#$;(5/#1+L#67+68N,(/&1(1&B#($N,($1&1(1&B#($(/3;&;L6#=&;#/3($6#/&(5/3 53(=#8&=(/;#$;+6(66(3M O#L6#;#$1(61&=/#7+=,;#;+$1#J/3,;#8#1+;7+6=+8L,1#6(1($(/3;&;+7=#8&=(/;#$;+6(66(3
4、;M P&$(/3=6&1&=(/16#$;&$1&;7/(6#L6#;#$1#(./4:=#8&=(/;#$;+6(66(3Q=+8L,1#6(1($(/3;&;Q L(11#6$6#=+.$&1&+$Q 8,/1&B(6&(1#=(/&56(1&+$Q 16#$;$引言回顾化学传感器的发展历史,如何提高单一化学传感器的选择性一直是研究的主流趋势之一。随着技术的进步和对于简易、价格低廉、广泛适用的分析方法的迫切需求,化学传感器阵列这一新的分析方法应运而生,并且在实际应用中获得了巨大的成功。化学传感器阵列,包括俗称电子鼻和电子舌的嗅觉和味觉传感器阵列,根据国际纯粹和应用化学会(RASI!)
5、有关文献的定义TD U GV,是组合一系列具有非特异性、低选择性、交互灵敏性(=6+;K;#/#=1&B&13)和稳定性的化学传感器的分析装置。尤其值得注意的是,该定义同时指出,化学传感器阵列应包括适当的模式识别和多元校正等多维数据处理方法。由此可见,运用合理的多元数据分析技术处理化学传感器阵列所得的测量数据,已经被作为化学传感器阵列这一分析测试技术的有机组成部分。虽然化学传感器阵列中单个传感器的选择性较低,但是在很多情况下,多个具有交互灵敏性的稳定的传感器获得的多维测量数据却能够提供足够和可靠的关于复杂混合体系的定性和定量信息,这正是利用计算机进行化学传感器阵列数据分析的基础。而由于单个传感
6、器选择性低,只有对高维检测信号进行处理和信息提取,才能获得相关的化学信息,处理高维数据的模式识别和多元校正等多元分析方法获得了最广泛的应用。所以,如何有效地从化学传感器阵列的多维测量数据中提取和有效利用相关的化学信息来进行准确可靠的定性和定量分析,实现复杂W+/M GF)X+M CY#=M G E E F化 学 传 感 器!?ZR!I4%?X%第 GF 卷第 C 期G E E F 年 DG 月混合体系样品的成分分析、质量控制、聚类和分类等分析目标,是化学传感器阵列研究的关键问题之一!#$%。该文重点介绍了常用的化学传感器阵列数据的计算机处理方法,并且指出了该研究领域近期的发展趋势。!模式识别方
7、法(#$%&%()*+$+),%$-)./)模式识别方法的两个重要方面是聚类和分类,前者为无监督学习方法,后者为有监督学习方法。通过对传感器阵列的高维测量数据进行分析,聚类分析通过某种相似性标准,对测量样品实现“自然分组”,可帮助人们初步了解测量样品的来源和差异等信息;分类算法则首先根据一批已知类别的样品进行学习,建立描述测量数据和类别之间关系的数学模型,进而运用此分类模型对未知类别的测量样品进行分类。!0!聚类方法((12/$%&+*,%$-)./)该文主要介绍&均值法,系统聚类法和利用主成分降维图示数据的目视法。聚类分析的原理和应用比较的文献可参阅!(#)%。&均值法对于一批待分析的样品,
8、首先确定类的数目(&)和&个初始聚类中心,按照距离聚类中心距离最小的原则把各样品分配到&类中的某一类,然后动态地改变类心和调整样品类别,最后使得各样品到其所属类别的中心的距离平方和为最小。&均值法方法简单可行,获得了较多的应用,其缺点为聚类结果受到样本输入顺序的影响,并且需要事先确定类数,具有一定的主观性。系统聚类法首先将*个输入样品各自作为一类,选择距离最小的两个样品合并为一个新类,然后计算各类之间的距离,将距离最近的两类合并,直到所有的样品被聚为两类为止。系统聚类法可将聚类过程表示成一个直观的树状图,不必事先划定类的数目。系统聚类法的另一个特点是某个样本一旦被归入某一类,就不会再分开。主成
9、分分析法把原始样品空间投影在互相正交的依次具有最大方差的少数几个主成分空间,如可取每个样品的前面+#个主成分的得分值描绘于坐标系中,在很多情况下可大致显示样品的分布信息。严格来说,+#个主成分未必能够准确充分地描述样品特性,并且与其它聚类方法相比,主成分分析的类别区分能力并不突出。但是主成分分析和降维显示样品的方法简单易行,可帮助人们对测量数据进行大致的了解,如聚类和发现奇异样品点等,所以仍然获得了广泛应用。值得一提的是,主成分回归(,&-),即选取合适的主成分代替原始测量变量和响应变量建立回归关系,也是一种常用多元校正方法。!0 3分类方法 4(1#/+5+(#$+),%$-)./)该节主要
10、介绍线性判别方法及其推广,.近邻法和簇类独立软模式法,其它可同时用于多元校正和分类的方法如,/0 和人工神经网络等则在下一节介绍。关于常用分类算法的比较可参阅文献!1#22%。23+3 2线性判别分析(/45678 94:;8457?A:4:B/9)及其推广C4:D68 的线性判别分析是一种成熟的统计分类和判别分析方法,在数据样品量大大高于变量数并且数据呈正态和均匀分布的情况下,能够对线性可分的样品进行准确的分类。线性判别分析法的核心在于找到一系列正交的一维投影子空间,使得原始数据在此子空间上的投影获得最佳分离,要求最大化的目标函数为类间离差平方和和类内离差平方和的比值。线性识别分析的解可归结
11、为求特征值问题。由线性判别分析得到的判别函数是线性的,当样品不满足线性可分的条件时,一种常用的方法为二次判别分析(E9),即在线性判别函数中加入二次项。另一种简单的解决非线性可分的策略是采用分段线性判别函数,用一系列的分段线性判别函数来逼近各种形状的超曲面,因此具有比较强的适应性和分类能力。23+3+.近邻法(.56786:=564FDGHI8:,J*K.近邻法基于一种非常直观的统计决策思想,即按照最近距离的原则对未知样品进行分类。首先计算未知样品与已知类别的训练样品的距离,然后考察未知样品的.个最近邻样品,这.个最近邻中属于哪一类的样品最多,就将未知样品分到哪一类。最简单的情况即当.L2 时
12、,把未知样品归于包含与之距离最近的样品的类中。.近邻法思想直观、易于实现,适用于样品先验信息较少的情况,能适应类空间分布较复杂的情况。$期陈四海等:化学传感器阵列的计算机数据分析方法和发展趋势+!#$簇类独立软模式法(%&()*+,-,*+,*(.&+,/)*0&1/2%2*2/&0),%,34567)簇类独立软模式法(34567)是非常流行的一种描述数据类结构的分类方法。该方法对每一个类的样品进行主成分分析(867),用足够的主成分数描述(重建)原始数据。每一个样品类的主成分数目可以不相同,通常可用交互验证法确定。主成分模型未能解释的数据变化称为方差残差。直观地看,一个新的未知样品如果能够被
13、某一类的主成分模型很好的描述(具有小的方差残差),则该样品很可能就属于该类。具体的判定方法是对于每一个未知类别的新样品,用不同类别的主成分模型来描述该样品,如果该样品在某一主成分模型下的残差方差与该类样品的平均残差方差相比(通过构造 9:统计量),属于可接受的范围,则该样品可归为此类别。改进的 34567方法不仅考虑了类模型对新样品的解释能力,同时考虑该样品在该类中的分布,如果新样品能够被一类模型很好地解释,但是却明显远离该类别中的训练样品,则新样品将被视为奇异样品。奇异样品的确定可通过用统计方法给出每一主成分方向上的可接受区间来实现。34567 的优点在于,!)样品只能以很高的概率被划分属于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 化学 传感器 阵列 计算机 数据 分析 方法 发展趋势
限制150内