NMR指纹图谱与模式识别方法在食物分析中的应用[1].pdf
《NMR指纹图谱与模式识别方法在食物分析中的应用[1].pdf》由会员分享,可在线阅读,更多相关《NMR指纹图谱与模式识别方法在食物分析中的应用[1].pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、波谱学杂志第23卷第3期2006年9月 Chinese Journal of Magnetic ResonanceVol.23 No.3Sep.2006文章编号:100024556(2006)0320397211NMR指纹图谱与模式识别方法在食物分析中的应用陈 波13,康海宁1,韩 超1,王小如1,2(1.厦门大学 化学化工学院,现代分析科学教育部重点实验室,福建 厦门361005;2.国家海洋局第一海洋研究所 青岛市现代分析技术及中药标准化重点实验室,山东 青岛266061)摘 要:NMR指纹图谱与模式识别方法相结合在食物的研究中得到广泛应用,已经成功应用于食品的产地的区分,质量判定和转基因
2、食品的安全考察等领域中.本文综述了近些年NMR指纹图谱与模式识别方法在这些领域的应用.关键词:核磁共振;NMR指纹图谱;模式识别;食物;代谢组学中图分类号:文献标识码:A核磁共振(Nuclear Magnetic Resonance,NMR)是一种基于具有自旋性质的原子核在核外磁场作用下,吸收射频辐射而产生能级跃迁的谱学技术1.现今,NMR已经成为鉴定有机化合物结构的极为重要的方法,在有机化学、生物化学、药物化学等领域中得到广泛应用.复杂生物体系的NMR图谱能提供体系中许多指纹成分的定量信息,但是指纹信号的重叠也使得图谱变得十分复杂.通常,仅靠肉眼观察只能从NMR图谱中获取很有限的信息,而模式
3、识别方法能够从复杂的数据中最大限度的提取信息.事实上,NMR指纹图谱与模式识别方法相结合已经广泛应用于许多领域,如疾病诊断、药物安全评估、毒理学研究、微生物代谢组学和植物的代谢组学等,在这些领域的应用已经有许多相关的综述2-8.食物也是一个复杂的体系,随着人们对食物质量及安全的日益关注,对其成分的分析也更加重要.本文将对NMR指纹图谱技术与模式识别方法在食物分析中的应用做一个综述.收稿日期:2005210227;收修改稿日期:2005212219作者简介:陈波(19812),男,福建霞浦人,硕士研究生,主要从事中药及茶叶的NMR指纹图谱研究.3通讯联系人:电话:862532288963253,
4、E2mail:mt2elp .1 基于NMR的代谢组学目前,NMR指纹图谱与模式识别方法最主要的应用是代谢组学领域.从某种意义上说,食物中复杂化合物体系的分析也属于代谢组学的范畴.NMR代谢组学的概念是Nicholson J K教授及其实验组在长期利用NMR分析生物体液、细胞和组织中多组分代谢组成的工作的基础上,于1999年正式提出的9.它是通过考察生物体系受刺激或扰动后(如某个特定的基因变异或环境变化后)其代谢产物的变化,来研究生物体系的代谢途径的一种技术,它所关注的是相对分子质量为1 000以下的小分子10.代谢组学研究的主要样品是生物流体,其中尿液和血液是最容易获得的,因此,使用也最广泛
5、;其它生物流体,如脑脊髓液、胆汁、精液、肾透析液、肺穿刺液甚至细胞培养上清液、器官组织提取液等也可以使用.另外,现在还可以不经任何处理,对完好组织进行代谢成分研究7.NMR是现阶段代谢组学研究所用最为广泛的技术,其中绝大多数研究使用的是1HNMR.MS以及它与HPLC、GC之间的联用技术也已经逐渐应用于动植物的小分子代谢成分的研究.另外,FT2IR光谱、薄层色谱、代谢分析阵列(metabolite arrays)甚至自动生化分析也可以应用于代谢成分分析.表1对几种常用的代谢组学技术的优缺点进行了比较6,11.表1 不同代谢组学技术的比较Table 1Comparison for differe
6、nt techniques using for metabonomicsNMR spectroscopyGC2MSLC2MSFT2IRspectroscopyProsCheap after initial magnetpurchase;Robust and re2producible on a per samplebasis;Minimalsamplepreparation;High2throughput.Good sensitivity;Cheap topurchase;Good chromatog2raphy by comparison withLC2MS;Goodidentificati
7、onsoft2ware.Excellentsensitivity;Noneedtoderivatisesamplesprior to analysis;More tru2ly global than NMR andGC2MS;Can be used to analyse spe2cific metabolitesas well asproduce global profiles.Cheap and easyto use.ConsOnlydetectsthehighestconcentrationofmetabo2lites;Significant metaboliteoverlap in si
8、mple1H NMRspectra;Large initial pur2chase of spectrometer andsuperconducting magnet.Need to derivatise the me2tabolitesto ensure they arevolatile.Ion suppression can preventquantitationor even detec2tion of certain metabolites;LC reproducibility is lowerthan GC.Very poor dis2tinctionbetweenclasses o
9、fme2tabolites.与其它指纹图谱技术相比,NMR测定灵敏度较低、分辨率不够高.另外,NMR的动态范围有限,很难同时测定生物体系中共存的浓度相差较大的代谢产物,所需硬件的投资也较大.但是,NMR却具有不可比拟的优点,例如无需样品预处理和预筛选,可以893波 谱 学 杂 志 第23卷 避免由于分离所造成微小成分的丢失;无损伤性,不会破坏样品的结构和性质,可以进行实时和动态的检测;没有偏向性,对所有化合物的灵敏度是一样的,而MS则有离子化程度和基质干扰等问题;1H NMR的谱峰与样品中各化合物的氢原子是一一对应的,所测样品中的每一个氢原子在图谱中都有其相关的谱峰,图谱中信号的相对强弱反映样
10、品中各组分的相对含量;另外,迄今为止,只有NMR能够对完好组织进行代谢成分分析12,13.由于1H NMR的化学位移范围窄,包含由许多小分子成分的代谢样品引起的NMR信号大量重叠,使得1H NMR指纹谱图信号归属困难,很难通过肉眼对谱图进行分析比较.因此,通常使用模式识别方法来分析数据,最大限度提取信息.理论上,如果仅仅是为了实现对样本不同类别的区分,并没有必要对NMR信号进行归属.但是如果能找出引起区分的相关成分,将会有助于进一步的研究.NMR信号的归属一般可以通过化学位移,信号的多重态或者加入标准物质获得.化学位移通常是通过文献调研,收集相关数据.2D NMR波谱可以减少信号的重叠,为信号
11、归属提供有用的信息,通常使用的有二维相关谱(COSY)、异核多量子相干(HMQC)、扩散二维谱(DOSY),J2分辨谱等.如果使用以上方法还是不能够归属,还可以使用固相萃取色谱(SPEC)或高效液相色谱(HPLC)来简化体系7.2 模式识别方法介绍模式识别是化学计量学研究中的十分重要的内容,它从化学测量数据出发,进一步揭示物质的隐含性质,为分析化学家提供了十分有用的决策信息.模式识别方法通常可以分为监督方法和非监督方法4,14,15.2.1 非监督方法非监督方法针对那些不利用或没有样本所属类别信息的情况,它将复杂的数据(如NMR波谱)降低到一个低维空间,以分类图的形式显示出来,从而使肉眼能够进
12、行系统分析.该方法包含两个步骤(数据缩减算法的实现,以及识别出的模式或聚类的图形显示).常用的非监督方法如下:2.1.1 主成分分析(Principal Component Analysis,PCA)主成分分析是一种非常有效的数据压缩方法.它以一种最优化方法浓缩及综合测量矩阵中的信息,使数据简化,降低维数.主成分分析产生两个矩阵,得分矩阵和载荷矩阵.得分矩阵的列代表不同样品,行代表主成分(PCs).PCA以一种有序的方式提取并保留了有用的信息.连续的PC所包含的变化越来越少,这就意味着后面的主成分可以舍弃.通过得分矩阵前两个主成分作图,可以获得直观的二维聚类图,从而方便地对不同类别进行判定.载
13、荷矩阵的每一列代表一个主成分,其中每一个元素均代表那个主成分与原始变量的相关.对每一列作图,可以获得与NMR谱图类似的谱图,可在一定程度上反映引起聚类的相关化学成分.2.1.2 系统聚类分析(Hierarchical Cluster Analysis,HCA)聚类分析是无监督模式识别方法的典型代表,有很大的使用价值,特别适用于归属不清楚的情况.它的基本原理是将待聚类的样本集的n个样本各自看成一类,然后规定或定义样本之间的距离或相似性量度以及类与类之间的距离后开始进行聚类.聚类开始993 第3期 陈 波等:NMR指纹图谱与模式识别方法在食物分析中的应用时,因每个样本各自形成一类,样本之间的距离就
14、等于类之间的距离,选择距离最小的一对样本合并成一个新类;进而计算该新类与其他所有类间的距离.比较各个距离之后,将距离最小的两类又合并成另一个新类.如此下去,直到所有的样本归为一类为止.2.2 监督方法监督方法的基本思路是用一组已知类别的样本作为训练集,即用已知的样本进行训练,并由这个训练集得到判别模型,再去识别未知样本.常用的监督方法如下:2.2.1 簇类独立软模式分类法(Soft Independent Modeling of Class Analogy,SIMCA)SIMCA法是建立在主成分分析的基础上的一种模式识别方法,其基本思路是先利用主成分分析的显示结果得到一个样本分类基本印象,然后
15、分别对各个样本建立相应的类模型,继而用这些类模型来对未知样本进行判别分析.2.2.2 偏最小二乘法(Partial Least Squares,PLS)偏最小二乘法与主成分分析法有共同之处,它们都试图提取出反映数据变异的最大信息,不同点在于主成分分析法只考虑一个自变量矩阵,而偏最小二乘法还有一个“响应矩阵”,因此具有预测功能.该方法必须研究两个矩阵之间相关关系的特殊性使得在分析之前往往要做一些数据校正,以期得到更好的预测效果.2.2.3K邻域判别法(K2Nearest Neighbor Analysis,KNN)KNN可用于线性不可分的多类化合物的识别.其基本思想是先将已分好类别的训练样本点记
16、入多维空间中,然后将待分类的未知样本亦记入空间.考查未知样本点的K个近邻(K为奇数,如1,3,5等等).若近邻中某一类样本最多,则可将未知样本亦判为该类.在多维空间中,各点间的距离通常规定为欧氏距离.KNN可以接受多于两类的样本并且不依赖于样本的分布(比如它可以处理嵌入式的样本集合),这优于线性判别分析(LDA).2.2.4 神经网络(Neural Networks,NN)神经网络是近年来人工智能的一个重要学科分支,它旨在模拟人类的学习过程,现已广泛应用于科学研究以及自动控制等领域.神经网络中应用最广泛的当属BP神经网络(即逆传播).它遵循“模式顺传播,误差逆传播”的原则.在NMR谱中,通常是
17、采用如下步骤来构造BP网络:1.将每个样本的d个变量(可以是d种代谢物的水平或者指分割区域的强度积分值)作为输入神经元;2.通过优化神经元间的联络权值来训练网络,这是一个循环往复的过程,只有当输入所有训练集合的数据以后,输出层神经元的输出值尽可能与原值接近,即当均方差(mean squared error,MSE)小于某给定值时,训练才会终止,此时构建好的网络便可对未知进行预测.2.2.5 线性判别分析(Linear Discriminant Analysis,LDA)LDA也叫做线性学习机,通过计算一个线性判别函数定义一个决策面,以区分只有两个类别的情况.这个判别函数是原变量的线性组合,两个
18、变量定义的函数是一条直线,3个变量则是一个平面,多于3个变量的则是比数据集少一维的超平面.3NMR指纹图谱与模式识别方法在食物分析中的应用复杂混合体系的分析对食物化学来说至关重要16-18.进行NMR指纹图谱分析的基本流程如图1.其中,在样品制备中,如果食物样本是固态(如肉类、农作物、茶叶004波 谱 学 杂 志 第23卷 等),则需要将样本干燥后,再根据要提取成分的极性选择合适试剂将有效成分提取出,将提取液高速离心(10 000 rpm以上)以除去固体颗粒不溶物以及大分子蛋白,所得上层清液进行NMR分析.一般使用氘代试剂(如D2O,CD3OD,CCl3D等)进行样品制备;加入缓冲溶液以减小溶
19、液p H对化学位移的影响;另外,还需根据所选氘代试剂加入内标(如TMS、TSP等).也有文献18先用普通试剂提取有效成分后,将提取液冷冻干燥后所得的提取粉末用适当的氘代试剂溶解,所得的溶液用NMR分析.另外,许多食物为液态(如果汁、食用油、酒、醋等)多数文献报道是将液态食物高速离心后,加入少量氘代试剂作为内锁,再加入缓冲溶液,即可用NMR进行分析.NMR分析所得谱图经过傅立叶变换、调相、调基线.所得的NMR数据在模式识别计算前,还必须对数据进行预处理.数据预处理一般包括NMR谱图分段积分(一般为 0.04)、背景去除、溶剂峰和内标峰数据去除、数据标准化等步骤.图1NMR指纹图谱分析的基本流程F
20、ig.1The basic process of NMR fingerprinting analysis从文献调研来看,欧洲在NMR指纹图谱在食物中的应用领域做了大量工作,其中英国更是占了绝大多数,这也可以从一定程度上反应欧盟特别是英国对食品安全的重视,现举例如下:3.1 食品产地的辨别1H NMR与模式识别相结合已经应用于判别法国波尔多4个不同葡萄酒产区的成熟葡萄19.葡萄的生化成分与其种属和种植的环境(包括气候、土壤等)有关.对用于酿酒的葡萄的质量判断通常是用传统的方法分别测定其糖份、酸度、p H值和总酚含量等.这项研究是利用传统质量标准与葡萄果皮和果肉提取液的1H NMR图谱建立波尔多4
21、个不同葡萄酒产区成熟葡萄的代谢物指纹图谱.通过PCA分别分析传统质量标准与1HNMR数据,可以观察到4个产区的葡萄有明显的聚类,而传统质量标准要比1H NMR数据的的聚类效果好,但是NMR指纹图谱可以通过已识别和一些暂时无法识别的代谢成分进行代谢物指纹分析,这是传统方法做不到的.104 第3期 陈 波等:NMR指纹图谱与模式识别方法在食物分析中的应用Adrian J.Charlton将PCA与LDA方法应用于速溶咖啡的1H NMR谱图分析20.98份来自3个不同生产商的速溶咖啡的1H NMR数据用PCA与LDA分析,99%的样本的聚类与其生产商相吻合.选取36份速溶咖啡盲样用所建立的PCA模型
22、判定生产商,准确率可以达到100%.另外,选其中一个产商的咖啡进行模式识别分析,发现可以分成两组,52羟甲基222糠醛是引起区分的主要化合物.1H NMR谱图数据的PCA与LDA分析也应用于英国3个苹果产地的苹果的区分21,本工作将协方差主成分分析与相关主成分分析应用于26份不同产地苹果汁的NMR数据,两种方法都可以取得满意的区分效果.通过主成分的载荷(loading)可以发现,苹果酸和蔗糖是引起区分的主要成分.另外,也发现一些微小的成分对区分起重要作用.3.2 食品质量相关分析这是NMR指纹图谱在食品方面应用的最重要的一个领域,它包括成分分析、真伪的判定、质量好坏判定、不同品牌的食物比较、同
23、一食物不同时期的成分比较等.NMR与模式识别在食品以及相关行业应用的一部分是采用2H NMR波谱(Site2Specific Natural Isotopic Fractionation Studied by Nuclear Magnetic Resonance(SNIF2NMR),虽然这种技术并不属于本文讨论的NMR指纹图谱的范围,但是,鉴于其在食品质量检测的广泛应用,本文还是包括了对这种技术的介绍.SNIF2NMR是现今唯一的一种能够同时直接测定一个已知分子中不同位置的氢同位素比(D/H)的技术22.通过SNIF2NMR测定食品中某些指标成分分子的不同位置的氢同位素比可以有效的判别食品是人
24、工合成或天然的.在这方面的应用已有许多例子23-25.另外,碳同位素比(13C/12C)也可以用作质量判定26.G.Vigli利用1H NMR和31P NMR图谱与模式识别分析天然橄榄油中种子油的掺杂27.192份植物油(包括13种植物油:榛实、向日葵、玉米、大豆、芝麻、胡桃、油菜籽、杏仁、棕榈、花生、红花、椰子和希腊不同地区的天然橄榄油)经1H NMR和31PNMR分析后的谱图用判别分析(Discriminant Analysis)建立模型.用于判别分析的数据是计算所得的1,22甘二油脂、1,32甘二油脂、1,22甘二油脂与所有甘二油脂含量比值、酸度、碘含量、脂肪酸等物质的含量.其中128份
25、样品用于建立食用油种类判别模型,另外64份样本用所建模型可以100%判别.另外,分别人工混合橄榄油与榛实油、玉米油、葵花子油和大豆油,获取其1H NMR和31P NMR图谱,再利用判别分析建立模型,可以判别出掺杂低至5%W/W的样本,此种技术可用于判定是否在橄榄油中添加其它植物油或劣质油.Gall G.Le利用NMR指纹图谱区分了天然桔子汁和人工加工的桔子汁28.超过300份天然和人工加工的桔子汁的1H NMR谱图用PCA及LDA分析,通过6个主成分建立了准确率达到94%的模型.主成分分析载荷(loading)显示二甲基脯氨酸对两种桔子汁的区分起重要作用,人工加工桔子汁的含量较高.ANOVA显
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NMR 指纹 图谱 模式识别 方法 食物 分析 中的 应用
限制150内