代谢组学分析技术平台和数据处理的新进展.pdf
《代谢组学分析技术平台和数据处理的新进展.pdf》由会员分享,可在线阅读,更多相关《代谢组学分析技术平台和数据处理的新进展.pdf(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 3 3 2-综述与讲座中国临床药理学与治疗学中国药理学会主办(烈3 4-1 2 0 6,R I S S N1 0 0 9 2 5 0 1B 训:c c 鼬 2 l c l l 2 0 0 7D e c;1 2(1 2):1 3 3 2 1 3 3 8代谢组学分析技术平台和数据处理的新进展任洪灿1,王广基1,阿基业1 2,郝海平1,孙建国1,查伟斌1,严蓓11 中国药科大学药物代谢动力学重点实验室,南京2 1 0 0 0 8,江苏;2 瑞典U n 瑚大学临床化学系医学生物学专业,S E9 0 1 8 5,U m e a,瑞典摘要分析技术和生物计量学促进了代谢组学的飞速发展。代谢组学快速、灵敏
2、、可定量、非侵入性以及系统性的特点。使其在新药研发、药物毒性筛选、疾病诊断等领域显示出广阔的前景。本文综述了代谢组学研究中的某些关键问题:样品处理方法,分析技术和数据处理的方法和原则,代谢组动态变化、生物标记物的鉴定和代谢途径的检索近年来的进展。评价了各种分析手段的优缺点。并展望代谢组学发展前景。关键词代谢组学;核磁共振;G C M S;L C M S;生物标记物;多变量数据分析;模式识别;代谢途径中图分类号;R 9 6 9 1文献标识码:A文章编号:1 0 0 9 2 5 0 1(2 0 0 7)1 2 1 3 3 8 0 7代谢组学(m e t a b o n o m i c s、m e
3、t a b o l o m i c s)具有灵敏度高、可定量、系统性、代表着机体确切发生的变化等特点,为了解基因功能,蛋白质表达,个体、组群和种属之间差异,人或动植物对药物、毒物、病原、环境所产生的反应,也为沟通基因、蛋白质和小分子之间的联系提供重要线索n 。代谢组学亦可应用于药物临床前毒性评价、药物作用模型的鉴别和确证、药物作用机制的研究、药物的临床前安全性评价和疾病的诊断 2 。代谢组学研究方法多样,进展快,但也存在一些亟待解决的问题。本文就代谢组学的基本研2 0 0 r 7-0 7-0 2 收稿2 0 0 7 1 1-0 5 修回国家自然科学基金项目(3 0 6 3 0 0 7 6;3
4、0 5 7 2 2 2 8);江苏省自然科学基金项目(B K 2 0 0 5 嗍)任洪灿,男,博士。研究方向:药物代谢动力学。T e l:0 2 5 8 5 3 9 1 0 8 9B m a i l:袖o n g e a n 聊i l 鲫n王广基,通讯作者,男,教授,博士生导师,研究方向:药物代谢动力学关键技术与平台研究。中药方剂复杂体系药物代谢动力学研究。T H:0 2 5 8 5 3 9 1 0 3 5B m l l J l IG u a 蛔i w a n g v a h o o e o m m究过程:样品处理、分析方法、数据处理、生物标记物筛查及在代谢途径中的定位进行综述。1 代谢组学的
5、特点及其对分析方法的要求中文代谢组学兼有m e t a b o n o m i c s 和m e t a b o l o m i c s的含义,两者的研究方法高度相似,文中不再作区分。代谢组学利用先进的定性定量手段来研究生物系统(细胞、微生物、动物、植物)中小分子代谢物因内在遗传因素和生理因素以及外界环境、物质、病原等刺激下发生的在数量和浓度水平上的动态变化 3 4 。其中小分子代谢物种类繁多,统称代谢组(m e t a h o l o m e),是代谢组学的研究对象。植物界包含了近2 0 万种小分子代谢物,哺乳动物类预计包含更多 5 。代谢组学也可以关注于机体某几个代谢物或者一类代谢物(如氨
6、基酸、脂肪酸)在外界环境的影响下发生变化的规律。F i e h n【6 1 在这些研究的基础上,将代谢组学总结为4 个层次:代谢物靶标分析、代谢轮廓分析、代谢组学和代谢指纹分析,具体内容国内已有综述论及控】。层次的区分有助于研究方法的选择:对整体代谢组的扫描往往采用核磁共振(N M R)或者基于质谱(M S)的分析方法,兼具分析广谱性、高灵敏度、高分离度以及高重现性。但对于靶标分析,对分析要求相对低,有多种方法可以采用。具体根据待分析物质的官能团、分子量、数量、挥发性、带电性、电迁移率、极性等物理化学参数等客观条件来选择最佳的分析方法。2 代谢组学的分析技术代谢组学受多种因素如性别、年龄、种系
7、、饮食、日照循环等的影响7|,且不同的实验室采用了不同的试验设计、样品处理方法、非统一的数据处理方法。各实验室之间的数据难以直接比较,因此客观上要求建立标准的代谢组学研究技术平台。为适应 万方数据这一需要,S M R S(s t a n d a r dm e t a b o l i cr e p o r t i n gs t r u c t u r e s)g r o u p s【l 应蕴而生。该组织吸收各高校、科研机构等代谢组学研究人员,统一代谢组学研究的规范,其内容涉及:试验设计、样品的采集和预处理、样品的测定、数据采集、数据分析及解释、数据库的建立和模型的构建u 2 J。2 1:样品制备
8、样品制备对结果的影响较大,样品制备的一般原则包括样品来源的管理、样品的储存提取,目的是保证代谢组信息不因为样品处理而发生改变。样品的来源指受试对象的采样环境,如饮食、光照等;样品储存指样品获取后迅速灭活代谢酶,防止小分子化合物在酶的作用发生改变,最佳保存方式是液氮或一8 0 的低温冰箱。?提取是样品制备最重要的环节。不同的代谢组j 1 学研究层次,样品提取,预处理技术差别较大。N M Rl 样品处理最为简单,尿液通常加入少量的0 2m o l Li 磷酸盐D 2 0 缓冲液,可直接进样,血清在加入D z O前需要用生理盐水等稀释;而基于质谱研究技术的代谢组学对样品处理的要求比较高,通常需要事先
9、采用某种方法对样品中的代谢组进行提取或者去除组织碎片和蛋白质等大分子类物质,最终尽可能完全地回收小分子化合物进行分析。但不管采用何种方法,为了便于定量分析,在样品中还常常加入内标化合物。考虑到内源性化合物的复杂性和多样性,在选择内标时为了尽量不受干扰可以采用稳定同位素化合物,但缺点是其价格比较昂贵。无论哪种分析方法,目前都没有统一的标准,比如代谢足迹谱(m e t a b o l i t ef o o t p r o f i l i n g)测定培养液中分泌代谢物,基质稳定可控,无需复杂预处理 1 引,离心后可直接进样,应用气质联用(G C M S)分析血样则要经过圬化、衍生化和进样分析的过程
10、m 。N M R 提取血样可以稀释,也可以液液萃取、蛋白沉淀。液质联用(L C,M S)分析不同样品,样品制备的方法也有些差异,如为血液需要经过适当的提取,如液液萃取、固相萃取、蛋白沉淀等4;而尿液可能只需简单离心即可进样分析,考虑到尿液中尿素过多,通常还可以使用尿素酶分解大部分尿素后离心进样n 5 l。而一些生物样品(如植物果实和血浆)中含有过多的葡萄糖常常干扰了相关物质的测定,利用何种方法去除而不使其它化合物有明显损失仍然是一个需要重视的问题。2 2 基于质谱技术的分析方法基于质谱技术的联用分析方法主要有质谱直接分析(M S)、L C M S、G C M S、毛细管电泳质谱联用(C E M
11、 S)。迄今为止,1 3 3 3 该类方法多用于植物和微生物体系,用于动物的研究还处于起步阶段。但M S 的高灵敏度和特异性(M S M S 联用还有结构鉴定能力),配合色谱技术(G C、H P L C、U P L C 和C E)卓越的分离性能,在代谢组学研究应用中显示出极大的潜力。因此,越来越多的学者将色谱质谱联用技术用于代谢组学的研究 1 8 。由于保留时间漂移,H P L C M S 重现性较差,而不经色谱分离直接M S 进样分析则无此缺点 1 9】。离子源多采用电喷雾离子化(E S I),待分析样品经蛋白沉淀后高度稀释,直接提高了分析速度、样品的重现性和聚类分析的精确度。C a s t
12、 r i l l o 汹3 等建立E S I(+)、三重四极杆(t r i p l eq u a d r u p o l ei n s t r u m e n t s)直接进样测定酵母内代谢组的方法学。采用高分辨率质谱可获得更精准的信息,A l l e n 2 1 1 等采用飞行时间质谱,I o F(M s),在E s I(+)模式下,对酵母细胞培养液中的代谢物做足迹谱分析。S c h o l z 陋3 等应用四极杆飞行时间质谱 Q r I D F(M s)对植物或者细胞萃取液代谢物快速筛选。H i r a i 1 等采用F F-I C R(M S)对拟芥南萃取物的代谢组学分析,并整合转录组学
13、研究植物对不同营养条件的反应。B o e m s e n【l 钊等应用新的基于芯片的纳米喷雾离子源(c h i p b a s e dn a n o-e l e c t r o s p r a y)直接进样,应用于人血浆样品的检测,不同性别的血浆样品可以获得精确的区分,重现性好。然而,直接进样也存在一些缺点:离子抑制、无法分离同分异构体等 1 8 J。H P L C M S 的优点是灵敏度高,且无需高温,样品一般也无需衍生化,样品的制备相对比G C M S 简单。自P l u m b 阱1 等建立H P L C t M S 代谢组学研究方法以来,H P L C M S 技术发展很快,已有多篇综
14、述论及滔搿。H P L C M S 主要进展表现在分离效率的提高,质谱数据采集速度的加快,质谱分辨率的提高。良好的分离手段可以提高检测的灵敏度,降低基线噪音。目前主要采用粒径为3 5m m 的c 幅填料的反相色谱柱。U P L C 采用超高压色谱仪,填料粒径更小的耐高压柱,因此具有更好的分离度,在代谢组学的研究中具有广泛的应用前景旧。联用的质谱仪多种多样:离子阱质谱(i o nt r a pi n s t r u m e n t s)、T r i p l eq u a d r u p o l ei n s t r u m e n t s、T O F、Q T O F 滔q 1|。近年来,不断有应
15、用于动物和人代谢组研究的报道:地乐酚、环孢素A、D 丝氨酸恤叫 等药物的毒性研究,肠瘘和肝炎等研究 3 1 3 5 J。啊M S 的缺点在于样品重现性较差以及化合物的鉴定有一定难度,有关H P L C物质鉴定的数据库还不健全,二级质谱能部分提供 万方数据1 3 3 4 结构信息,但只是部分地解决了这个问题。G C M S 分离时对毛细管柱梯度加热,根据挥发性高低、在毛细管中保留时间不同达到分离的目的。G C M S 特长是分析挥发性物质,而对于难挥发物质较难分析。含有C O O H、O H、一N H 和一S H 等功能集团的难挥发物质还可以通过衍生化(烷基化、酰化、硅烷化)后降低其气化温度实现
16、分离恤J。质谱的检测方法主要有电子离子质谱 E I(M S)和T O F(M S)。后者获取数据的速度快,对质荷比的分辨率高。G C柱长更短、内径更小的毛细管柱可以大大减少样品分析时间(从4 0m i n 减少至1 0m i n)H O J。采用二级色谱法(G c G c)还可以实现更高的分离效率旧J。阿基业【1 0 1 等应用G C T O F(M S)测定了3 0 个正常人的血浆代谢组,该分析方法联合多变量分析工具P C A和P L S 可以解析5 0 1 个峰,从方法学证实了G C M S可用于人血浆研究代谢组学。O H a g a n 鹞1 等建立二级色谱质谱联用 G C G C T
17、O F(M S)测定人血清代谢组学的方法。该方法可以检测出4 0 0 0 多个峰,信噪比高于5 的峰可以检测出1 8 0 0 多个,约为一级G C的3 倍。G C M S 被用于研究先天性代谢疾病的筛选和莱萘二氏综合征【剪柏。C E M S 也是一种具有发展潜力的研究方法。茗细管电泳根据待测物质的电荷和颗粒大小对代谢物进行分离,然后应用质谱选择性的检测代谢物,因此分离度和灵敏度均较好。C E M S 可以同时测定1 0 0 0种以上的带电荷物质,并可以应用在各种来源的生物样品 4 1,4 2 。2 3 基于N M R 的研究方法在英国帝国大学N i c h o l s o n 教授大力倡导下,
18、N M R 分析方法的应用最为广泛,并形成了代谢组学研究流派之一。N M R 可以分析多种核素如1 H、1 3 C、3 1 P、1 5 N、1 9 F 和2 H,其中1H应用最为广泛,其他核素分析主要起补充作用。N M R 的优势在于能够对样品实现非破坏性分析:分析谱广,1H N M R 对含氢化合物均有响应,能完成代谢产物中大多数化合物的检测;定量容易;分析条件简便且重现性好 4 3 。用N M R 方法,D u m a s 等 甜1 对2 5 9 例日本A i t o 人、3 1 5 例美国芝加哥人、2 7 8 例中国广西人尿样进行大规模的代谢组学表型分析,以考察采样的标准方法及其分析技术
19、的可重复性,结果显示分析方法稳定可靠,标准质控样品在7 个月内相对稳定。对以上人群尿液的N M R 光谱结果用聚类分析盲法鉴别,日本人鉴别成功率9 8,美国人9 6,中国北京人9 6,广西人7 1。分馏亲水性和亲脂性物质,可以一定程度上提高分离度。T O C s Y(t o t a lc o r r e l a t i o ns p e c t r o s c o p y)e 4 3 对一类特定靶标物质测定,从而提高分离度和灵敏度,低浓度的代谢物可以被分离开避免高浓度代谢物覆盖光谱信息导致数据损失。魔角旋转(艘l g i ca n g l es p i n n i n g,M A S)技术1
20、可用于完整组织样品(肝、肾皮质、肾髓质和脑组织)的检测。N M R 是代谢组学应用最广,相关文献最多的技术,与其他学科之间产生了广泛的交叉【l 2 1 6 1 7 4 3 盯鹌,如:功能基因组学、微生物学、营养学、生理学、病理学、流行病学等学科。其研究已渗透到众多应用领域 1 6 1 7 4 3 4 7 锄,如:新药开发、药物毒性筛选、疾病诊断、环境监测、转基因农作物评价等。2 4N M R 和M S 技术的联合以及其他分析方法分析方法各有优缺点,相互之间的研究结果彼此补充能获得更多的信息。A t h e r t o n 5 等采用多种分析方法的联合研究认为:不同的分析方法均可实现对样品的分类
21、,但发现的生物标记物群并不相同,因此推荐在可能的情况下对同一研究目标联合使用多种代谢组学研究方法并进行结果的整合。C r o c k f o r d 5 2 等发展了可以整合N M R 和U P L C M S 的相关统计工具,并应用于先天性代谢疾病的研究。W i l l i a m s【5 3J等对普通大鼠和Z u k e r 大鼠用N M R、U P L C T O F(M S)、G C M S 分别进行代谢组学研究,三种方法对两种种系的大鼠均能较好区分,所得结果互相有交,叉,联用三种方法信息量更丰富。3 数据处理生物计量学应用到代谢组学图谱处理以后,标志着代谢组学的诞生,是代谢组学研究方
22、法中的重要环节。一般过程为阻:数据可靠性验证;数据预处理一消除随机噪音,谱图文件转换为数据文件,提取重要的数据信息;模式识别(P C A)等数据处理方法对数据进行多变量分析和建立模型;分析代谢组数据的动态变化过程;发现生物标记物并在代谢途径中定位。3 1 数据简化和可视化无论采用什么方法,预处理的目的是保留与分类有关的大部分信息,消除随机误差(噪音)和多余的干扰因素的影响,也可以赋予变量不同的权重抵消浓度对分类的影响。N M R光谱数据需要首先把光谱分成很多小单元(b i n s),然后进行基线校正和整合,降低水抑制效应带来的变异和尿素的交叉驰豫效应,可采用的软件有B r u k e rA n
23、 a l y s i so fM i x t u r e s 髑。基于M S 的分析方法,是在5 0 兆赫以上的扫描频率,对一定质荷比范围进行全 万方数据扫描。然后将获得的数据分成若干小窗(w i n d o w s),方便计算机分区域进行峰匹配。可采用的软件如x c M s 软件惭o(h t t p:m e r l i n s c r i p p s e d u d o w n l o a d)可以对多种仪器如:w a t e r sq-T O F、W a t e r sQ T O FM i c r o、F i n n i g a nL T Q 和A g i l e n t1 1 0 0L
24、C M S D 产生的数据进行预处理。现在一些仪器也逐步增加了数据处理软件,但大多数公司仪器自带软件仅能对本机器产生的数据进行处理,而不能兼容其它类型的数据。目前已报道的应用于代谢组学的多变量处理方法有圆:P C A、稳健P C A、S I M C A、最小二乘法(P L S)、正交最d x-乘法(O r t h o g o n a l P L S(O P 坞)。数据处理的基本过程大致可分为4 步愧:(1)目标的确定;(2)研究对象的选择;(3)样品的来源和制备;(4)数据评价。对两个或者三个主成分在二维或者三维的坐标图中表示出来,从而实现可视化分析(图1)。2图1 典型三维动态轨迹示意图(n
25、=7)P C I、P C 2 和P C 3 分别代表主成分1、2、3;方块、三角、圆点分别代表药物产生毒性d l、d2、d3 后,样品在三维空间的分布3 2 代谢组动态变化在选取恰当的时间点取样,测定组学改变并表征疾病的不同疾病阶段或者药物表1 代谢通路相关数据库名称及其网址链接1 3 3 5 产生毒性后机体的渐进过程即动态轨迹(t r a j e c t o r y)(图1)旧J。可采用的方法有:多变量投影法(m u l t i v a r i a t ep r o j e c t i o n)旧J、S M A R T 分析(s c a l e d t o-m a x i m u m,a l
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 代谢 分析 技术 平台 数据处理 进展
限制150内