代谢组学数据挖掘及分析操作SOP-.doc
《代谢组学数据挖掘及分析操作SOP-.doc》由会员分享,可在线阅读,更多相关《代谢组学数据挖掘及分析操作SOP-.doc(3页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精品文档,仅供学习与交流,如有侵权请联系网站删除代谢组学数据分析操作SOP应用Masslynx的离线软件进行色谱峰自动识别,峰匹配(峰对齐)和归一化处理,生成biomarkers;(需较长时间,最好在台式电脑上操作比较快)1) 将生成的biomarkers导入simca-p12.0进行PCA分析,如果分的好采用此种方式,如果分的不好可进行剔除圈外点后进行PLS-DA分析,且进一步剔除圈外点(注:不是所有在圈外的点都应该剔除,选择性剔除较远点后,有的较近的点会自然落在圈内);2) Simca-p比较适合两组间的比较,所以组数不要太多,且分的组数比每组的样本数还多是绝对不允许的;3) 在PCA或者
2、PLS-DA生成的scores图中可以看到各组间聚集效果,可以设置相应参数。在loading图中可以生成vip值列表,挑选VIP1的化合物进行下一步分析,如果太多可以选择峰面积比值在2以上的标志物为主要标志进行下一步分析;4) 对simca-p进行的两两比较的组,同样进行t-test检验,P0.05表示有显著性差异;同时满足以上两点的化合物可作为第1轮的标志物;5) 在masslynx软件中,选择QC样本的色谱峰,对以上标志物进行峰提取,点击该图标输入分子量,按住鼠标右键,拖拉出平均分子量(我们会发现平均分子量对应的出峰时间与masslynx处理数据后的出峰时间不一样,后者是所有样品在该点出峰
3、的平均出峰时间,而前者是输入该分子量后提出来的平均时间,因此不同,但一般在0.05的范围内偏差是可以接受的。)7) 找出提取的峰为该时间点上最强峰的离子峰(如果有二倍体峰2(M+1)-1,更有说服力),定为标志物,否则直接舍弃,可能是碎片峰或者基线波动。所有的分子量都应该提取平均的分子量,不能直接点击否则会有挺大误差.通过此步后会筛除一部分化合物,得到第2轮的标志物。注:一般1min以前的很可能是溶剂峰,可以先提取平均分子量,看下与质谱出来的分子量是否一致,一般即便去鉴别,鉴别出来的化合物也不对.不是极性不可能,就是这个化合物不可能出现在这里.首先看该峰的信噪比,定性的峰高必须是基线的3倍以上
4、,否则直接剔除掉;如果为母粒子,一般有二倍体峰M=2(M+1)-1,如果没有,该峰前面还有更大分子量的峰,可以进行比较,看是否为常见碎片,一般相差1,18等,虽然TOF不能较彻底打碎化合物,但由于质谱的软电离,也会有简单的打碎.如果可能是碎片的就排除,如果不是碎片的可以保留,很有可能是标志物(一般标志物有多少就看QC样本的峰有多少,一般不会超过30个,即使血清有1000+个化合物,但能在UPLC-TOF中保留的并不多,而且即使有峰也不一定就是标志物).如果遇到同分异构体无法确定的,可以去google学术中看同样是尿或者血清样本的代谢组学研究,无论研究的是什么药,只要有过某一同分异构体的文献描述
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 代谢 数据 挖掘 分析 操作 SOP
限制150内