16S信息分析报告2-北京奥维森.pdf
《16S信息分析报告2-北京奥维森.pdf》由会员分享,可在线阅读,更多相关《16S信息分析报告2-北京奥维森.pdf(20页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1616srDNAsrDNA 信息分析信息分析1.1.标准信息分析(初级)标准信息分析(初级)基本数据处理(基本数据处理(使用内部撰写的程序对原始的测序数据进行基本处理)通过Illumina平台(Miseq)进行Paired-end测序,下机数据经过去除低质量reads(Q20,90%标准过滤),并 trim 掉 reads2 尾部 100bp 低质量序列;每个样品数据产出详细统计结果见下表:表 1-1 reads 数据统计:CAHCLKTotalTotal#Samples#Samples17191349#HQHQ readsreads(total)(total)#HQ reads(meanS
2、D)#HQ reads(meanSD)110,651163,690127,416401,7576,5092,1758,6153,0819,8012,8588,1992,992注:原来的样本中 CA15 由于原始 Reads 数太少(只有 23 条)而被删除,因此目前的样本总数为 49 个去除去除 barcode barcode 序列,引物序列及序列,引物序列及 tags tags 过滤过滤通过 COPE 软件(Connecting Overlapped Pair-End,),利用重叠关系将双末端测序得到的成对 reads 组装成一条序列。利用内部编写程序去除两端barcode 序列,引物序列。
3、Paired End Reads 通过 reads 之间的 overlap(19 个碱基)关系拼接成 Tags;然后去掉 barcode 序列,引物序列。为了得到高质量的 Tags,将拼接的 Tags 按照长度过滤,去嵌合体等的处理。(这里等的意思就是按照拼接条件过滤:1,碱基的 ASCII value 值低于33 的过滤掉。取 19 个碱基,这 19 个碱基相互匹配率低于 98%的过滤掉。3.去掉引物序列的时候,允许一个错配,错配多于一个的过滤掉。)表 1-2 tags 的详细信息Sample IDSample IDRaw Tag NumRaw Tag NumFinal Tag numFin
4、al Tag num1HC1HC2HC3HC4HC5HC8HC9HC10HC11HC12HC13HC14HC15HC16HC17HC18HC19CA8CA10CA11CA12CA14CA16CA17CA18CA5CA9CA13175609672180531218111558114881635421584798911561249092297920747148572117110700113591620310925825494797947822110666107871634460471029017,3199,60417,82612,10711,47711,40416,09521,270792611,
5、44924,66022,73620,54914,72821,00210,60511,24716,04010,5607,6909,0537,5848,09310,47910,65116,1545,86110,1652高级信息分析高级信息分析 OUT OUT 及其丰度分析及其丰度分析 OUT 统计拼接的 Tags 经过优化后,在相似度下利用 qiime()软件将其聚类为用于物种分类的 OTU(Operational Taxonomic Units),统计各个样品每个 OTU 中的丰度信息,OTU 的丰度初步说明了样品的物种丰富程度。49 个样品共产生 3029 个 OTU,其中 Singleton
6、s2OTU(即丰度为 1 的 OTU)个数为 0,Non singletons OTU个数为 3029。表 4.样品 OUT 统计SampleNameHC1HC2HC3HC4HC5HC8HC9HC10HC12HC13CA10CA11CA12CA14CA16CA17CA18CA5CA9HC11CA13表 5 OTU 统计OTUs541269530215206214455600262294453710650519240330289336347142269Tags17,3199,60417,82612,10711,47711,40416,09521,27011,44924,66010,5607,69
7、09,0537,5848,09310,47910,65116,1545,8617,92610,1653IndexIndexNo.of OTUsNo.of OTUsAssigned to familiesAssigned to families Assigned to genera Assigned to genera Assigned to species Assigned to speciesNo.of OTUs per sampleNo.of OTUs per sampleOTU numOTU num30291,7081,172314368147MinMin no.no.ofof OTUs
8、OTUs perper samplesample127MaxMax no.no.ofof OTUsOTUs perper samplesample719 OTU 分布的韦恩图如下:在的相似度下,得到了每个样品的 OTU 个数,利用 R()画图软件绘出 Venn 图可以展示多样品共有和各自特有OTU 数目,直观展示样品间 OTU 的重叠情况。结合 OTU 所代表的物种,可以找出不同环境中的核心微生物。图图 2-1 OTU venn2-1 OTU venn 分析。分析。不同颜色图形代表不同样品或者不同组别,不同颜色图形之间交叠部分数字为两个样品或两个组别之间共有的 OTU 个数。同理,多个颜色图形
9、之间交叠部分数字为多个样品或组别之间共4v1.0 可编辑可修改有 OTU 个数。Venn 图容许 2-5 个样品或组别。OUT 水平的 PCA 图如下:R()画图软件PCA 分析(Principal Component Analysis),即主成分分析,是一种分析和简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品OTU(97%相似性)组成可以反映样品的差异和距离,PCA运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值
10、两个特征值。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图图 2-22-2 基于基于 OTUOTU 丰度的丰度的 PCAPCA 分析。分析。横坐标表示第一主成分,括号中的百分比则表示第一主成分对样品差异的贡献值;纵坐标表示第二主成分,括号中的百分比表示第二主成分对样品差异的贡献值。图中点分别表示各个样品。不同颜色代表样品属于不同的分组。56v1.0 可编辑可修改2.2 Core microbiome2.2 Core microbiome 分析分析图表都是通过 qiime()软件得到的
11、共有 OTU 数与样本数的关系:图图 2-32-3 覆盖所有样本的微生物组。覆盖所有样本的微生物组。横坐标表示样品占的比率,纵坐标表示包含 OUT 的数目。这些样本的 core microbiome(即覆盖所有样本的微生物组)共包含17 个 OTUs,其物种分类信息如下表 2-1。表 2-1 覆盖所有样本的 OTUsOTUOTU400850400850437590437590368428368428645710645710417699417699395972395972381841381841140702140702Taxonomy levelTaxonomy levelGenusGenusS
12、peciesGenusGenusGenusGenusGenusTaxonomy nameTaxonomy nameStreptococcusCapnocytophagadisparCampylobacterFusobacteriumStreptococcusStreptococcusPeptostreptococcus741382341382364569764569741430641430626077726077720082008219082190864570864570841442241442212121212GenusGenusGenusGenusGenusGenusGenusFamily
13、GenusGranulicatellaCampylobacterNeisseriaFusobacteriumNeisseriaNeisseriaCampylobacterGemellaceaeGranulicatella生物多样性分析生物多样性分析单个样品复杂性分析通过计算 Shannon index,Chao1 index,Phylogenetic diversity(PD,whole tree)和 observed number of species 共四个指数来进行生物多样性分析。通过 qiime()软件计算样品的 Alpha 多样性值并用 R()软件做出相应的稀释曲线,盒型图。稀释曲线
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 16 信息 分析 报告 北京 奥维森
限制150内