欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    16S信息分析报告2-北京奥维森.pdf

    • 资源ID:72118632       资源大小:1.37MB        全文页数:20页
    • 资源格式: PDF        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    16S信息分析报告2-北京奥维森.pdf

    1616srDNAsrDNA 信息分析信息分析1.1.标准信息分析(初级)标准信息分析(初级)基本数据处理(基本数据处理(使用内部撰写的程序对原始的测序数据进行基本处理)通过Illumina平台(Miseq)进行Paired-end测序,下机数据经过去除低质量reads(Q20,90%标准过滤),并 trim 掉 reads2 尾部 100bp 低质量序列;每个样品数据产出详细统计结果见下表:表 1-1 reads 数据统计:CAHCLKTotalTotal#Samples#Samples17191349#HQHQ readsreads(total)(total)#HQ reads(meanSD)#HQ reads(meanSD)110,651163,690127,416401,7576,5092,1758,6153,0819,8012,8588,1992,992注:原来的样本中 CA15 由于原始 Reads 数太少(只有 23 条)而被删除,因此目前的样本总数为 49 个去除去除 barcode barcode 序列,引物序列及序列,引物序列及 tags tags 过滤过滤通过 COPE 软件(Connecting Overlapped Pair-End,),利用重叠关系将双末端测序得到的成对 reads 组装成一条序列。利用内部编写程序去除两端barcode 序列,引物序列。Paired End Reads 通过 reads 之间的 overlap(19 个碱基)关系拼接成 Tags;然后去掉 barcode 序列,引物序列。为了得到高质量的 Tags,将拼接的 Tags 按照长度过滤,去嵌合体等的处理。(这里等的意思就是按照拼接条件过滤:1,碱基的 ASCII value 值低于33 的过滤掉。取 19 个碱基,这 19 个碱基相互匹配率低于 98%的过滤掉。3.去掉引物序列的时候,允许一个错配,错配多于一个的过滤掉。)表 1-2 tags 的详细信息Sample IDSample IDRaw Tag NumRaw Tag NumFinal Tag numFinal Tag num1HC1HC2HC3HC4HC5HC8HC9HC10HC11HC12HC13HC14HC15HC16HC17HC18HC19CA8CA10CA11CA12CA14CA16CA17CA18CA5CA9CA13175609672180531218111558114881635421584798911561249092297920747148572117110700113591620310925825494797947822110666107871634460471029017,3199,60417,82612,10711,47711,40416,09521,270792611,44924,66022,73620,54914,72821,00210,60511,24716,04010,5607,6909,0537,5848,09310,47910,65116,1545,86110,1652高级信息分析高级信息分析 OUT OUT 及其丰度分析及其丰度分析 OUT 统计拼接的 Tags 经过优化后,在相似度下利用 qiime()软件将其聚类为用于物种分类的 OTU(Operational Taxonomic Units),统计各个样品每个 OTU 中的丰度信息,OTU 的丰度初步说明了样品的物种丰富程度。49 个样品共产生 3029 个 OTU,其中 Singletons2OTU(即丰度为 1 的 OTU)个数为 0,Non singletons OTU个数为 3029。表 4.样品 OUT 统计SampleNameHC1HC2HC3HC4HC5HC8HC9HC10HC12HC13CA10CA11CA12CA14CA16CA17CA18CA5CA9HC11CA13表 5 OTU 统计OTUs541269530215206214455600262294453710650519240330289336347142269Tags17,3199,60417,82612,10711,47711,40416,09521,27011,44924,66010,5607,6909,0537,5848,09310,47910,65116,1545,8617,92610,1653IndexIndexNo.of OTUsNo.of OTUsAssigned to familiesAssigned to families Assigned to genera Assigned to genera Assigned to species Assigned to speciesNo.of OTUs per sampleNo.of OTUs per sampleOTU numOTU num30291,7081,172314368147MinMin no.no.ofof OTUsOTUs perper samplesample127MaxMax no.no.ofof OTUsOTUs perper samplesample719 OTU 分布的韦恩图如下:在的相似度下,得到了每个样品的 OTU 个数,利用 R()画图软件绘出 Venn 图可以展示多样品共有和各自特有OTU 数目,直观展示样品间 OTU 的重叠情况。结合 OTU 所代表的物种,可以找出不同环境中的核心微生物。图图 2-1 OTU venn2-1 OTU venn 分析。分析。不同颜色图形代表不同样品或者不同组别,不同颜色图形之间交叠部分数字为两个样品或两个组别之间共有的 OTU 个数。同理,多个颜色图形之间交叠部分数字为多个样品或组别之间共4v1.0 可编辑可修改有 OTU 个数。Venn 图容许 2-5 个样品或组别。OUT 水平的 PCA 图如下:R()画图软件PCA 分析(Principal Component Analysis),即主成分分析,是一种分析和简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品OTU(97%相似性)组成可以反映样品的差异和距离,PCA运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值两个特征值。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图图 2-22-2 基于基于 OTUOTU 丰度的丰度的 PCAPCA 分析。分析。横坐标表示第一主成分,括号中的百分比则表示第一主成分对样品差异的贡献值;纵坐标表示第二主成分,括号中的百分比表示第二主成分对样品差异的贡献值。图中点分别表示各个样品。不同颜色代表样品属于不同的分组。56v1.0 可编辑可修改2.2 Core microbiome2.2 Core microbiome 分析分析图表都是通过 qiime()软件得到的共有 OTU 数与样本数的关系:图图 2-32-3 覆盖所有样本的微生物组。覆盖所有样本的微生物组。横坐标表示样品占的比率,纵坐标表示包含 OUT 的数目。这些样本的 core microbiome(即覆盖所有样本的微生物组)共包含17 个 OTUs,其物种分类信息如下表 2-1。表 2-1 覆盖所有样本的 OTUsOTUOTU400850400850437590437590368428368428645710645710417699417699395972395972381841381841140702140702Taxonomy levelTaxonomy levelGenusGenusSpeciesGenusGenusGenusGenusGenusTaxonomy nameTaxonomy nameStreptococcusCapnocytophagadisparCampylobacterFusobacteriumStreptococcusStreptococcusPeptostreptococcus741382341382364569764569741430641430626077726077720082008219082190864570864570841442241442212121212GenusGenusGenusGenusGenusGenusGenusFamilyGenusGranulicatellaCampylobacterNeisseriaFusobacteriumNeisseriaNeisseriaCampylobacterGemellaceaeGranulicatella生物多样性分析生物多样性分析单个样品复杂性分析通过计算 Shannon index,Chao1 index,Phylogenetic diversity(PD,whole tree)和 observed number of species 共四个指数来进行生物多样性分析。通过 qiime()软件计算样品的 Alpha 多样性值并用 R()软件做出相应的稀释曲线,盒型图。稀释曲线是利用已测得 16S rDNA 序列中已知的各种 OTU 的相对比例,来计算抽取n 个(n 小于测得 Reads 序列总数)Tags 时各 Alpha 指数的期望值,然后根据一组 n 值(一般为一组小于总序列数的等差数列)与其相对应的Alpha 指数的期望值绘制曲线。如样品有提供分组信息,且每组样品个数不小于3,将对组间的Alpha 多样性指数进行差异分析。差异分析的检验方法为秩和检验,如果组数为 2,采用两样品比较的 WilcoxonRank-Sum Test(R 中的);如果组数大于 2,采用多样品比较的 Kruskal-Wallis Test(R中的)。最后利用 Alpha 多样性指数绘制盒形图。差异分析与作图均通过R 软件()进行。基于 OTU 的结果,我们计算了样品的Alpha 多样性(表 2-2)。Alpha 多样性是对单个样品中物种多样性的分析。chao1 多样性估算指数是根据所测得的tags 数和 OTU 的数量以及相对8比例v1.0 可编辑可修改(PD,whole tree)指数越大,则表示该样品中的物种越丰富。表 2-2 样品的Alpha多样性p-vaule(CA-p-vaule(CA-#Alpha#Alphamean(CA)mean(CA)mean(HC)mean(HC)mean(LK)mean(LK)Pvalue(KW)Pvalue(KW)HC)HC)chao1chao1observed_speciobserved_speciesesPD_whole_treePD_whole_treeshannonshannon16.13.2.15.)LK)LK)p-vaule(CA-LKp-vaule(CA-LKp-vaule(HC-p-vaule(HC-Rarefaction 分析(样本不分组):9v1.0 可编辑可修改图图 2-42-4 单个样品内的单个样品内的 AlphaAlpha多样性多样性Rarefaction 分析(样本分组):图图 2-52-5 每组样品内的每组样品内的AlphaAlpha多样性。多样性。图中红色,黄色,蓝色线分别表示CA,HC,LK 组的rarefaction 分析结果10图图 2-62-6 为组为组 AlphaAlpha 多样性盒形图多样性盒形图,更直观显示组间 Alpha 多样性差异。盒形图可以显示 5 个统计量(最小值,第一个四分位数,中位数,第三个中位数和最大值,及由下到上的 5 条线),异常值以“”标出。Alpha 多样性的比较,以 Shannon index 为例可以看出多样性 CALKHC,其中 CA/HC 有明显差异(P=,Students t test),而CA/LK,HC/LK 差异不显著样品间复杂度比较分析样品间复杂度比较分析Beta 多样性(Beta diversity)分析是用来比较一对样品在物种多样性方面存在的差异大小。本分析中通过 QIIME()软件,采用迭代算法,分别在加权物种分类丰度信息和不加权物种分类丰度信息的情况下,随机抽取各样品中 75%Reads 单独进行差异计算,迭代 10011次之后综合统计得到最终的统计分析结果表及PCoA 展示图。Beta 多样性热图使用 R()软件中的 NMF 包的 aheatmap 进行作图。UniFrac 是通过利用系统进化的信息来比较样品间的物种群落差异。其计算结果可以作为一种衡量 beta diversity 的指数,它考虑了物种间的进化距离,该指数越大表示样品间的差异越大。报告中给出的UniFrac 结果分为加权 UniFrac(weighted UniFrac)与非加权UniFirac(unweighted UniFrac)2种,其中weighted UniFrac考虑了序列的丰度,unweightedUniFrac 不考虑序列丰度。从下面盒形图看,CA 组内的物种丰度最大。Weighted UnifracUnweighted Unifrac图图 2-7 Beta2-7 Beta 多样性的盒形图多样性的盒形图Unifrac 距离的主坐标分析(PCoA)如下:Weighted UnifracUnweighted Unifrac12v1.0 可编辑可修改图图 2-82-8 BetaBeta 多样性的主坐标分析多样性的主坐标分析(PCoA)(PCoA)图图。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。图图 2-92-9 UniFracUniFrac 距离分布距离分布 heatmapheatmap。通过对 UniFrac 结果的聚类,具有相似 beta 多样性的样品聚类在一起,反应了样品间的相似性。物种组成分析物种组成分析本分析中分组后各水平的分类比较柱形图是用QIIME()软件得到的,单个样品的群落分布柱形图和盒型图是根据QIIME()软件计算的结果用R()软件画的。13v1.0 可编辑可修改样品的群落分布图,直观的反应各样品的群落组成。从门水平的群落分布图中可以看出,在这批样品中,占主要地位的门有Firmicutes,Proteobacteria。门(phylum)水平比较图图 2-102-10 分组后门水平的分类比较分组后门水平的分类比较。从左至右分别为 CA,HC,LK 的物种组成。图图 2-112-11 样品的门水平群落分布图样品的门水平群落分布图14v1.0 可编辑可修改纲(class)水平比较图图 2-122-12 分组后纲水平的分类比较。分组后纲水平的分类比较。从左至右分别为 CA,HC,LK 的物种组成。图图 2-132-13 样品的纲水平群落分布图样品的纲水平群落分布图15v1.0 可编辑可修改属(genus)水平比较图图 2-142-14 样品的属水平群落分布图样品的属水平群落分布图含量最高的 25 个属的物种组成如下:16可以看出,这些样本中含量最高的属为Streptococcus,Neisseria,Neisseriaceae(family),Campylobacter,Bacillus,Gemellaceae,TM7-3多组样本的比较分析多组样本的比较分析下面的表格都是通过 QIIME()软件计算出的,热图是用R()软件画的。OTU 水平的比较分析下表是在不同组样本间有显著差异的OTUs(P,Kruskal-Wallis test),共 35 个OTUOTU108253910340525615372714267968675168817931950432031744167632699073245324305791P valueP valueCA_meanCA_mean0HC_meanHC_mean0LK_meanLK_meanLineageLineages_Streptococcus_infantiss_Streptococcus_infantiss_Streptococcus_infantiss_Streptococcus_infantiss_Selenomonas_noxias_Prevotella_tanneraes_Haemophiluspara_influenzaes_Capnocytophaga_ochraceas_Campylobacter_rectuss_Actinobacillus_porcinuso_Lactobacillaleso_Gemellalesg_Streptococcusg_Streptococcusg_Streptococcusg_Prevotellag_Leptotrichiag_Cardiobacterium17429495410103291098655OTU194321136OTU2110166985170410900599497891065974OTU1000g_Capnocytophagag_Capnocytophagag_Bacillusg_Abiotrophiaf_Streptococcaceaef_Streptococcaceaef_Pasteurellaceaef_Neisseriaceaef_Neisseriaceaef_Gemellaceaef_Clostridiaceaef_Clostridiaceaef_Carnobacteriaceaef_Carnobacteriaceaef_Carnobacteriaceaec_Bacilli p_Firmicutes属水平的比较分析首先,PCA 分析能够看出 3 组样本之间有一定程度的差异:其次,通过 Kruskal-Wallis test 分析可以找出在不同组间有明显差异(P的属如下(共 19个属或科):g_Streptococcusg_CampylobacterCA_meanCA_meanHC_meanHC_meanLK_meanLK_meanP valueP value18g_Bacillusf_Gemellaceaef_Carnobacteriaceaeg_Haemophilusg_Lautropiag_Abiotrophiag_Actinobacilluso_Bacteroidaleso_Lactobacillalesg_Enterococcusf_Pasteurellaceaeg_Cardiobacteriump_Proteobacteriag_Stenotrophomonasg_Moraxellag_Yersiniaf_Bacillaceae00000000为了直观,这些属比较的热图如下:19v1.0 可编辑可修改可以看出,在 CA 组富集的属为 Campylobacter,Bacteroidales,Lactobacillales,Pasteurellaceae,Moraxella等;在 HC 组富集的属为 Streptococcus,Gemellaceae,Lautropia,Abiotrophia;在 LK 组富集的属为 Bacillus,Carnobacteriaceae,Haemophilus,Actinobacillus,Enterococcus,Cardiobacterium,Stenotrophomonas,Yersinia等20

    注意事项

    本文(16S信息分析报告2-北京奥维森.pdf)为本站会员(w***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开