《高通量测序服务简介(2).ppt》由会员分享,可在线阅读,更多相关《高通量测序服务简介(2).ppt(31页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、高通量测序服务与数据分析服务简介高通量测序简介n高通量测序技术(第二代或下一代测序技术,next generation sequencing)是对传统测序一次革命性的改变,一次对几十万到几百万条DNA分子进行序列测定,因此在研究中又被称为深度测序(deep sequencing)。n基于illumina的solexa与罗氏454的高通量测序平台,欣景生物可提供不同物种样本的各种类型的二代测序服务。根据样本RNA或者DNA的不同应用可分为表达组测序、microRNA测序、基因组测序等。高通量测序数据分析简介n随着第二代测序技术的广泛应用,海量数据不断产生,包括大量的各类测序结果,需要凭借专业的人
2、员和方法对数据进行各种分析和统计,才能得到有效的所需信息。n基于超级计算机、雄厚的生物信息学分析经验与实力,欣景生物建立了成熟的高通量测序数据的分析流程,有着经验丰富的生物信息学分析人员,可提供针对各类二代测序数据的深层数据分析服务。高通量测序服务适用范围nmRNA或或miRNA的表达组研究的表达组研究 进行高水准研究的医院、科研机构,涉及疾病样本、动物样本、农业样本、微生物样本的表达组研究。n新物种测序或已测序物种的重测序新物种测序或已测序物种的重测序 开展基因组学研究的科研机构,或对特殊物种(农业经济作物,如烟草、葡萄等;有价值的微生物,如致病菌、垃圾处理菌、农业土壤改良菌、工业工程菌株等
3、)进行基因组研究的机构,包括一些发酵相关企业。n疾病相关或表型相关的人类基因组重测序疾病相关或表型相关的人类基因组重测序 如华大之前做的炎黄计划,以及最近国际在进行的肿瘤基因组计划等,一般是有较大科研经费实力的机构。高通量测序数据分析服务适用范围n已进行高通量测序实验的机构已进行高通量测序实验的机构,后续需要对所获得的数据展开各种不同应用的研究。如基因组数据挖掘、表达组的cSNP寻找、基因组的拼接与补洞、miRNA的不同样本的表达差异分析等等。n一般的二代测序服务公司没有相应深度分析的能力,而实验室很难独立展开深度分析的工作,可以采用合作科研或纯服务委托形式。我们提供的测序服务内容(细致展开)
4、n表达组测序:特定组织或者细胞中的mRNA经分离后制备成片段化的cDNA文库,通过solexa测序仪对cDNA文库高通量测序,从而获得一个细胞或生物个体的全转录组信息。nmiRNA测序:可对细胞或者组织中的全部Small RNA进行深度测序及定量分析等研究。用于作用靶基因的预测和鉴定、样品间差异表达分析、miRNAs聚类和表达谱分析等科学应用。n基因组测序:1.细菌基因组测序:对全新或不同菌株细菌基因组进行全测序研究。2.真菌全基因组测序(全新或不同菌株):对于真菌全基因组而言,可以得到到一个真菌基因组的精细图(基因组覆盖度大于95,基因区覆盖度达到98以上,单碱基错误率低于十万分之一)。3.
5、全基因组重测序:全基因组重测序是对已知基因组序列的物种的个体进行 测序,并在个体或群体水平进行差异分析的方法。基于全基因组重测序的分子育种,能够快速的进行种质资源普查筛选,寻找到大量基因差异,实现遗传进化分析及重要性状候选基因的预测。在全基因组水平上扫描并检测与动植物重要性状相关的突变位点,具有重大的科研价值和产业价值。我们提供的数据分析服务(细致展开)基本数据分析:n序列前处理工作,包括成对测序数据的序列匹配,裁减低质量部分,数据格式转换等n序列拼接,Scaffolding,对454数据的homopolymer进行修正等。n用多种主流基因预测软件预测基因并挑选最合适的代表基因结构。ntRNA
6、/rRNA识别和分类。n基因组GC含量分析,并识别特异区域。n基因功能注释(包括同源注释和蛋白结构域识别)。n基因功能分类,参照Gene Ontology或COG标准(由用户指定标准)。n 生物信息高级分析:n提供图型化界面由用户人工确认基因结构和基因功能注释。n重复序列识别和分类。n基因家族识别和聚类。n基因功能聚类,参照FunCatDB标准。n代谢调控途径识别和重建。n转录因子(Transcription Factor)识别和分类分析。n分泌蛋白识别和分析。n蛋白激酶识别和分析。n转运蛋白(Transporter)识别和分析。n假基因(pseudogene)识别和分析。nSSR标记模式识别
7、和预测。更多相关内容不再展开 应用举例应用举例应用举例高通量测序服务市场情况分高通量测序服务市场情况分析大型知名品牌企业:大型知名品牌企业:-华大基因。华大基因。-这类企业有完整的产业链,有着巨大规模的传统测序与二代这类企业有完整的产业链,有着巨大规模的传统测序与二代测序服务经验与市场拓展经验;但同时存在对具体客户服务不够测序服务经验与市场拓展经验;但同时存在对具体客户服务不够细致的缺点。细致的缺点。-2011年华大基因全球测序营业额年华大基因全球测序营业额1000000000元(人民币)元(人民币)1、美季生物。、美季生物。-小型企业,偏重于小型企业,偏重于454测序。测序。2、晶能科技。、
8、晶能科技。-依托研究院所建立的高通量测序服务企业。有一定业务量,但不稳依托研究院所建立的高通量测序服务企业。有一定业务量,但不稳定。定。3、其他类企业:、其他类企业:-还有一些小型企业,这些企业主要通过代理或只能承担小量样本测还有一些小型企业,这些企业主要通过代理或只能承担小量样本测序,其服务流动性较大而且服务质量无法保证。序,其服务流动性较大而且服务质量无法保证。欣景生物科技则拥有成熟的测序与分析流程、经验丰富的分析人员,可欣景生物科技则拥有成熟的测序与分析流程、经验丰富的分析人员,可以提供高质量的二代测序相关服务。以提供高质量的二代测序相关服务。其它企业:其它企业:我们的优势我们的优势n1
9、、服务水准高。服务水准高。团队中有关高通量测序实验已经大量大型课题的锻炼,包括大量基因组测序、转录组测序等等,并已有Nature、Science等高端杂志文章数据分析经验,有一整套严格的实验质量标准和操作流程,且不断跟踪国际最新的进展,可以在高起点为客户提供服务。2、服务周到。服务周到。技术团队中有专职的高通量数据信息分析人员,在测序完成后可以为客户提供完整的生物信息学分析,直至可以进行文章投稿或结题等,这点在各个高通量测序服务企业中是非常有优势的,因为很多客户测序完成后,如果缺乏此环节,其成果水平下降,甚至出现数据烂在手中的情况,并不是而事实上是因为缺乏分析环节的保障。3、服务稳定。、服务稳
10、定。实验操作阶段的每个实验环节都有专门的人员负责,有完善的质控标准。4、服务灵活。、服务灵活。针对客户不同的需求在可行的前提下可以制定不同的实验操作与数据分析方案。我们服务所提供的结果n二代测序技术水平较高,且不同客户需求不一致,以下只是基本的结果。n(一)实验结果报告建库报告、测序报告。n(二)实验流程报告(完整实验记录)n(三)实验数据分析报告(按不同应用包括基因组拼接结果、转录组表达量分析结果、miRNA种类与表达量等)n(四)实验说明(所用仪器、试剂、耗材及分析软件)我们所采用的设备Illumina genome analyzer IIx 价格:400万Roche 454 价格:300
11、-400万实验一般流程实验一般流程n客户实验方案确定n各种核酸提取实验:详见核酸提取实验步骤。n根据不同应用进行建库,如基因组文库、转录组文库、microRNA文库。n将上述测序样品在第二代测序仪中进行各种测序反应。数据分析服务一般流程n数据质量评价,对所需分析的高通量数据研究应用分析,确定数据分析目标与方案。n计算处理,采用超级计算机对海量数据进行分析。n结果统计分析。附:Solexa Illumina测序简介n2006年推出的Illumina Genome Analyzer是一种基于单分子簇的边合成边测序技术,它基于专有的可逆终止化学反应原理。n测序时将基因组DNA的随机片段附着到光学透明
12、的玻璃表面(即Flow cell),这些DNA片段经过延伸和桥式扩增后,在Flow cell上形成了数以亿计Cluster,每个Cluster是具有数千份相同模板的单分子簇。n然后利用带荧光基团的四种特殊脱氧核糖核苷酸,通过可逆性终止的SBS(边合成边测序)技术对待测的模板DNA进行测序。n这种新方法确保了高精确度和真实的一个碱基接一个碱基的测序,排除序列方面的特殊错误,为同聚物和重复序列的测序提供了一个很好的解决方案。Solexa基因组测序简要流程n文库制备:样品收集,基因组DNA打断,DNA 末端修复,连接接头nDNA片段在Cluster Station上成簇扩增:准备Flowcell和试
13、剂,安装到Cluster Station;将样品DNA连接到Flowcell;完全自动化完成Cluster制备nDNA簇在Genome Analyzer上边合成边测序:Flowcell和试剂,安置到Genome Analyzer;全自动化完成测序,包括测序长Reads;图片处理,实时分析,碱基识别;n数据分析:组装;变异分析;总结报告Solexa flow cell50M clusters are sequenced per flow cell.具体流程2)将DNA片段通过接头与flow cell的互补片段相连形成单链DNA模版,并经过桥式PCR扩增形成更多模版1)随机打断DNA并 与接头连接
14、 3)加入荧光标记的可逆性终止dNTP(羟基保护),测序引物与DNA聚合酶.4)将所有未结合的试剂洗脱,用激光激发荧光基团,并读 取每个cluster的信号5)除去3端羟基保护 基团与荧光基团,然后重复上述过程Debbie Nickerson,Department of Genome Sciences,University of Washington,http:/ Solexa特点n测序通量高:每个样本测序可以提供500M reads(1-1.5Gbp)数据,并可以根据客户需求灵活对总量进行调整n准确率高:同时也有效地解决了多聚重复序列的读取问题n读长已延长(单向100bp)n适合基因组重测序
15、、表达谱、microRNA谱测序 Roche/454:GS FLX简介n2005年454公司推出概念机Genome Sequencer 20 System nJonathan Rothberg博士发明n基于焦磷酸测序法的超高通量基因组测序系统,“一个片段=一个磁珠=一条读长(One fragment=One bead=One read)n革命性的理念-边合成边测序n2006年被罗氏收购,2007年推出Genome Sequencer FLX System,性能进一步提高454 测序简要原理n大规模的并行测序大规模的并行测序,“边合成边测边合成边测序序”:每次反应都依次加入ATGC四种核酸,从而
16、产生焦磷酸焦磷酸在硫酸化酶作用下生成ATP,荧光素酶则利用其作为能量单位作用底物激发荧光2.三磷酸腺苷双磷酸酶将每步剩余的dNTP降解荧光信号被检测并转换为序列信息 454 测序流程n文库制备:根据样品的种类和实验目的,将基因组DNA/cDNA片段化处理至400-800bp间,进行生物素修饰及加接头nEmulsion PCR:特定比例的单链DNA文库被固定在特别设计的DNA捕获磁珠上,使大部分磁珠磁珠携带了一个独特的单链DNA片断磁珠结合的文库被扩增试剂乳化,形成油包水的混合物,每个独特的片断在自己的微反应器里进行独立的扩增,而不受其他的竞争性或者污染性序列的影响。整个片段文库的扩增平行进行。
17、454 测序流程n测序反应:乳液混合物被打破,扩增后产生的几百万个相同的拷贝,被回收纯化。携带DNA的珠子与其他反应物混合物,随后放入PTP板中进行后继的测序。PTP孔的直径(29um)只能容纳一个珠子(20um)。然后将PTP板放置在GS FLX中,焦磷酸测序开始。每一个与模板链互补的核苷酸的添加都会产生化学发光的信号,并被CCD照相机所捕获n数据分析:GS FLX系统在10小时的运行当中可获得100多万个读长,读取超过4-6亿个碱基信息,通过GS FLX系统提供两种不同的生物信息学工具对测序数据进行分析Roche/454:GS FLXn适用于新物种基因组测序n对于重测序而言成本过高n尤其适合用于基因组未知的微生物测序n最大到 1000,000个读长每轮n每个读长 400bp n总测序量400 Mbp 每轮,可根据客户测序需求进行灵活调整n简便高效,不需要进行建库、克隆挑取、质粒提取等工作,一个人可以在一天内完成一个微生物物种的测序工作
限制150内