生物信息学在高通量测序数据分析中的应用.ppt
《生物信息学在高通量测序数据分析中的应用.ppt》由会员分享,可在线阅读,更多相关《生物信息学在高通量测序数据分析中的应用.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物信息学在高通量测序生物信息学在高通量测序数据分析中的应用数据分析中的应用主 讲 人:李广林提提 纲纲高通量测序技术的介绍高通量测序技术的介绍高通量测序技术的主要应用高通量测序技术的主要应用生物信息学在高通量测序数据中的主要应用生物信息学在高通量测序数据中的主要应用高通量测序简介高通量测序简介w高通量高通量测序测序:一次性对一次性对几百万到十亿条几百万到十亿条DNA分子进行分子进行并行测序并行测序,又称为,又称为下一代测序技术下一代测序技术,其使得可对一个物种的转录组和基因组进行其使得可对一个物种的转录组和基因组进行深入、细致、全貌的分析,所以又被称为深入、细致、全貌的分析,所以又被称为深深
2、度测序度测序。wHigh-throughputSequencingwNextGenerationSequencingwDeepSequencing3主要测序技术w第一代测序技术Sangersequencing(1980s)w第二代测序技术(nextgenerationsequencing,NGS)wRoche/454(2005)wIllumina/Solexa(2006)wLife/APGsSOLiD(2007)wLife/APGsIontorrent(2010)w第三代测序技术PacificBiosciencessinglemoleculesequencing(2011)Nanoporese
3、quencing测序的基本反应原理:DNA聚合反应第一代测序技术第一代测序技术Sanger 法法结合荧光标记和毛细管电泳结合荧光标记和毛细管电泳测序峰图ABI3730sequencerwReadlength:1,000bpwAccuracy:99.999%wCost:$0.5/kbwThroughput:6x105bp/daySangervsNGSSangerNGS样品量大小是否需要电泳是否通量低高单位成本高低准确率高偏低读长长短高通量测序技术Roche/454pyrosequencing以固化了引物的玻璃微球为中心形成油包水结构的乳滴,每个乳以固化了引物的玻璃微球为中心形成油包水结构的乳滴,
4、每个乳滴都是一个滴都是一个PCR反应的微量反应器(通过控制测序文库反应的微量反应器(通过控制测序文库DNA的浓的浓度和微球悬浊液的浓度,保证大多数微球只结合一条度和微球悬浊液的浓度,保证大多数微球只结合一条DNA模板)。模板)。经过多轮循环反应,每个微球表面都结合了数千个相同的拷贝。经过多轮循环反应,每个微球表面都结合了数千个相同的拷贝。变性后,使微球上结合的都是单链变性后,使微球上结合的都是单链DNA片段。片段。富集微球,转移到刻有大规模微孔阵列的微孔板上,每个微孔只富集微球,转移到刻有大规模微孔阵列的微孔板上,每个微孔只容纳一个微球。容纳一个微球。高通量测序技术Roche/454pyros
5、equencing顺次向流通池中加入顺次向流通池中加入4种种dNTP中的一中的一种,流过微孔板的一面。种,流过微孔板的一面。当当dNTP与脱氧核糖骨架连接后释放出与脱氧核糖骨架连接后释放出焦磷酸,在与焦磷酸,在与dNTP一起加入的一起加入的ATP硫硫酰化酶和荧光素酶作用下产生一系列酰化酶和荧光素酶作用下产生一系列级联反应,放出不同的光信号。级联反应,放出不同的光信号。每个微孔中光信号的有无,就表明对每个微孔中光信号的有无,就表明对应的应的dNTP是否连接到了片段上。是否连接到了片段上。454测序的原理:焦磷酸测序逐次加入逐次加入dATP等,每加入一种,检测信号,等,每加入一种,检测信号,清洗再
6、加下一种。清洗再加下一种。ATP硫酸化酶硫酸化酶5-磷酰硫酸磷酰硫酸荧光素酶荧光素酶高通量测序技术Roche/454pyrosequencingw优势:读长长(max1kb,GSFLXTitaniumXL+),运行时间短(10-23hours)w主要错误来源:难以准确判定连续碱基(经过3次级联化学反应产生的荧光信号与连接上碱基的数量线性关系较差),容易产生Indelw劣势:通量相对偏低(max700M),单位成本高GSFLX+SystemGSJuniorSystem高通量测序技术Illumina/Solexa单链单链DNA两端加上非对称的通用接头两端加上非对称的通用接头(包括测序引物包括测序引
7、物),接头,接头与事先固定在固相芯片表面的序列互补与事先固定在固相芯片表面的序列互补单链单链DNA结合到芯片表面形成桥式结构。然后使用接头引物结合到芯片表面形成桥式结构。然后使用接头引物进行进行PCR扩增扩增变性后在一个芯片上可以形成上亿个不相关的单链变性后在一个芯片上可以形成上亿个不相关的单链DNA分子分子簇,其一端固定在芯片表面,另一端是自由的簇,其一端固定在芯片表面,另一端是自由的高通量测序技术Illumina/Solexa使用测序引物从自由的通用接头一使用测序引物从自由的通用接头一侧开始测序反应。侧开始测序反应。测序使用的测序使用的dNTP每种碱基被不同的每种碱基被不同的荧光基团标记,
8、同时脱氧核糖的荧光基团标记,同时脱氧核糖的3-OH被封闭,这样每轮测序循环只能被封闭,这样每轮测序循环只能延伸一个核苷酸。读取碱基荧光信延伸一个核苷酸。读取碱基荧光信号,就能知道这一轮每个簇结合上号,就能知道这一轮每个簇结合上的是什么核苷酸的是什么核苷酸然后切除荧光基团,打开被封闭的然后切除荧光基团,打开被封闭的3-OH,继续进行下一轮反应,继续进行下一轮反应Solexa测序的原理:可逆阻断高通量测序技术Illumina/Solexaw优势:通量最高(max600Gb,HiSeq2500)w主要错误来源:同一个簇内不同DNA链延伸情况不同(相位差),导致读取错误w劣势:读长较短(max250b
9、p,HiSeq2500),运行时间长(1-14days,HiSeq2500大幅提升了运行速度),数据存储和分析难度大。MiSeqHiSeq2000GenomeAnalyzerII高通量测序技术AB/SOLiDSOLiDSystem5500 seriesSOLiD测序探针介绍类似类似454的微球反应体系,但使用连接反应。的微球反应体系,但使用连接反应。SOLiDSequencing每次测序反应的第每次测序反应的第1轮,测序引物轮,测序引物1与接头序列互补形成平末端,然后与探针与接头序列互补形成平末端,然后与探针连接。当探针连接。当探针1,2位与待测序列模板互补并连接上之后,获取荧光信息。然后位与
10、待测序列模板互补并连接上之后,获取荧光信息。然后在探针的在探针的5,6位之间切开探针,进行下一个连接反应。这样重复多次,可以获位之间切开探针,进行下一个连接反应。这样重复多次,可以获得模板序列的第得模板序列的第1-2,6-7,11-12位置的信息。位置的信息。高通量测序技术Life/APGsSOLiD优点:由于使用双碱基编码技术(two-baseencoding),准确率最高,通量高(max300Gb)缺点:读长最短(max75bp),运行时间长(7-10day),数据储存和分析难度大5500SeriesGeneticAnalysisSystems高通量测序技术Life/APGsIontorr
11、entPGM454发明者的新作品发明者的新作品测序反应在微阵列芯片上测序反应在微阵列芯片上的微反应池中进行。的微反应池中进行。每个每个dNTP结合到延伸链上,结合到延伸链上,会释放出一个会释放出一个H+,pH值变值变化会导致电位变化。化会导致电位变化。检测每次检测每次dNTP流过的电位流过的电位差变化,就能知道该差变化,就能知道该dNTP是否连接上去。是否连接上去。高通量测序技术Life/APGsIontorrentPGMw优点:速度快(5%)的单核苷酸变异w群体SNPcallingA T C G A T C G A A T T C G T A C G A T G C T T A G C T
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 通量 序数 分析 中的 应用
限制150内