《RNAseq技术原理及应用教案.pptx》由会员分享,可在线阅读,更多相关《RNAseq技术原理及应用教案.pptx(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1RNAseq技术原理及应用技术原理及应用主要内容主要内容主要内容主要内容1 1、RNA-seqRNA-seq技术简介技术简介技术简介技术简介2 2、RNA-seqRNA-seq技术原理技术原理技术原理技术原理3 3、RNA-seqRNA-seq结果分析结果分析结果分析结果分析4 4、RNA-seqRNA-seq技术应用技术应用技术应用技术应用第1页/共16页一、一、一、一、RNA-seqRNA-seqRNA-seqRNA-seq技术简介技术简介技术简介技术简介1.1.诞生于诞生于诞生于诞生于 20 20 世纪世纪世纪世纪 70 70 年代的年代的年代的年代的 Sanger Sanger
2、 法是最早法是最早法是最早法是最早被广泛应用的被广泛应用的被广泛应用的被广泛应用的 DNA DNA 测序技术,也是完成人类基测序技术,也是完成人类基测序技术,也是完成人类基测序技术,也是完成人类基因组计划的基础。因组计划的基础。因组计划的基础。因组计划的基础。2.2005 2.2005 年以来,以年以来,以年以来,以年以来,以 Roche Roche 公司的公司的公司的公司的 454 454 技术、技术、技术、技术、Illumina Illumina 公司的公司的公司的公司的 Solexa Solexa 技术和技术和技术和技术和 ABI ABI 公司公司公司公司的的的的 SOLiD SOLiD
3、 技术为标志的新一代测序技术相继诞生技术为标志的新一代测序技术相继诞生技术为标志的新一代测序技术相继诞生技术为标志的新一代测序技术相继诞生,又称作深度测序技术。又称作深度测序技术。又称作深度测序技术。又称作深度测序技术。3.3.把高通量测序技术应用到由把高通量测序技术应用到由把高通量测序技术应用到由把高通量测序技术应用到由 RNA RNA 逆转录生逆转录生逆转录生逆转录生成的成的成的成的 cDNA cDNA 上,从而获得来自不同基因的上,从而获得来自不同基因的上,从而获得来自不同基因的上,从而获得来自不同基因的RNA RNA 片段在特定样本中的含量,这就是片段在特定样本中的含量,这就是片段在特
4、定样本中的含量,这就是片段在特定样本中的含量,这就是 RNA RNA测序或测序或测序或测序或 RNA-seqRNA-seq。第2页/共16页二、二、二、二、RNA-seqRNA-seqRNA-seqRNA-seq技术原理技术原理技术原理技术原理Illumina/Solexa Illumina/Solexa 测序技术的基本原理是边合测序技术的基本原理是边合测序技术的基本原理是边合测序技术的基本原理是边合成边测序,即测序过程是以成边测序,即测序过程是以成边测序,即测序过程是以成边测序,即测序过程是以 DNA DNA 单链为模板,单链为模板,单链为模板,单链为模板,在生成互补链时,利用带荧光标记的在
5、生成互补链时,利用带荧光标记的在生成互补链时,利用带荧光标记的在生成互补链时,利用带荧光标记的 dNTP dNTP 发出发出发出发出不同颜色的荧光来确定不同的碱基。不同颜色的荧光来确定不同的碱基。不同颜色的荧光来确定不同的碱基。不同颜色的荧光来确定不同的碱基。新加入新加入新加入新加入 dNTP dNTP 的末端被可逆的保护基团封闭,的末端被可逆的保护基团封闭,的末端被可逆的保护基团封闭,的末端被可逆的保护基团封闭,既保证单次反应只能加入一个碱基,又能在该碱既保证单次反应只能加入一个碱基,又能在该碱既保证单次反应只能加入一个碱基,又能在该碱既保证单次反应只能加入一个碱基,又能在该碱基读取完毕后,
6、将保护基团除去,使得下一个反基读取完毕后,将保护基团除去,使得下一个反基读取完毕后,将保护基团除去,使得下一个反基读取完毕后,将保护基团除去,使得下一个反应可继续进行。为了增加荧光强度,使之更易被应可继续进行。为了增加荧光强度,使之更易被应可继续进行。为了增加荧光强度,使之更易被应可继续进行。为了增加荧光强度,使之更易被成像系统所采集,该技术在测序之前还需要对待成像系统所采集,该技术在测序之前还需要对待成像系统所采集,该技术在测序之前还需要对待成像系统所采集,该技术在测序之前还需要对待测片段做桥式扩增。测片段做桥式扩增。测片段做桥式扩增。测片段做桥式扩增。第3页/共16页 Shot Gun文库
7、构建DNA片段固定簇序列读取反应图像获得和处理序列组装和比较单条模板扩增1234T T T T T G C T 二、二、二、二、RNA-seqRNA-seqRNA-seqRNA-seq技术原理技术原理技术原理技术原理第4页/共16页二、二、二、二、RNA-seqRNA-seqRNA-seqRNA-seq技术原理技术原理技术原理技术原理RNA-seq实验流程图第5页/共16页为了便于测序数据的发布和共为了便于测序数据的发布和共享,高通量测序数据以享,高通量测序数据以 FASTQ 格式来记录所测的碱基读段和质格式来记录所测的碱基读段和质量分数。量分数。NCBI、EBI、DDBJ 等等数据中心建立了
8、大容量的数据库数据中心建立了大容量的数据库 SRA来存放共享的测序数据。来存放共享的测序数据。三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析第6页/共16页三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析RNA-seq 数数据的基本处理据的基本处理第7页/共16页1.序列定位算法序列定位算法(1)空位种子索引法:首先)空位种子索引法:首先将读段切分,并选取其中一段或将读段切分,并选取其中一段或几段作为种子建立搜索索引,再几段作为种子建立搜索索引,再通过查找索引、延展匹配来实现通过查
9、找索引、延展匹配来实现读段定位读段定位,通过轮换种子考虑允,通过轮换种子考虑允许出现错配的各种可能的位置组许出现错配的各种可能的位置组合(合(Maq)。(2)Burrows-Wheeler 转换转换技术:通过技术:通过B-W 转换将基因组序转换将基因组序列按一定规则压缩并建立索引,列按一定规则压缩并建立索引,再通过查找和回溯来定位读段,再通过查找和回溯来定位读段,在查找时可通过碱基替代来实现在查找时可通过碱基替代来实现允许的错配(允许的错配(Bowtie)。(3)改进的改进的 SmithWaterman 动态规划算法:随着读长的增加,动态规划算法:随着读长的增加,允许读段序列中存在插入删除允许
10、读段序列中存在插入删除(indel)的定位(的定位(BFAST、SHRiMP、Mosaik)。)。三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析第8页/共16页2.2.基因表达水平估计基因表达水平估计基因表达水平估计基因表达水平估计RNA-seq RNA-seq 数据最基本的应用是检测基因的表达数据最基本的应用是检测基因的表达数据最基本的应用是检测基因的表达数据最基本的应用是检测基因的表达水平水平水平水平 ,与基因芯片数据相比,与基因芯片数据相比,与基因芯片数据相比,与基因芯片数据相比 ,RNA RNA 测序得到的测序得到的测序得到的测
11、序得到的是数字化的表达信号,具有灵敏度高、分辨率高、是数字化的表达信号,具有灵敏度高、分辨率高、是数字化的表达信号,具有灵敏度高、分辨率高、是数字化的表达信号,具有灵敏度高、分辨率高、无饱和区等优势无饱和区等优势无饱和区等优势无饱和区等优势。RNA RNA 测序数据是对提取出的测序数据是对提取出的测序数据是对提取出的测序数据是对提取出的 RNA RNA 转录本中随转录本中随转录本中随转录本中随机进行的短片段测序,如果一个转录本的丰度高,机进行的短片段测序,如果一个转录本的丰度高,机进行的短片段测序,如果一个转录本的丰度高,机进行的短片段测序,如果一个转录本的丰度高,则测序后定位到其对应的基因组
12、区域的读段也就则测序后定位到其对应的基因组区域的读段也就则测序后定位到其对应的基因组区域的读段也就则测序后定位到其对应的基因组区域的读段也就多,可以通过对定位到基因外显子区的读段计数多,可以通过对定位到基因外显子区的读段计数多,可以通过对定位到基因外显子区的读段计数多,可以通过对定位到基因外显子区的读段计数来估计基因表达水平来估计基因表达水平来估计基因表达水平来估计基因表达水平。三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析第9页/共16页3.3.选择性剪接事件识别和剪接异构体表达水平选择性剪接事件识别和剪接异构体表达水平选择性剪接事件
13、识别和剪接异构体表达水平选择性剪接事件识别和剪接异构体表达水平推断推断推断推断只要测序深度足够深,就能检测到所有转录本只要测序深度足够深,就能检测到所有转录本只要测序深度足够深,就能检测到所有转录本只要测序深度足够深,就能检测到所有转录本的全部序列,包括来自剪接接合区的序列的全部序列,包括来自剪接接合区的序列的全部序列,包括来自剪接接合区的序列的全部序列,包括来自剪接接合区的序列。Tophat Tophat 等软件定位剪接接合区读段的策略能标定出剪接事等软件定位剪接接合区读段的策略能标定出剪接事等软件定位剪接接合区读段的策略能标定出剪接事等软件定位剪接接合区读段的策略能标定出剪接事件中的两个剪
14、接位点:供体位点和受体位点件中的两个剪接位点:供体位点和受体位点件中的两个剪接位点:供体位点和受体位点件中的两个剪接位点:供体位点和受体位点。通过通过通过通过比较供体位点和受体位点的组合,就能识别选择性比较供体位点和受体位点的组合,就能识别选择性比较供体位点和受体位点的组合,就能识别选择性比较供体位点和受体位点的组合,就能识别选择性剪接事件剪接事件剪接事件剪接事件。进一步,通过对供体和受体位点的读段计数,进一步,通过对供体和受体位点的读段计数,进一步,通过对供体和受体位点的读段计数,进一步,通过对供体和受体位点的读段计数,结合外显子其他区域的读段数据,还能定量地计算结合外显子其他区域的读段数据
15、,还能定量地计算结合外显子其他区域的读段数据,还能定量地计算结合外显子其他区域的读段数据,还能定量地计算选择性剪接事件之间的比例。选择性剪接事件之间的比例。选择性剪接事件之间的比例。选择性剪接事件之间的比例。三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析第10页/共16页三、三、三、三、RNA-seqRNA-seqRNA-seqRNA-seq结果分析结果分析结果分析结果分析两类样本两类样本 RNA-seq 数据比较分析的框架数据比较分析的框架第11页/共16页四、四、四、四、RNA-seqRNA-seqRNA-seqRNA-seq技术应
16、用技术应用技术应用技术应用1 1、转录本结构研究、转录本结构研究、转录本结构研究、转录本结构研究 利用单碱基分辨率的利用单碱基分辨率的利用单碱基分辨率的利用单碱基分辨率的RNA-SeqRNA-Seq技术可极大技术可极大技术可极大技术可极大地丰富基因注释的很多方面内容地丰富基因注释的很多方面内容地丰富基因注释的很多方面内容地丰富基因注释的很多方面内容,包括包括包括包括 5/3 5/3边界边界边界边界鉴定、鉴定、鉴定、鉴定、UTRsUTRs区域鉴定以及新的转录区域鉴定等。区域鉴定以及新的转录区域鉴定等。区域鉴定以及新的转录区域鉴定等。区域鉴定以及新的转录区域鉴定等。RNA-SeqRNA-Seq还可
17、对可变剪接还可对可变剪接还可对可变剪接还可对可变剪接(Alternative splicing)(Alternative splicing)进行定量研究。进行定量研究。进行定量研究。进行定量研究。2 2、转录本变异研究、转录本变异研究、转录本变异研究、转录本变异研究 在发现序列差异方面,如融合基因鉴定、在发现序列差异方面,如融合基因鉴定、在发现序列差异方面,如融合基因鉴定、在发现序列差异方面,如融合基因鉴定、编码序列多态性研究等,编码序列多态性研究等,编码序列多态性研究等,编码序列多态性研究等,RNA-seqRNA-seq也具有很大的也具有很大的也具有很大的也具有很大的潜力。潜力。潜力。潜力。
18、第12页/共16页四、四、四、四、RNA-seqRNA-seqRNA-seqRNA-seq技术应用技术应用技术应用技术应用3 3、非编码区域功能研究、非编码区域功能研究、非编码区域功能研究、非编码区域功能研究 转录组学研究的一个重要方面就是发现和转录组学研究的一个重要方面就是发现和转录组学研究的一个重要方面就是发现和转录组学研究的一个重要方面就是发现和分析分析分析分析 ncRNA ncRNA,在表观遗传、转录及转录后等多,在表观遗传、转录及转录后等多,在表观遗传、转录及转录后等多,在表观遗传、转录及转录后等多个层面调控基因表达。个层面调控基因表达。个层面调控基因表达。个层面调控基因表达。4 4
19、、基因表达水平研究、基因表达水平研究、基因表达水平研究、基因表达水平研究RNA-SeqRNA-Seq一个特别强大的优势是它可以捕捉一个特别强大的优势是它可以捕捉一个特别强大的优势是它可以捕捉一个特别强大的优势是它可以捕捉不同组织或状态下的转录组动态变化而无需对数不同组织或状态下的转录组动态变化而无需对数不同组织或状态下的转录组动态变化而无需对数不同组织或状态下的转录组动态变化而无需对数据集进行复杂的标准化。据集进行复杂的标准化。据集进行复杂的标准化。据集进行复杂的标准化。第13页/共16页总结总结总结总结高通量测序技术的应用面非常广,高通量测序技术的应用面非常广,高通量测序技术的应用面非常广,高通量测序技术的应用面非常广,RNA-seq RNA-seq 只是其中一个方面,除此之外,基因组的从头测只是其中一个方面,除此之外,基因组的从头测只是其中一个方面,除此之外,基因组的从头测只是其中一个方面,除此之外,基因组的从头测序和重测序序和重测序序和重测序序和重测序 、染色质免疫沉淀测序、甲基化测、染色质免疫沉淀测序、甲基化测、染色质免疫沉淀测序、甲基化测、染色质免疫沉淀测序、甲基化测序等技术都同样有着广泛的应用。序等技术都同样有着广泛的应用。序等技术都同样有着广泛的应用。序等技术都同样有着广泛的应用。第14页/共16页第15页/共16页
限制150内