《转录组测序技术原理及应用幻灯片.ppt》由会员分享,可在线阅读,更多相关《转录组测序技术原理及应用幻灯片.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、转录组测序技术原理及应用第1页,共52页,编辑于2022年,星期三遗传的中心法则遗传的中心法则基因组基因组转录组转录组表观遗传组表观遗传组蛋白组层次蛋白组层次第2页,共52页,编辑于2022年,星期三什么是转录组?All transcriptsAll mRNAs第3页,共52页,编辑于2022年,星期三RNA是解读基因组的关键是解读基因组的关键RNAProteinPhenotypePhenotypeGenotypeGenotype DNA第4页,共52页,编辑于2022年,星期三测序技术测序技术RNA-SeqRNA-SeqSmall RNA测序测序降解组测序降解组测序Non-coding RN
2、A测序测序研究对象研究对象mRNASmall RNAmRNANon-coding RNA鉴定新分子鉴定新分子OOOO表达谱研究表达谱研究OOOO基因结构分析基因结构分析O/XXXOEST 测序测序O/XXXX 筛选分子标记筛选分子标记 OOOX转录融合基因转录融合基因表达表达O/XXXXRNA 测序技术测序技术第5页,共52页,编辑于2022年,星期三Workflow of RNA-SeqWorkflow of RNA-Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析第6页,共52页,编辑于2022年,星期三To
3、tal RNA样品检测样品检测 Agilent 2200 检测检测OD260/280:1.82.2 RNA 28S:18S 1.0;RIN7 新型安捷伦2200 TapeStation系统是新一代测序(新一代测序(NGS)、生物微阵列芯片分析和qPCR工作流程以及蛋白质纯化和抗体生产过程中对生物样品进行质量控制(质量控制(QC)的理想解决方案。可扩展的通量16联或96孔微量滴定板快速得到结果平均每个样品只需一分钟便可获得结果使用简单可直接使用的ScreenTape预制胶条简化了工作流程样品用量少每次运行仅需要不到2ul样品第7页,共52页,编辑于2022年,星期三检测报告检测报告-合格样品合格
4、样品棉铃虫/果蝇第8页,共52页,编辑于2022年,星期三检测报告检测报告-不合格样品不合格样品第9页,共52页,编辑于2022年,星期三Workflow of RNA-SeqWorkflow of RNA-Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析第10页,共52页,编辑于2022年,星期三真核真核mRNA的纯化的纯化mRNA的纯化主要通过的磁珠与生物素吸附原理从而分离纯化Oligo(dT)25磁珠纯化原理主要是mRNA的3的poly A与磁珠在bindingbuffer的作用下相结合。磁珠通过MPC(磁
5、分离器)从溶液中分离出来。mRNA与磁珠结合后,再用Tris-HCL在加热条件下解离洗脱到溶液中。链霉亲合素包被磁珠链霉亲合素包被磁珠+生物素标记生物素标记Oligo(dT)25+poly(A)第11页,共52页,编辑于2022年,星期三原核原核mRNA的纯化的纯化Ambion MICROExpress KitLNA扣锁型探针扣锁型探针第12页,共52页,编辑于2022年,星期三mRNA反转录反转录-fragment+RT纯化过的mRNA样品加入1 l的fragment buffer 70作用1.5min。加入1l的stop buffer终止反应。加入沉淀剂(NaAc 糖原 无水乙醇)沉淀产物
6、。RTds cDNA第13页,共52页,编辑于2022年,星期三末端修复(防止自连)cDNA 3末端加AAdapter连接第14页,共52页,编辑于2022年,星期三第一天第一天消化消化DNAmRNA的分离的分离mRNA的打断的打断cDNA的合成的合成第二天第二天末端修复末端修复加接头加接头胶回收胶回收3端加端加A第三天第三天PCRPCR胶回收胶回收 文库制备文库制备文库质量检测:文库质量检测:Aligent2100:片段大小、纯度、浓度qPCR:片段大小、浓度手工检测:跑胶验证。第15页,共52页,编辑于2022年,星期三Workflow of RNA-SeqWorkflow of RNA-
7、Seq样品检测样品检测文库制备文库制备Cluster StationIllumina Sequencing生物信息分析生物信息分析第16页,共52页,编辑于2022年,星期三ApplicationRNA-Seq(单端测序单端测序-Quantification)RNA-Seq(双端测序双端测序-Transcriptome)Expression-profilingAlternative SplicingFusion GeneSNP detectionHiSeq2500Applications of RNA-Seq17第17页,共52页,编辑于2022年,星期三RNA-Seq(Transcripto
8、me)第18页,共52页,编辑于2022年,星期三Workflow of RNA-SeqWorkflow of RNA-Seq(Transcriptome)(Transcriptome)生物信息学分析生物信息学分析第19页,共52页,编辑于2022年,星期三RNA-Seq(Transcriptome)Characterize the transcriptome in unparalleled detailTechnique 220RNA-Seq(De novo transcriptome assembly)RNA-Seq(Transcriptome resequencing)第20页,共52页
9、,编辑于2022年,星期三RNA-Seq(De novo transcriptome assembly)文库构建文库构建测序测序组装组装第21页,共52页,编辑于2022年,星期三De novo assemble a transcriptome组装流程组装流程第22页,共52页,编辑于2022年,星期三数据产出统计及测序数据的成分和质量评估组装结果分析(Contig长度分布、Scaffold长度分布、Unigene长度分布)Unigene(transcript)功能注释Unigene的GO分类Unigene代谢通路分析预测编码蛋白框(CDS)Unigene表达差异分析(两个或两个以上样品)Un
10、igene在样品间的差异GO分类(需两个或两个以上样品)和Pathway富集性分析De novo assembly transcriptome 信息分析主要信息分析主要内容内容:第23页,共52页,编辑于2022年,星期三De novo assembly transcriptome信息分析流程信息分析流程第24页,共52页,编辑于2022年,星期三Unigenes的的GO 注注释释第25页,共52页,编辑于2022年,星期三Pathway 分析分析第26页,共52页,编辑于2022年,星期三RNA-Seq(Transcriptome resequencing)cDNA文库构建文库构建测序测序比
11、对到参考序列比对到参考序列第27页,共52页,编辑于2022年,星期三Transcriptome resequencing比对流程比对流程第28页,共52页,编辑于2022年,星期三比对统计基因表达注释基因差异表达分析基因结构优化可变剪接分析预测新转录本cSNP分析Transcriptome resequencing信息分析主要内容信息分析主要内容第29页,共52页,编辑于2022年,星期三Transcriptome resequencing信息分析流程信息分析流程第30页,共52页,编辑于2022年,星期三应用应用-优化转录组注释信息优化转录组注释信息l基因基因结结构构优优化化l可可变变剪接
12、剪接鉴鉴定定l基因融合基因融合鉴鉴定定lRNA水平水平SNP分析分析第31页,共52页,编辑于2022年,星期三GenomicintergenicregionReadsclusterPairedReadsdistribution优化基因结构优化基因结构鉴定新的转录本鉴定新的转录本Paired-End(PE)ReadsReads 比对到参考序列基因间区域比对到参考序列基因间区域第32页,共52页,编辑于2022年,星期三鉴定可变剪接(鉴定可变剪接(Alternative Splicing)exon1exon2exon3exon1exon2exon3exon1exon3commonreadsjun
13、ctionreadsmRNA第33页,共52页,编辑于2022年,星期三鉴定基因融合鉴定基因融合PairedReadsSingleReadsGene AGene B第34页,共52页,编辑于2022年,星期三分析分析RNA水平水平SNP转录组转录组重重测测序比序比对软对软件:件:SOAPDe novo 转录组测转录组测序序:组组装装软软件:件:SoapDenovo比比对软对软件:件:SoapSNP第35页,共52页,编辑于2022年,星期三36转录组研究技术横向比较转录组研究技术横向比较TechnologyTiling ArraycDNA or EST sequesing Transcript
14、ome SequencingPrincipleHybridizationSanger sequencingNext-GensequencingResolutionFrom several to 100Single baseSingle baseThroughputHighLowHighReliance on genomic sequenceYesNoIn some casesBackground noiseHighLowLowApplicationSimutaneously map transcribed regions and gene expressionYesLimited for ex
15、pressionYesDynamic range to quantify gene expression levelUp to a few-hundred foldNot practical 8,000-foldAbility to distinguish different isoforms and allelic expressionLimitedYesYes第36页,共52页,编辑于2022年,星期三转录组测序的优势转录组测序的优势RNA测序与芯片检测测序与芯片检测基因数比较基因数比较RNA测序与芯片测序与芯片检测基因的表达量分布检测基因的表达量分布Technique 1第37页,共52
16、页,编辑于2022年,星期三Genome Res 2010CaseCase 实验材料收集:实验材料收集:叶片,花序,果实,根 时间点:0,4,8,12,16,20和 24 h 将每个时间点采集的样品均匀混合 测序策略:测序策略:Illumina 测序,1G data第38页,共52页,编辑于2022年,星期三1.High light 2.Heat 3.Cold 4.Salt 5.Drought抗逆相关可变剪接抗逆相关可变剪接第39页,共52页,编辑于2022年,星期三外包膜蛋白外包膜蛋白16(AT2G28900)Intron-retentionControlLow Temperature Re
17、sistance低温胁迫相关的AS低温胁迫下这个内含子和对照相比被保留了下来,揭示了可变剪接有重要功能。第40页,共52页,编辑于2022年,星期三AS调节机制CCA1生物钟相关基因,例如调节气孔的开关等第41页,共52页,编辑于2022年,星期三RNA-SeqRNA-Seq单单端端测测序序(QuantificationQuantification)等同于等同于数字表达数字表达谱谱(DGE)(DGE)第42页,共52页,编辑于2022年,星期三Workflow of RNA-SeqWorkflow of RNA-Seq单端测序(单端测序(单端测序(单端测序(QuantificationQuan
18、tification)生物信息学分析生物信息学分析第43页,共52页,编辑于2022年,星期三RNA-Seq单端测序(单端测序(Quantification)生物信息分析内容生物信息分析内容v测测序数据序数据评评估估v筛选筛选差异表达基因差异表达基因v表达模式聚表达模式聚类类分析分析vGO 功能富集分析功能富集分析vPathway 富集分析富集分析v蛋白互作网络分析蛋白互作网络分析第44页,共52页,编辑于2022年,星期三RNA-Seq单端测序(单端测序(Quantification)信息分析流程)信息分析流程第45页,共52页,编辑于2022年,星期三RNA-Seq与基因芯片优缺点比较技技
19、术术优优点点缺点缺点RNA-seq1)检测基因数比基因芯片多25%2)定量准,可重复性高(重复相关系数0.99)3)数字化信号,无背景噪音,无交叉杂交4)高、低丰度基因高、低丰度基因均均可可检测检测5)不受研究物种限制,不受研究物种限制,模式生物和非模式生物均可检测6)数据可与数据可与时时俱俱进进,即随数据库更新而更新7)具有较好的分析兼容性,数据格式与芯片相同,可与芯片的分析软件兼容1)样本要求量比基因芯片多2)数据量大,需要具备一定的生物信息分析基础,才能更好的挖掘数据蕴含的丰富信息基因芯片1)平台应用较早2)信息分析软件较多3)有些平台要求样品量少1)检测灵敏度较低、重复性差、检测阈值较
20、狭窄2)有背景噪音,假阳性率1%3)受物种限制,只能受物种限制,只能检测检测部分模式生物部分模式生物4)受基因拷贝数限制,无法无法检测检测出低丰度基因出低丰度基因5)只能检测已知转录本,无法,无法检测检测出新出新转录转录本本6)受数据库数据所限,因探探针针依靠依靠现现有数据有数据库库或比较旧的版本的数据库来设计的,可能出现注注释释不不准确准确的情况第46页,共52页,编辑于2022年,星期三casecasePlant Physiology Plant Physiology Plant Physiology 201020102010取样:取样:选取在成熟季节开花后 5,10,和15个星期葡萄分别
21、代表葡萄果实成熟中的三个时期(post setting,veraison和ripening)数据量:数据量:超过59M reads数据,长度在36-44bp之间运用RNA-Seq技术对葡萄果实发育过程中复杂转录特征的研究。第47页,共52页,编辑于2022年,星期三表二表二 reads在基因组上的分布情况在基因组上的分布情况表一表一 测序数据测序数据葡萄葡萄RNA-Seq单端测序单端测序第48页,共52页,编辑于2022年,星期三浆果发育三个阶段浆果发育三个阶段共有、特有基因表达分布图共有、特有基因表达分布图基因表达量分布基因表达量分布第49页,共52页,编辑于2022年,星期三表达簇的分类分布情况表达簇的分类分布情况差异表达的基因GO功能注释-分成了19个功能类群-按照基因在三个不同时期的表达趋势进行分类,分成8个cluster。将基因的表达和它调控的一个生理功能联系在了一起。第50页,共52页,编辑于2022年,星期三RNA-Seq对浆果对浆果标记基因的验证标记基因的验证用RNA-Seq的数据去验证已报到的十个浆果成熟期的mark基因。事实上从其它方法得到的数据去验证了RNA-Seq数据的准确性。第51页,共52页,编辑于2022年,星期三RNA-Seq结果与RT-PCR具有高度一致性RT-PCR验证结果验证结果第52页,共52页,编辑于2022年,星期三
限制150内