欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    生物信息学高通量测序技术和数据分析陈润生院士省公共课一等奖全国赛课获奖课件.pptx

    • 资源ID:97766682       资源大小:2.66MB        全文页数:45页
    • 资源格式: PPTX        下载积分:8金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要8金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物信息学高通量测序技术和数据分析陈润生院士省公共课一等奖全国赛课获奖课件.pptx

    生物信息学陈小伟中国科学院生物物理研究所.09.30高通量测序技术及数据分析介绍第1页高通量测序技术及数据分析介绍背景介绍第一代测序技术第二代(高通量)测序技术基因芯片与高通量测序比较高通量测序技术应用高通量测序数据分析概览高通量测序数据质量评定与过滤基因组测序RNA-seqChIP-seqUCSC Genome Bioinformatics第2页背景介绍第3页背景介绍第一代测序技术Sanger测序法链终止法双脱氧终止法1975年Transcriptionhttp:/ or Illumina 1.8 and later.UsingaPhredscaleencodedusingASCII33to93.ThisisthestandardforfastqformatsexceptfortheearlyIlluminadataformats(thischangedwithversion1.8oftheIlluminaPipeline).Illumina Pipeline 1.2 and earlier.UsingaSolexa/Illuminascale(-5to40)usingASCII59to104.TheWorkbenchautomaticallyconvertsthesequalityscorestothePhredscaleonimportinordertoensureacommonscaleforanalysesacrossdatasetsfromdifferentplatforms(seedetailsontheconversionnexttothesamplebelow).Illumina Pipeline 1.3 and 1.4.UsingaPhredscaleusingASCII64to104.Illumina Pipeline 1.5 to 1.7.UsingaPhredscaleusingASCII64to104.Values0()and1(A)arenotusedanymore.Value2(B)hasspecialmeaningandisusedasatrimclipping.ThismeansthatwhenselectingIlluminaPipeline1.5andlater,thereadsaretrimmedwhenaBisencounteredintheinputfileiftheTrimreadsoptionischecked.363939393939393939393839393636343429312202019191938383836363636363630323535第9页基因芯片与高通量测序比较第10页芯片与测序比较基因芯片约历史,技术比较成熟,成本相对较低原理探针,互补配正确标准靶序列用荧光标识经过荧光强度间接反应靶序列数量应用检测已知基因表示水平检测SNP位点基因型检测CNV第11页芯片与测序比较高通量测序约历史,发展快速,成本逐步降低原理边合成边测序碱基用荧光基团标识直接测定碱基序列应用全基因组测序转录组测序(smallRNAseq,RNA-seq),能够检测已知基因表示水平,能够发觉全新转录本ChIP-seqCLIP-seq,第12页芯片与测序比较用高通量测序技术和基因芯片技术检测基因表示Malone,J.H.,andOliver,B.().Microarrays,deepsequencingandthetruemeasureofthetranscriptome.BMCBiol9,34.第13页高通量测序技术应用第14页测序应用高通量测序数据分析概览第15页测序应用QualityAssessmentRawDataFastQC;fastx_quality_statsRemoveadaptor/linkerfastx_trimmerfastx_clipperSplitaccordingtobarcodefastx_barcode_splitter.plfastx_trimmerQualityControlfastq_quality_trimmerfastq_quality_filterFurtherAnalysis高通量测序数据质量评定与过滤FastQCFASTX-Toolkit第16页测序应用全基因组de novo测序第一期:基因组调研图整体测序深度不低于20倍覆盖度。进行初步数据分析,对基因组大小,GC含量等做出初步评定,确定框架图梯度文库构建详细策略第二期:基因组框架图基因组覆盖度到达90%以上,基因区覆盖度到达95%以上,单碱基错误率到达1万分之一以内,整体测序覆盖深度不低于60倍覆盖度。同时对框架图进行基本基因注释和功效注释,和简单比较基因组学分析。第三期:基因组精细图基因组覆盖度到达95%以上,基因区覆盖度到达98%以上,单碱基错误率到达10万分之一以内,整体基因组覆盖度不低于100倍,ScaffoldN50大小不低于300Kb,对基因组精细图进行详细基因注释,基因功效注释,基因代谢路径注释和比较基因组学分析。第17页全基因组denovo测序数据拼接组装算法流程DeBruijnGraph(德布鲁因图)Read:AGATACTk-merAGAGATATATACACTAGAGATATATACACT测序应用第18页全基因组重测序(外显子组测序)算法流程发觉遗传变异(SNP,indel等)测序数据与参考基因组做比对重新校对测序质量打分每一个基因型先验概率对基因型做推断计算每一个基因型概率测序应用第19页测序应用转录组测序Small RNA seq检测small RNA(主要是miRNA)表示水平发觉新small RNARNA-seqPoly(A)检测蛋白质编码基因可变剪切体及表示水平Total RNA(except rRNA)检测mRNA及long noncoding RNA表示水平发觉新long noncoding RNA数据分析工具Bowtie(http:/bowtie- StevenSalzberg,UniversityofMarylandLiorPachter,UniversityofCalifornia,BerkeleyPostdoc JoinRinnslab,TheBroadInstitute第21页测序应用Overview of TopHat第22页测序应用SplicingJunctionsExon skippingorcassette exonMutually exclusive exonsAlternative donor siteAlternative acceptor siteIntron retention第23页测序应用TopHat:DiscoveringsplicejunctionsTopHatv1.0.7earlierseed-and-extendalignmentTopHatv1.0.7andlaterSupposeSisareadoflengthlthatcrossesasplicejunctionsplitsSintonsegments,n=floor(l/k),(k=25bp)mapsthesegmentss1,snwithBowtietothegenomesegmentssi,si+1thatbothaligntothegenome,butnotadjacentlyasegmentsifailstoalignbecauseitcrossesasplicejunction,butsi-1andsi+1arealigned.第24页测序应用TopHat:DiscoveringsplicejunctionsTopHatv1.0.7andlaterasegmentsifailstoalignbecauseitcrossesasplicejunction,butsi-1andsi+1arealigned.si-1Si+1si12345678910111213141516171819202122232425simbpk-mbpm=1,24m=12第25页测序应用OverviewofCufflinks第26页测序应用转录本拼接算法中包括到概念偏序关系与偏序集合 PartialorderandPartiallyorderedset偏序关系偏序(亦称半序)关系是定义在集合上一个序结构,是集合上满足一定条件二元关系。直观说,偏序指集合中仅有部分部分组员之间能够排序。全序关系在集合A中,存在偏序关系“”,假如对于任意aA,bA,有a b或b a,即A中每对元素都满足关系“”,则集合A上偏序“”是全序或线性次序。直观来说,全序指集合中全体组员之间都能够进行比较,能够排出全部元素次序。偏序集合指配置了偏序关系集合第27页测序应用转录本拼接算法中包括到概念偏序关系非严格偏序,自反偏序给定集合S,“”是S上二元关系,若“”满足:自反性自反性:aS,有aa;反对称性反对称性:a,bS,ab且ba,则a=b;传递性传递性:a,b,cS,ab且bc,则ac;则称“”是S上非严格偏序或自反偏序严格偏序,反自反偏序给定集合S,“”是S上二元关系,若“”满足:反自反性反自反性:aS,有aa;非对称性非对称性:a,bS,abba;传递性传递性:a,b,cS,ab且bc,则ac;则称“Blat第41页测序应用UCSC Genome Bioinformaticshttp:/genome.ucsc.edu/查看特定序列在基因组上位置第42页测序应用UCSC Genome Bioinformaticshttp:/genome.ucsc.edu/查看特定序列在基因组上位置Zoom out 3x第43页生物信息学入门几点提议学习在线生物信息学惯用工具了解惯用数据库学习一门编程语言学习linux操作系统第44页谢谢!第45页

    注意事项

    本文(生物信息学高通量测序技术和数据分析陈润生院士省公共课一等奖全国赛课获奖课件.pptx)为本站会员(知***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开