欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    利用BLAST工具寻找新基因.ppt

    • 资源ID:63735238       资源大小:2.33MB        全文页数:40页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    利用BLAST工具寻找新基因.ppt

    利用利用BLAST工具寻找新基因工具寻找新基因生物工程二班生物工程二班2010472020820104720208郭广兴郭广兴前前 言言 这篇这篇PPT从一个例子出发,介绍了从一个例子出发,介绍了 如何如何利用利用BLAST工具寻找新基因,以供大家参考。工具寻找新基因,以供大家参考。由于本人能力有限,由于本人能力有限,其中可能有部分观点理其中可能有部分观点理解不到位,介绍的也不够详细,解不到位,介绍的也不够详细,仅供参考仅供参考。不足之处还请大家批评指正不足之处还请大家批评指正。本人保留对这篇本人保留对这篇PPT的所有的所有权利(权利(All rights reservedAll rights reserved),仅),仅限于交流、学习之用,未经允许,限于交流、学习之用,未经允许,严禁分享、上传,希望大家尊重严禁分享、上传,希望大家尊重他人的劳动成果,谢谢!他人的劳动成果,谢谢!发现新基因发现新基因 发现新基因是指在数据新基因是指在数据库中中发现一些一些还没有被注没有被注释的的DNA序列。序列。新基因序列,新基因序列,是指在数据是指在数据库中中已已经存在,但在蛋白存在,但在蛋白质水平上水平上还没有完全匹配的基因序列,没有完全匹配的基因序列,或者是在蛋白或者是在蛋白质水平上也有完水平上也有完全匹配的但却来自于另一个物全匹配的但却来自于另一个物种的基因序列。种的基因序列。BLASTBLAST(Basic Local Alignment Search Tool)是一是一套在蛋白质数据库或套在蛋白质数据库或DNA数据库中进行相似数据库中进行相似性比较的分析工具。性比较的分析工具。方法步骤方法步骤 首先从一个已知的蛋白质序列出发,搜首先从一个已知的蛋白质序列出发,搜索一个索一个DNA数据库;找到尚未注释的、与查数据库;找到尚未注释的、与查询序列相关的序列匹配,得到新发现的基因询序列相关的序列匹配,得到新发现的基因和对应的蛋白质;采用多种措施来验证匹配和对应的蛋白质;采用多种措施来验证匹配结果,证实确实发现了新的基因。结果,证实确实发现了新的基因。方法步骤方法步骤方法步骤方法步骤数据库和工具数据库和工具我采用的我采用的数据库为美国国立生物技术信息中数据库为美国国立生物技术信息中心(心(The National Center for Biotechnology Information 网址网址:)GenBank数据库。数据库。使用使用的的工具为工具为BLAST(Basic Local Alignment Search Tool 网址:)。网址:)。案例分析案例分析Step1:选择一条已知蛋白序列:选择一条已知蛋白序列 这里给大家的例子是这里给大家的例子是视黄醇结合蛋白(视黄醇结合蛋白(retinol-binding protein)。视黄醇结合蛋白是血液中视黄醇结合蛋白是血液中维维生素的转运蛋白生素的转运蛋白,由肝脏合成、广,由肝脏合成、广泛分布于血液、脑脊液、尿液及其泛分布于血液、脑脊液、尿液及其他体液中。测定视黄醇结合蛋白能他体液中。测定视黄醇结合蛋白能早期发现肾小管的功能损害,并能早期发现肾小管的功能损害,并能灵敏反映肾近曲小管的损害程度,灵敏反映肾近曲小管的损害程度,还可作为肝功能早期损害和监护治还可作为肝功能早期损害和监护治疗的指标。疗的指标。案例分析案例分析视黄醇结合蛋白(人类)视黄醇结合蛋白(人类)retinol-binding proteinHomosapiens1246aaproteinAccession:AAA59188.1GI:307075在在NCBI的搜索栏中搜索的搜索栏中搜索“Protein”中的中的“retinol-binding protein”,如图如图点击进入人类视黄醇结点击进入人类视黄醇结合蛋白的详情页面,会合蛋白的详情页面,会发现该基因的发现该基因的FEATURES注释的很注释的很详细,包括详细,包括source、Protein、Region、Site、CDS等属性,可等属性,可以和后面的新基因进行以和后面的新基因进行对比。对比。案例分析案例分析Step2:将选择的蛋白质序列用:将选择的蛋白质序列用TBLASTN进行进行搜索搜索 BLAST主页主页案例分析案例分析选择选择HTGS,EST,GSS 或者特定物种的基因序列或者特定物种的基因序列案例分析案例分析搜索结果返回页面搜索结果返回页面:图中三项依次是图中三项依次是图表摘要、描述和图表摘要、描述和比对信息比对信息,这三项在返回的页面中,这三项在返回的页面中默认是展开的,这里为了在同一截默认是展开的,这里为了在同一截屏显示,把这三项手动折叠了屏显示,把这三项手动折叠了案例分析案例分析搜索结果返回页面搜索结果返回页面:接下页接下页案例分析案例分析搜索结果返回页面搜索结果返回页面:参考文献参考文献上说这些匹配的上说这些匹配的蛋白质可能:蛋白质可能:在一些数据库中得到的结在一些数据库中得到的结果完全匹配或者几乎完全匹果完全匹配或者几乎完全匹配。这就不是新基因了。配。这就不是新基因了。一些数据库的结果也非常一些数据库的结果也非常匹配,而该数据库中编码这匹配,而该数据库中编码这些蛋白质的些蛋白质的DNA还没有被还没有被注释过。这种情况可能是新注释过。这种情况可能是新基因。基因。一些搜索结果并不是非常一些搜索结果并不是非常匹配。这就需要依赖经验来匹配。这就需要依赖经验来判断哪些数据库中的匹配是判断哪些数据库中的匹配是真正的匹配,哪些不是。真正的匹配,哪些不是。个人认为个人认为逐个序列的验证逐个序列的验证是最经典而有效的方法是最经典而有效的方法:具体来说,就是点击最右边具体来说,就是点击最右边一列一列Accession,进入该基,进入该基因的详情页面,主要看因的详情页面,主要看FEATURES,如果,如果FEATURES 下面只有下面只有source(有的还有(有的还有gap 或或misc_feature等等),不含),不含有有Protein、Region、Site、CDS等注释属性,则可初步等注释属性,则可初步判定它是未被注释的新基因。判定它是未被注释的新基因。按照上述方法初步判定,除了下图中标注出按照上述方法初步判定,除了下图中标注出的的6个基因,其他的均有可能是新基因个基因,其他的均有可能是新基因案例分析案例分析此处选择此处选择 ACSSTION为为CU539131.1的的Human gut metagenome(人类肠道宏基因组)(人类肠道宏基因组)案例分析案例分析Step3:用数据库搜索来判断它是否是真的新:用数据库搜索来判断它是否是真的新蛋白质蛋白质用CU539131.1进行BLASTP搜索,搜索的结果表明它和其它一些蛋白质相当近源,但它在GenBank数据库中还没有被注释过。案例分析案例分析具体措施:具体措施:将将CU539131.1在在Alignments(比对信(比对信息)息)中出现的序列(中出现的序列(红色标出部分红色标出部分)作为输入项在作为输入项在一个一个非冗余非冗余(nr)数据库数据库中中逐一逐一进行进行BLASTP搜索。搜索。案例分析案例分析 BLAST主页主页案例分析案例分析在这里也可切换在这里也可切换BLAST的不同功能的不同功能CU539131.1的第一条的第一条sbjct序列序列非冗余的蛋白质序列库非冗余的蛋白质序列库(nr)案例分析案例分析BLASTP结果:结果:案例分析案例分析 在此页面中用在此页面中用“页面查找页面查找”功能功能(Ctrl+F),看页面中是否有属于),看页面中是否有属于Human gut metagenome(人类肠道宏基因组)的(人类肠道宏基因组)的蛋白。结果显示蛋白。结果显示“未找到未找到”。(当然,此处也可以在当然,此处也可以在Descriptions中逐个中逐个检查检查)用用CU539131.1蛋白质进行蛋白质进行BLASTP搜搜索的结果表明它和其它一些蛋白质相当近源,索的结果表明它和其它一些蛋白质相当近源,但它在但它在GenBank数据库中还没有被注释过。数据库中还没有被注释过。在在BLASTP结果中,虽然有许多与结果中,虽然有许多与CU539131.1高度高度 匹配的蛋白,甚至匹配的蛋白,甚至有有100%匹配的蛋白,但是这些蛋白都不属于匹配的蛋白,但是这些蛋白都不属于Human gut metagenome(人类肠道宏基因组)。也就是说,虽然有和我们发现的(人类肠道宏基因组)。也就是说,虽然有和我们发现的蛋白具有一模一样特征的蛋白,但是他们是通过其他物种被发现和被注蛋白具有一模一样特征的蛋白,但是他们是通过其他物种被发现和被注释的,我们发现的这个物种的这个蛋白还没有被注释,那么这个蛋白质释的,我们发现的这个物种的这个蛋白还没有被注释,那么这个蛋白质所对应的基因就是没有被注释的新基因。(这是我的理解,言不尽意,所对应的基因就是没有被注释的新基因。(这是我的理解,言不尽意,大家认真思考)大家认真思考)案例分析案例分析接下来我们把接下来我们把 CU539131.1的其他几个的其他几个sbjct序列逐个进行序列逐个进行BLASTP,步骤同上。,步骤同上。案例分析案例分析考虑到最后一个考虑到最后一个sbjct序列太短,没有参考价序列太短,没有参考价值,值,个人认为个人认为可以忽略。可以忽略。案例分析案例分析 CU539131.1的三个主要的三个主要sbjct片段片段 验证验证结果均未找到该物种的相同蛋白,从某种意结果均未找到该物种的相同蛋白,从某种意义上,我们就可以确定义上,我们就可以确定CU539131.1所对应的所对应的基因是一个新基因。基因是一个新基因。案例分析案例分析Step4:找到:找到 CU539131.1对应的基因,开展对应的基因,开展后续研究工作后续研究工作这个基因还是最近提交到数据库的这个基因还是最近提交到数据库的在该基因的在该基因的FEATURES下,只有下,只有source一项,一项,可以和人的是视黄醇结可以和人的是视黄醇结合蛋白基因对比,新基合蛋白基因对比,新基因的特征还是很明显的。因的特征还是很明显的。点击点击FASTA可获取该基因的可获取该基因的FASTA格式格式FASTA格式:格式:类似的类似的视黄醇结合蛋白(猪)视黄醇结合蛋白(猪)retinol-binding proteinSusscrofa201aaproteinAccession:AAA31113.1GI:164633在在NCBI的搜索栏中搜索的搜索栏中搜索“Protein”中的中的“retinol-binding protein”,如图如图 按照上述方法步按照上述方法步骤进行探索,发现新骤进行探索,发现新基因是非常容易的,基因是非常容易的,大家加油!大家加油!思考与讨论思考与讨论 示例中发现的新基因存在于人类肠道的示例中发现的新基因存在于人类肠道的宏基因组中,宏基因组中,宏基因组宏基因组(Metagenome)(也称也称微生物环境基因组微生物环境基因组 Microbial Environmental Genome,或元基因组或元基因组)。是。是由由 Handelsman 等等 1998 年提出的新名词年提出的新名词,其定义为其定义为“the genomes of the total microbiota found in nature”,即即生境中全生境中全部微小生物遗传物质的总和部微小生物遗传物质的总和。思考与讨论思考与讨论 如果人类如果人类 肠道的宏基因组可以产生与视黄醇结合蛋白类肠道的宏基因组可以产生与视黄醇结合蛋白类似的有转运维生素功能的蛋白质产物,那么,它会对人体有似的有转运维生素功能的蛋白质产物,那么,它会对人体有什么影响呢?什么影响呢?我们可以大胆推测,我们可以大胆推测,一方面一方面,维生素等营养物质大都是,维生素等营养物质大都是在小肠被机体吸收的,如果肠道内存在在小肠被机体吸收的,如果肠道内存在 由由CU539131.1表达表达的具有转运维生素功能的分泌型蛋白,那么,这些蛋白质有的具有转运维生素功能的分泌型蛋白,那么,这些蛋白质有可能有利于肠道对维生素的摄取;可能有利于肠道对维生素的摄取;另一方面另一方面,该蛋白质是由,该蛋白质是由微生物菌群产生的,很有可能它会辅助微生物菌体摄取维生微生物菌群产生的,很有可能它会辅助微生物菌体摄取维生素,其结果可能是造成机体本该摄取的维生素的量降低,危素,其结果可能是造成机体本该摄取的维生素的量降低,危害人体健康。我们可不可以改造它的这一特性为我们所用。害人体健康。我们可不可以改造它的这一特性为我们所用。当然这就需要进一步深入的当然这就需要进一步深入的 研究了,但我想说的是如研究了,但我想说的是如果在找到一个新基因之后,能够引发这样的思考,这才真正果在找到一个新基因之后,能够引发这样的思考,这才真正的体现出了寻找新基因的意义。的体现出了寻找新基因的意义。思考与讨论思考与讨论 作为新基因寻找的第一步,起始蛋白的作为新基因寻找的第一步,起始蛋白的选择是至关重要的。选择的是否得当将严重选择是至关重要的。选择的是否得当将严重影响到新基因的发现与否。影响到新基因的发现与否。使用多种方法以及多种数据库使用多种方法以及多种数据库也会提高新基因检出的成功率。不同也会提高新基因检出的成功率。不同网站提供同一类型的服务时,基于不网站提供同一类型的服务时,基于不同的实现方法,且这些方法大都根据同的实现方法,且这些方法大都根据不同的数据集构造并测试,因此可以不同的数据集构造并测试,因此可以综合不同方法的结果进行应用,以提综合不同方法的结果进行应用,以提高结果的高结果的准确准确性和可信度。性和可信度。参考文献参考文献作作 者:者:不详不详作者单位:作者单位:华中科技大学华中科技大学 生命科学与生命科学与 技术学院技术学院 成稿日期:成稿日期:2011年年1月月6日日原文链接:原文链接:ReferenceThank you!

    注意事项

    本文(利用BLAST工具寻找新基因.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开