利用BLAST工具寻找新基因.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《利用BLAST工具寻找新基因.ppt》由会员分享,可在线阅读,更多相关《利用BLAST工具寻找新基因.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、利用利用BLAST工具寻找新基因工具寻找新基因生物工程二班生物工程二班2010472020820104720208郭广兴郭广兴前前 言言 这篇这篇PPT从一个例子出发,介绍了从一个例子出发,介绍了 如何如何利用利用BLAST工具寻找新基因,以供大家参考。工具寻找新基因,以供大家参考。由于本人能力有限,由于本人能力有限,其中可能有部分观点理其中可能有部分观点理解不到位,介绍的也不够详细,解不到位,介绍的也不够详细,仅供参考仅供参考。不足之处还请大家批评指正不足之处还请大家批评指正。本人保留对这篇本人保留对这篇PPT的所有的所有权利(权利(All rights reservedAll rights
2、 reserved),仅),仅限于交流、学习之用,未经允许,限于交流、学习之用,未经允许,严禁分享、上传,希望大家尊重严禁分享、上传,希望大家尊重他人的劳动成果,谢谢!他人的劳动成果,谢谢!发现新基因发现新基因 发现新基因是指在数据新基因是指在数据库中中发现一些一些还没有被注没有被注释的的DNA序列。序列。新基因序列,新基因序列,是指在数据是指在数据库中中已已经存在,但在蛋白存在,但在蛋白质水平上水平上还没有完全匹配的基因序列,没有完全匹配的基因序列,或者是在蛋白或者是在蛋白质水平上也有完水平上也有完全匹配的但却来自于另一个物全匹配的但却来自于另一个物种的基因序列。种的基因序列。BLASTBL
3、AST(Basic Local Alignment Search Tool)是一是一套在蛋白质数据库或套在蛋白质数据库或DNA数据库中进行相似数据库中进行相似性比较的分析工具。性比较的分析工具。方法步骤方法步骤 首先从一个已知的蛋白质序列出发,搜首先从一个已知的蛋白质序列出发,搜索一个索一个DNA数据库;找到尚未注释的、与查数据库;找到尚未注释的、与查询序列相关的序列匹配,得到新发现的基因询序列相关的序列匹配,得到新发现的基因和对应的蛋白质;采用多种措施来验证匹配和对应的蛋白质;采用多种措施来验证匹配结果,证实确实发现了新的基因。结果,证实确实发现了新的基因。方法步骤方法步骤方法步骤方法步骤数
4、据库和工具数据库和工具我采用的我采用的数据库为美国国立生物技术信息中数据库为美国国立生物技术信息中心(心(The National Center for Biotechnology Information 网址网址:)GenBank数据库。数据库。使用使用的的工具为工具为BLAST(Basic Local Alignment Search Tool 网址:)。网址:)。案例分析案例分析Step1:选择一条已知蛋白序列:选择一条已知蛋白序列 这里给大家的例子是这里给大家的例子是视黄醇结合蛋白(视黄醇结合蛋白(retinol-binding protein)。视黄醇结合蛋白是血液中视黄醇结合蛋白是
5、血液中维维生素的转运蛋白生素的转运蛋白,由肝脏合成、广,由肝脏合成、广泛分布于血液、脑脊液、尿液及其泛分布于血液、脑脊液、尿液及其他体液中。测定视黄醇结合蛋白能他体液中。测定视黄醇结合蛋白能早期发现肾小管的功能损害,并能早期发现肾小管的功能损害,并能灵敏反映肾近曲小管的损害程度,灵敏反映肾近曲小管的损害程度,还可作为肝功能早期损害和监护治还可作为肝功能早期损害和监护治疗的指标。疗的指标。案例分析案例分析视黄醇结合蛋白(人类)视黄醇结合蛋白(人类)retinol-binding proteinHomosapiens1246aaproteinAccession:AAA59188.1GI:30707
6、5在在NCBI的搜索栏中搜索的搜索栏中搜索“Protein”中的中的“retinol-binding protein”,如图如图点击进入人类视黄醇结点击进入人类视黄醇结合蛋白的详情页面,会合蛋白的详情页面,会发现该基因的发现该基因的FEATURES注释的很注释的很详细,包括详细,包括source、Protein、Region、Site、CDS等属性,可等属性,可以和后面的新基因进行以和后面的新基因进行对比。对比。案例分析案例分析Step2:将选择的蛋白质序列用:将选择的蛋白质序列用TBLASTN进行进行搜索搜索 BLAST主页主页案例分析案例分析选择选择HTGS,EST,GSS 或者特定物种的
7、基因序列或者特定物种的基因序列案例分析案例分析搜索结果返回页面搜索结果返回页面:图中三项依次是图中三项依次是图表摘要、描述和图表摘要、描述和比对信息比对信息,这三项在返回的页面中,这三项在返回的页面中默认是展开的,这里为了在同一截默认是展开的,这里为了在同一截屏显示,把这三项手动折叠了屏显示,把这三项手动折叠了案例分析案例分析搜索结果返回页面搜索结果返回页面:接下页接下页案例分析案例分析搜索结果返回页面搜索结果返回页面:参考文献参考文献上说这些匹配的上说这些匹配的蛋白质可能:蛋白质可能:在一些数据库中得到的结在一些数据库中得到的结果完全匹配或者几乎完全匹果完全匹配或者几乎完全匹配。这就不是新基
8、因了。配。这就不是新基因了。一些数据库的结果也非常一些数据库的结果也非常匹配,而该数据库中编码这匹配,而该数据库中编码这些蛋白质的些蛋白质的DNA还没有被还没有被注释过。这种情况可能是新注释过。这种情况可能是新基因。基因。一些搜索结果并不是非常一些搜索结果并不是非常匹配。这就需要依赖经验来匹配。这就需要依赖经验来判断哪些数据库中的匹配是判断哪些数据库中的匹配是真正的匹配,哪些不是。真正的匹配,哪些不是。个人认为个人认为逐个序列的验证逐个序列的验证是最经典而有效的方法是最经典而有效的方法:具体来说,就是点击最右边具体来说,就是点击最右边一列一列Accession,进入该基,进入该基因的详情页面,
9、主要看因的详情页面,主要看FEATURES,如果,如果FEATURES 下面只有下面只有source(有的还有(有的还有gap 或或misc_feature等等),不含),不含有有Protein、Region、Site、CDS等注释属性,则可初步等注释属性,则可初步判定它是未被注释的新基因。判定它是未被注释的新基因。按照上述方法初步判定,除了下图中标注出按照上述方法初步判定,除了下图中标注出的的6个基因,其他的均有可能是新基因个基因,其他的均有可能是新基因案例分析案例分析此处选择此处选择 ACSSTION为为CU539131.1的的Human gut metagenome(人类肠道宏基因组)(
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 利用 BLAST 工具 寻找 基因
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内