第三章序列分析PPT讲稿.ppt
《第三章序列分析PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第三章序列分析PPT讲稿.ppt(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章序列分析1第1页,共92页,编辑于2022年,星期二什么是什么是序列序列分析分析?拿到一个基因拿到一个基因/蛋白质序列蛋白质序列,我能做什么我能做什么?第2页,共92页,编辑于2022年,星期二q q在数据库中进行序列相似性搜索在数据库中进行序列相似性搜索在数据库中进行序列相似性搜索在数据库中进行序列相似性搜索q q基因结构分析基因结构分析基因结构分析基因结构分析/启动子序列分析启动子序列分析启动子序列分析启动子序列分析q qMotifMotifMotifMotif的寻找与序列的模式识别的寻找与序列的模式识别的寻找与序列的模式识别的寻找与序列的模式识别(含亚细胞定位含亚细胞定位含亚细胞定
2、位含亚细胞定位,跨膜区跨膜区跨膜区跨膜区的预测等的预测等的预测等的预测等序列分析的内容序列分析的内容 -为了功能的分析为了功能的分析为了功能的分析为了功能的分析第3页,共92页,编辑于2022年,星期二序列比对序列比对第第1节节第4页,共92页,编辑于2022年,星期二序列的相似性序列的相似性相似性相似性(similarity)(similarity)是指一种很直接的数量关系数量关系。比如说,A序列和B序列的相似性是80,或者4/5。这是个量化的关系。第5页,共92页,编辑于2022年,星期二序列的相似性序列的相似性相似性相似性(similarity)(similarity)通常在某些位点上有
3、一些氨基酸被另外一些化学物理特性相近的氨基酸所代替,这种突变可称为保守突变。将保守突变的因素考虑在内,就可以对两序列的相似程度打分,所得分值即代表其相似的程度。第6页,共92页,编辑于2022年,星期二一致性一致性(identity):两个蛋白质有一定数量的氨基酸在排比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们一致性为39.4%.MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG-PRNGTIKIYENPARTFTRPYSAKNITIYKEND第7页,共92页,编辑于2022年,星期二所以所以,相似性的数值一定比一致性的要相似
4、性的数值一定比一致性的要()大大 or 相等相等 or 小小第8页,共92页,编辑于2022年,星期二同源性同源性(homology)(homology):指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80都是不科学的。生物序列的同源性第9页,共92页,编辑于2022年,星期二相似性和同源性关系一般来说,序列间的相似性越高的话,它们是序列间的相似性越高的话,它们是同源序列的可能性就更高同源序列的可能性就更高。注意不要等价混用这两个名词。A序列和B序列的同源性为80,记住这种说
5、这种说法是错误的!法是错误的!第10页,共92页,编辑于2022年,星期二Porcine and human Bmal1 gene第11页,共92页,编辑于2022年,星期二Porcine and human Bmal1 gene第12页,共92页,编辑于2022年,星期二复习复习-第第1 1节节 序列比对序列比对判断题:判断题:1.1.A A序列和序列和B B序列的相似性是序列的相似性是8080.2.2.A A序列和序列和B B序列的一致性为序列的一致性为39.4%.39.4%.3.3.A A序列和序列和B B序列的同源性是序列的同源性是8080.4.4.相似性的数值一定比一致性的要大相似性
6、的数值一定比一致性的要大.5.5.两序列间的相似性越高,它们的同源性就越高两序列间的相似性越高,它们的同源性就越高.第13页,共92页,编辑于2022年,星期二第第2节节 Blast的应用的应用第14页,共92页,编辑于2022年,星期二Blast简介简介 BLAST 是基于是基于序列相似性序列相似性的的数据库搜索程序数据库搜索程序。BLAST是是“局部相似性基本查询工具局部相似性基本查询工具”(Basic Local Alignment Search Tool)的缩的缩写。写。第15页,共92页,编辑于2022年,星期二Blast程序评价序列相似性的两个数据程序评价序列相似性的两个数据Sco
7、re:使用打分矩阵对匹配的片段进行打分求和的结:使用打分矩阵对匹配的片段进行打分求和的结果,一般来说,匹配片段越长、果,一般来说,匹配片段越长、相似性越高则相似性越高则Score值值越大。越大。E value:氨基酸残基(或碱基)随机排列得到上述氨基酸残基(或碱基)随机排列得到上述Score值值的概率的大小。的概率的大小。E值越小表示越匹配。值越小表示越匹配。E=0表示完全配对,不存在随机配对表示完全配对,不存在随机配对。第16页,共92页,编辑于2022年,星期二主要的blast程序程序名程序名查询查询序列序列数据数据库库搜索方法搜索方法Blastn核酸核酸核酸核酸核酸序列搜索逐一核酸数据核
8、酸序列搜索逐一核酸数据库库中的中的序列序列Blastp蛋白蛋白质质蛋白蛋白质质蛋白蛋白质质序列搜索逐一蛋白序列搜索逐一蛋白质质数据数据库库中的序列中的序列Blastx核酸核酸蛋白蛋白质质核酸序列翻核酸序列翻译译成蛋白成蛋白质质序列后和蛋序列后和蛋白白质质数据数据库库中的序列逐一搜索。中的序列逐一搜索。Tblastn蛋白蛋白质质核酸核酸蛋白蛋白质质序列和核酸数据序列和核酸数据库库中的核酸中的核酸序列翻序列翻译译后的蛋白后的蛋白质质序列逐一比序列逐一比对对。TBlastx核酸核酸核酸核酸核酸序列翻核酸序列翻译译成蛋白成蛋白质质序列,再和序列,再和核酸数据核酸数据库库中的核酸序列翻中的核酸序列翻译译
9、成的成的蛋白蛋白质质序列逐一序列逐一进进行比行比对对。第17页,共92页,编辑于2022年,星期二http:/blast.ncbi.nlm.nih.gov/Blast.cgi第18页,共92页,编辑于2022年,星期二BLAST检索中采用的数据库类别:检索中采用的数据库类别:蛋白数据库:蛋白数据库:nr:无冗余数据库,汇集了无冗余数据库,汇集了GenBank中所有的中所有的蛋白序列蛋白序列+PDB+Swissprot+PIR等汇集等汇集;第19页,共92页,编辑于2022年,星期二BLAST检索中采用的数据库类别:检索中采用的数据库类别:核酸数据库:核酸数据库:nr/nt:无冗余数据库,汇集了
10、无冗余数据库,汇集了GenBank+DDBJ+EMBL中所有的核甘酸序列中所有的核甘酸序列(不包括(不包括EST)第20页,共92页,编辑于2022年,星期二BLASTBLAST的应用的应用第21页,共92页,编辑于2022年,星期二具体步骤具体步骤1.登陆登陆blast主页主页 http:/www.ncbi.nlm.nih.gov/BLAST/2.根据数据类型,选择合适的程序根据数据类型,选择合适的程序3.填写表单信息填写表单信息4.提交任务提交任务5.查看和分析结果查看和分析结果第22页,共92页,编辑于2022年,星期二第23页,共92页,编辑于2022年,星期二第24页,共92页,编辑
11、于2022年,星期二第25页,共92页,编辑于2022年,星期二第26页,共92页,编辑于2022年,星期二第27页,共92页,编辑于2022年,星期二提高期望阈值(提高期望阈值(Expect threshold);降低延伸种子序列的长度降低延伸种子序列的长度(word size)主要用途:搜索短的基序,如验证主要用途:搜索短的基序,如验证PCR引物的特异性引物的特异性第28页,共92页,编辑于2022年,星期二Blastn-1Blastn-1第29页,共92页,编辑于2022年,星期二Blastn-1Blastn-1第30页,共92页,编辑于2022年,星期二Blastn-1Blastn-1
12、Blastn1的作用:的作用:对于已知的基因,可以对于已知的基因,可以分析其相似基因;分析其相似基因;对于未知的基因片段,对于未知的基因片段,可以分析其属于什么基因。可以分析其属于什么基因。第31页,共92页,编辑于2022年,星期二Blastn-1Blastn-1第32页,共92页,编辑于2022年,星期二Blastn-1Blastn-1第33页,共92页,编辑于2022年,星期二Blastn-2Blastn-2What is EST?第34页,共92页,编辑于2022年,星期二Blastn-2Blastn-2第35页,共92页,编辑于2022年,星期二Blastn-2Blastn-2有什么
13、作用有什么作用?对于新基因,可以了解基因的结构特征对于新基因,可以了解基因的结构特征,5-UTR和和3-UTR 的大小的大小.第36页,共92页,编辑于2022年,星期二BlastpBlastp第37页,共92页,编辑于2022年,星期二BlastpBlastp第38页,共92页,编辑于2022年,星期二BlastpBlastp第39页,共92页,编辑于2022年,星期二BlastpBlastp第40页,共92页,编辑于2022年,星期二BlastpBlastp第41页,共92页,编辑于2022年,星期二BlastpBlastp第42页,共92页,编辑于2022年,星期二BlastpBlast
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三 序列 分析 PPT 讲稿
限制150内