第五章序列的同源比较及分子系统学和分子进化分析.优秀PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第五章序列的同源比较及分子系统学和分子进化分析.优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第五章序列的同源比较及分子系统学和分子进化分析.优秀PPT.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章:序列的同源比较及分子系统学和分子进化分析 n第一节:简介 n其次节:相像序列的获得 n第三节:多序列比对 n第四节:系统发育分析 n第五节:其他分子标记在生物系统学中的 应用11/5/20221第一节:简介n生物学探讨中常用的方法之一是通过比较分析获得有用的信息。n过去进化学家和分类学家为衡量物种间亲缘关系的亲密程度,花大量的精力把形态学特征数量化,希望以量化的形态学差异来表示物种间进化距离,但工作量大,标准不统一,导致进展缓慢。现如今,以大量公开的核酸和蛋白质数据为基础,利用序列分析的计算机软件构建生物进化树来探讨各物种间的进化关系。11/5/20222n在本章里探讨进化关系所用的软
2、件,我们在应用这些软件时会遇到很多专业术语和应用的计算机程序。这些生疏的术语对于初学者的我们没必要搞清,只要会用就可以了,但要做出特别专业的进化分析则必需搞清每个专业术语的含义。n构建系统树有很多的方法和步骤,我们会逐步学习,但不管接受什么样的方法,都有一些值得留意的问题:11/5/20223其次节:相像序列的获得n对一段序列进行进化分析的基础是获得此序列大量的同源序列,包括同一物种和不同物种之间,当序列有足够的相像性性,我们才能推断序列之间是否具有同源性。n同源性的推断是质的推断,进化分析是量的结果,两者之间如何进行统一,就是要有假设,当序列之间相像性超过一个值时,认为其是同源的。n序列相像
3、的缘由有两个:一是来自于同一祖先,然后发生分歧,二是两个序列来自于不同的祖先,在相像的选择压力下发生趋同进化,形成相像序列。11/5/20224n三、VASTnVAST是NCBI的相像结构搜寻工具,它将一个新的蛋白质三维结构与PDB或MMDB数据库中的结构进行比较,通过结构比较,可以发觉通过序列比较而无法发觉的远程同源蛋白质。nVAST算法是基于统计以下的结构相像性比较算法,VAST在评价结构相像显著性时,不过多的考虑微小子结构因偶然因素而形成的相像关系,而是着重考虑结构域的相像性。11/5/20225nVAST的比较有三个步骤:n首先,在数据坐标的基础上,标出全部构成蛋白质核心部分的螺旋和片
4、层。n然后依据这些二级结构单位的位置计算向量。运用这些向量进行结构比对而不是整个一套坐标。然后算法试图最佳地匹配这些向量,找寻类型和相对方向相同的成对结构单位,并且在这些单位之间还要有同样的连接方式。n最终,在每个残基位置上运用蒙特卡洛方法对结构的比对进行优化。(1LFL)11/5/20226第三节:多序列比对n用于多序列比对的程序开发是一个很活跃的领域,目前,绝大多数的方法均是基于渐进比对的概念。n渐进比对的方法假设了参与比对的序列存在亲缘关系,在算法上下功夫,以寻求计算速度与获得最佳比对之间的平衡。n一、CLUSTAL.W11/5/20227nCLUSTAL是一个单机版的基于渐进比对的多序
5、列比对工具,由Higgins D.G.等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,clustalx等。nCLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后依据距离矩阵计算产生系统进化指导树,对关系亲密的序列进行加权;然后从最紧密的两条序列起先,逐步引入接近的序列并不断重新构建比对,直到全部序列都被加入为止。11/5/20228CLUSTAL.W工作原理工作原理Clustal输入多个序列输入多个序列快速的序列两两比对,计算序列间的快速的序列两两比对,计算序列间的距离,获得一个距离矩阵。距离,获得一个距离矩阵。邻
6、接法邻接法(NJ)构建一个树(引导树)构建一个树(引导树)依据引导树,渐进比对多个序列。依据引导树,渐进比对多个序列。11/5/20229CLUSTAL.W应用1.输入输出格式。输入输出格式。输入序列的格式比较敏捷,可以是前面介绍过的输入序列的格式比较敏捷,可以是前面介绍过的FASTA格式,还可以是格式,还可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。等格式。输出格式也可以选择,有输出格式也可以选择,有ALN、GCG、PHYLIP和和NEXUS等,用户可以依据自己的须要选择合等,用户可以依据自己的须要选择合适的输出格式。适的输出格式。11/5/202
7、2102.两种工作模式。两种工作模式。a.多序列比对模式。多序列比对模式。b.剖面剖面(profile)比对模式。比对模式。3.一个实际的例子。一个实际的例子。CLUSTAL.W的应用11/5/202211多序列比对实例 步骤输入文件的格式(fasta):KCC2_YEAST NYIFGRTLGAGSFGVVRQARKLSTNDMK_HUMAN DFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK.KPRO_MAIZE TRKFKVELGRGESGTVYKGVLEDDRHVAVKKLENDAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD
8、1CSN HYKVGRRIGEGSFGVIFEGTNLLNN11/5/202212第一步:输入序列文件。11/5/202213其次步:设定比对的一些参数。11/5/202214第三步:起先序列比对第三步:起先序列比对11/5/202215第四步:比对完成,选择保存结果文件的格式n第四步:比对完成,选择保存结果文件的格式11/5/202216n二、BioEditnBioEdit程序特别适合序列比对、编辑和分析,是基于Windows平台的一种比对程序,目前应用最多,可免费下载。nBioEdit具体用法见n三、MultAlinnMultAlin从一系列的两联比对起先,得到分值,然后依据这个分值进行分
9、层次的聚类。n四、GCG数据库nGCG软件是一套蛋白质、核酸序列分析软件。11/5/202217nGCG支持五种数据库供Wisconsin软件包运用,其中包括两种核酸数据库(GenBank数据库、由GenBank中没有的序列组成的简化版的EMBL核酸序列数据库)和三种蛋白质数据库(PIR、Swiss-Prot、SP-TrEMBL数据库)。GCG支持的数据库两个月更新一次。11/5/202218第四节:系统发育分析 课本104页n系统发育分析是依据同源性状的分歧来评估物种或分子之间的进化关系。这种进化关系通常用分支图(系统树)来描述。对序列的系统发育分析又称为分子系统学或分子系统发育探讨。n比起
10、其他试验性学科,分子系统学与其他进化探讨一样有其局限,即系统发育的发生过程都是已经完成的历史,不能再现。n如何从序列中得到有用的信息,如何用计算的方法得到可信的进化树,如何从有限的数据得到进化模式已成为这个领域的探讨热点。n系统发育树是什么?n对一组实际对象的世系关系的描述(如基因,物种等)。11/5/202219一个系统发育树末端物种顶端中间节点中间枝条根末端分支叶子节点11/5/202220AB CDEFG树只代表分支的拓扑结构FGCDEAB11/5/202221n一般来说,系统树是一种两叉树,由一系列节点和分支组成,每个节点代表一个分类单元(物种或序列),而节点之间的连线代表物种间的进化
11、关系。树的节点又分为外部节点和内部节点。n系统发生树有多种形式:可能是有根树(rooted tree),也可能是无根树(unrooted tree);可能是一般的树,也可能是二叉树;可能是有权值的树(或标度树,树中标明分支长度),也可能是无权值树(非标度树)。n在有根树中,有一个唯一的根节点,代表全部其他根节点的共同祖先,这样的树能够反映进化层次,从根节点历经进化到任何其他节点只有唯一的路径。11/5/202222Rooted by outgrouparchaeaarchaeaarchaeaeukaryoteeukaryoteeukaryoteeukaryotebacteria outgrou
12、prooteukaryoteeukaryoteeukaryoteeukaryote无根树无根树archaeaarchaeaarchaeaMonophyletic group(单源群单源群)Monophyleticgroup有根树,无根树,外围群有根树,无根树,外围群有根树有根树外围群外围群11/5/202223n分子进化探讨的基础(假设)n核苷酸和氨基酸序列中含有生物进化历史的全部信息。n分子进化探讨的基础(理论)n在各种不同的发育谱系及足够大的进化时间尺度中,很多序列的进化速率几乎是恒定不变的。(分子钟理论,1965)n分子进化探讨的基础(实际)n虽然很多时候仍旧存在争议,但是分子进化的确能
13、阐述一些生物系统发生的内在规律。11/5/202224从一个分歧数据可以推想其他序 列 分 歧 度分歧时间xy分子钟理论11/5/202225n一、系统树的构建方法n系统树的构建主要有三种方法:距离法、最简约法、最大似然法。n1、距离法n距离法又称距离矩阵法,首先通过各个物种之间的比较,依据确定的假设(进化距离模型)推导得出分类群之间的进化距离,构建一个进化距离矩阵。进化树的构建则是基于这个矩阵中的进化距离关系。计算序列的距离,建立距离矩阵通过距离矩阵建进化树11/5/202226一种简洁的距离矩阵11/5/202227由进化距离构建进化树的方法有很多,常见有:(1).Fitch-Margol
14、iash Method(FM法)(2).Neighbor-Joining Method(NJ法/邻接法)(3).Neighbors Relaton Method(邻居关系法)(4).Unweighted Pair Group Method(UPGMA法)通过矩阵建树的方法11/5/202228Fitch-Margoliash方法(FM法)11/5/2022291.找出关系最近的序列对,如A和B2.将剩余的序列作为一个简洁复合序列,分别计算A、B到全部其他序列的距离的平均值3.用这些值来计算A和B间的距离4.将A、B作为一个单一的复合序列AB,计算与每一个其他序列的距离,生成新的距离矩阵5.确定
15、下一对关系最近的序列,重复前面的步聚计算枝长7.从每个序列对起先,重复整个过程8.对每个树计算每对序列间的预料距离,发觉与原始数据最符合的树Fitch-Margoliash方法(FM法)小结11/5/202230NJ/邻接法随意两个节点选为相邻序列的总支长计算公式11/5/202231 把A、B看成一个新的复合序列,构建一个新的距离表,重复以上过程。11/5/202232邻居关系法AB组合出现3次,DE组合出现3次,CD、AC、BC组合各一次,则AB和DE各为两对关系最近的邻居。(关系最近的邻居作为邻居的次数最多),将邻居看成一个新的复合序列,重复这个过程。11/5/202233UPGMA法d
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 序列 同源 比较 分子 系统学 进化 分析 优秀 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内