蛋白质结构预测的原理与方法精选PPT.ppt
《蛋白质结构预测的原理与方法精选PPT.ppt》由会员分享,可在线阅读,更多相关《蛋白质结构预测的原理与方法精选PPT.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于蛋白质结构预测的原理与方法1第1页,讲稿共79张,创作于星期三6.1 概述概述第2页,讲稿共79张,创作于星期三3一、基本概念一、基本概念蛋白质结构预测蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维:指从蛋白质的氨基酸序列预测出其三维空间结构。空间结构。蛋白质折叠蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有生物:指蛋白质的氨基酸序列可折叠成具有生物活性的三维空间结构。活性的三维空间结构。第二套遗传密码第二套遗传密码:蛋白质的氨基酸序列与其三维空间结蛋白质的氨基酸序列与其三维空间结构间的关系。构间的关系。第3页,讲稿共79张,创作于星期三4序列模体(序列模体(motif):通常指蛋白质序
2、列中相邻或相近的一通常指蛋白质序列中相邻或相近的一组具有保守性的残基(或称基序),它与蛋白质分子及其家组具有保守性的残基(或称基序),它与蛋白质分子及其家族的功能有关。族的功能有关。第4页,讲稿共79张,创作于星期三5二、蛋白质结构数据的获得二、蛋白质结构数据的获得圆二色性(圆二色性(circular dichroism,CD),),描绘了不对称分子的用描绘了不对称分子的用左右圆偏振光吸收差异谱表示的光学活性。在左右圆偏振光吸收差异谱表示的光学活性。在160-240nm的的CD光谱光谱可以快速了解蛋白质的二级结构,因为可以快速了解蛋白质的二级结构,因为螺旋,螺旋,折叠和卷曲产生折叠和卷曲产生不
3、同的不同的CD谱。谱。X射线晶体衍射射线晶体衍射核磁共振光谱(核磁共振光谱(nuclear magnetic resonance spectroscopy,NMR)第5页,讲稿共79张,创作于星期三6三、蛋白质结构预测要解决的问题三、蛋白质结构预测要解决的问题蛋白质结构预测问题蛋白质结构预测问题 “序列序列-结构结构-功能功能”三者之间的关系三者之间的关系.-Gly-Ala-Glu-Phe-.FUNCTION第6页,讲稿共79张,创作于星期三7 又称蛋白质侵染因子。朊病毒是一类能侵染动物并在宿又称蛋白质侵染因子。朊病毒是一类能侵染动物并在宿主细胞内复制的主细胞内复制的小分子无免疫性疏水蛋白质小
4、分子无免疫性疏水蛋白质。目前发现的由朊病毒引起的疾病并不多,目前发现的由朊病毒引起的疾病并不多,主要有:人类主要有:人类中的中的库鲁病库鲁病(Kuru病)、克病)、克雅氏综合症(雅氏综合症(CJD)、)、格格斯特曼综合症(斯特曼综合症(GSS)及致死性家族性失眠症(及致死性家族性失眠症(FFI),),动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主要是引起神经系统和肌肉组织的损坏。要是引起神经系统和肌肉组织的损坏。案例:案例:朊病毒朊病毒第7页,讲稿共
5、79张,创作于星期三8折叠,正常折叠,正常3致病致病43第8页,讲稿共79张,创作于星期三9致病机理致病机理19821982年年普鲁辛纳普鲁辛纳提出了朊病毒致病的提出了朊病毒致病的“蛋白质构象致病假蛋白质构象致病假说说”,以后魏斯曼等人对其逐步完善。其要点如下:,以后魏斯曼等人对其逐步完善。其要点如下:朊朊病毒蛋白有两种构象:病毒蛋白有两种构象:细胞型(正常型细胞型(正常型PrPcPrPc)和瘙痒型(致和瘙痒型(致病型病型PrPscPrPsc)。两者的主要区别在于其空间构象上的差异。两者的主要区别在于其空间构象上的差异。PrPcPrPc仅存在仅存在a a螺旋,而螺旋,而PrPscPrPsc有多
6、个有多个折叠存在,后者溶解度折叠存在,后者溶解度低,且抗蛋白酶解;低,且抗蛋白酶解;PrpscPrpsc可胁迫可胁迫PrPcPrPc转化为转化为PrPscPrPsc,实实现自我复制,并产生病理效应;现自我复制,并产生病理效应;基因突变可导致细胞型基因突变可导致细胞型PrPscPrPsc中的中的螺旋结构不稳定,至一定量时产生自发性转螺旋结构不稳定,至一定量时产生自发性转化,化,片层增加,最终变为片层增加,最终变为PrPscPrPsc型,并通过多米诺效应倍型,并通过多米诺效应倍增致病。增致病。第9页,讲稿共79张,创作于星期三10.-Gly-Ala-Glu-Phe-.结构预测问题FUNCTION?
7、关键限制因素第10页,讲稿共79张,创作于星期三11解决方法.-Gly-Ala-Glu-Phe-.FUNCTION!解决方案第11页,讲稿共79张,创作于星期三12四、蛋白质预测的一般流程四、蛋白质预测的一般流程第12页,讲稿共79张,创作于星期三13五、影响蛋白质折叠的因素五、影响蛋白质折叠的因素 影响蛋白质结构稳定性的非共价键有:影响蛋白质结构稳定性的非共价键有:范德华力。范德华力。偶极相互作用。偶极相互作用。部分电荷或完整电荷间静电相互作用。部分电荷或完整电荷间静电相互作用。氢键。氢键是形成蛋白质中规则二级结构的主要作用力。氢键。氢键是形成蛋白质中规则二级结构的主要作用力。熵效应熵效应。
8、除了原子间的共价连接以外,蛋白质结构的形成及稳除了原子间的共价连接以外,蛋白质结构的形成及稳定性在很大程度上依赖于定性在很大程度上依赖于非键相互作用非键相互作用。第13页,讲稿共79张,创作于星期三14熵效应:熵效应:是热力学的一个概念。它是指在一个是热力学的一个概念。它是指在一个封闭的并存在能量差异的系统中,虽然系统内封闭的并存在能量差异的系统中,虽然系统内总能量保持守衡,但能量却总是不可逆转地由总能量保持守衡,但能量却总是不可逆转地由高能区向低能区流动,最终达到能量的分散与高能区向低能区流动,最终达到能量的分散与平衡的一种状态和趋势。平衡的一种状态和趋势。第14页,讲稿共79张,创作于星期
9、三6.2 蛋白质结构分析蛋白质结构分析第15页,讲稿共79张,创作于星期三16一、蛋白质结构分类一、蛋白质结构分类蛋白质结构依据不同的层次可以分为四类:蛋白质结构依据不同的层次可以分为四类:1 1)一级结构(氨基酸序列)一级结构(氨基酸序列)2 2)二级结构(规则结构,如)二级结构(规则结构,如a a螺旋、螺旋、折叠)折叠)3 3)三级结构(简单蛋白质的三维空间结构,或复杂蛋)三级结构(简单蛋白质的三维空间结构,或复杂蛋白质亚基的三维空间结构)白质亚基的三维空间结构)4 4)四级结构(亚基的组装)四级结构(亚基的组装)第16页,讲稿共79张,创作于星期三17.-Gly-Ala-Glu-Phe-
10、.一级结构一级结构二级结构二级结构三级结构三级结构四级结构四级结构第17页,讲稿共79张,创作于星期三18四级结构四级结构(quaternary structure):由多个亚基由多个亚基组成的蛋白质分子的空间结构。组成的蛋白质分子的空间结构。五级结构(五级结构(quinternary structure):蛋白质与蛋白蛋白质与蛋白质、蛋白质与核酸相互作用时的空间位置关系。质、蛋白质与核酸相互作用时的空间位置关系。第18页,讲稿共79张,创作于星期三19二、周期性的二级结构二、周期性的二级结构1 1)螺螺旋旋是是蛋蛋白白质质结结构构中中最最常常见见的的二二级级结结构构,由由于于在在螺螺旋旋内内
11、部部每每隔隔3 34 4个个氨氨基基酸酸残残基基形形成成氢氢键键,因因而而本本身身的的稳稳定定性性较较好好。螺螺旋旋由由于于与与溶溶剂剂的的作作用用或或中中间间有有脯脯氨氨酸酸等等也也会会发发生生弯弯曲曲。不同的残基对于不同的残基对于螺旋中间部位及螺旋中间部位及N N端或端或C C端出现的倾向性不同。端出现的倾向性不同。2 2)折折叠叠片片是是由由带带状状的的折折叠叠股股间间形形成成氢氢键键而而构构成成的的,在在氨氨基基酸酸序序列列上上往往往往是是不不连连续续的的。几几乎乎所所有有的的折折叠叠片片在在沿沿着着折折叠叠股股的的方方向向均均发发生生右右手手的的扭扭曲曲,在在折折叠叠股股间间形形成成
12、左左手手的的扭扭曲曲。某些残基倾向于出现在某些残基倾向于出现在折叠中折叠中。第19页,讲稿共79张,创作于星期三20三、非周期性的二级结构三、非周期性的二级结构 连连接接规规则则二二级级结结构构间间的的区区域域统统称称为为环环区区(looploop或或CoilCoil,简简写为写为C C),),这些环区本身的结构也是遵循一定规律的。这些环区本身的结构也是遵循一定规律的。转转角角是是由由四四个个残残基基构构成成的的,使使得得蛋蛋白白质质主主链链的的走走向向形形成成180180度度的的回回折折。转转角角可可以以分分为为几几种种特特定定的的类类型型,并并具具有有一一定的氨基酸残基倾向性。定的氨基酸残
13、基倾向性。由三个残基构成的主链的回折称之为由三个残基构成的主链的回折称之为 转角转角。反反平平行行的的折折叠叠形形成成的的发发夹夹具具有有特特定定的的结结构构。螺螺旋旋间间的短连接具有特定的结构与的短连接具有特定的结构与堆积堆积。当较大的环区的当较大的环区的N N端与端与C C端靠近时就形成端靠近时就形成 环环。非规则性环区非规则性环区也可以按照其平面性、手性及也可以按照其平面性、手性及N N端与端与C C端的端的相对位置进行分类。相对位置进行分类。第20页,讲稿共79张,创作于星期三21折叠折叠/折叠+折叠第21页,讲稿共79张,创作于星期三22四、超二级结构四、超二级结构 二级结构间特定的
14、组合构成超二级结构。二级结构间特定的组合构成超二级结构。1)1)螺螺旋旋一一般般以以特特定定的的角角度度相相堆堆积积,使使得得一一个个螺螺旋旋的的突突出出部部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。2)2)折折叠叠片片/折折叠叠片片、螺螺旋旋/折折叠叠片片间间的的堆堆积积有有常常出出现现的的特特定定模模式式。折折叠叠片片中中的的折折叠叠股股以以多多种种拓拓扑扑结结构构相相连连接接,如如希希腊腊钥钥匙匙型型结结构构等等。平平行行的的折折叠叠股股间间的的连连接接(特特别别是是单元)总是右手型的。单元)总是右手型的。随着已知蛋白质结
15、构的增加,不断有新的超二级结构类型随着已知蛋白质结构的增加,不断有新的超二级结构类型出现。出现。第22页,讲稿共79张,创作于星期三23五、蛋白质结构域的折叠模式与蛋白质结构分类数据库五、蛋白质结构域的折叠模式与蛋白质结构分类数据库蛋白质结构域(蛋白质结构域(domaindomain):是蛋白质分子中介于二级结构和三级是蛋白质分子中介于二级结构和三级结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构域。域。结构域可以按照二
16、级结构的种类及排列方式进行分类:结构域可以按照二级结构的种类及排列方式进行分类:主要含有主要含有螺旋的螺旋的/结构;结构;主要含有主要含有折叠片的折叠片的/结构;结构;以以螺旋和螺旋和折叠交替出现的折叠交替出现的/结构;结构;混和型的混和型的结构;结构;小于小于100100残基的不含有明显规则二级结构的小蛋白。残基的不含有明显规则二级结构的小蛋白。1 蛋白质结构域的折叠模式蛋白质结构域的折叠模式第23页,讲稿共79张,创作于星期三242蛋白质折叠模式的有限性蛋白质折叠模式的有限性 研究表明,一些序列功能很不同的蛋白质采用类似的结构,研究表明,一些序列功能很不同的蛋白质采用类似的结构,这就提示人
17、们蛋白质折叠模式的种类可能是有限的。这就提示人们蛋白质折叠模式的种类可能是有限的。当务之急当务之急发展快速的能够对蛋白质的折叠类型进行识别的方法。发展快速的能够对蛋白质的折叠类型进行识别的方法。第24页,讲稿共79张,创作于星期三253蛋白质分类数据库蛋白质分类数据库蛋白质结构分类数据库蛋白质结构分类数据库 对于蛋白质预测具有重要对于蛋白质预测具有重要的意义。的意义。两个重要的蛋白质结构分类数据库:两个重要的蛋白质结构分类数据库:1 1)SCOPSCOP数据库数据库2 2)CATHCATH数据库数据库第25页,讲稿共79张,创作于星期三26六、蛋白质的进化六、蛋白质的进化1 1)同同源源性性的
18、的蛋蛋白白质质(homologous homologous proteinprotein)是是从从一一个个共共同同的的祖祖先先进进化化而而来来的的,往往往往具具有有相相关关的的功功能能(例例如如丝丝氨酸蛋白酶)并采取相似的三维结构。氨酸蛋白酶)并采取相似的三维结构。2 2)序序列列的的相相似似性性有有时时可可低低到到2020以以下下,但但三三维维结结构构在总体上是保守的。在总体上是保守的。3 3)蛋蛋白白质质结结构构的的核核心心在在序序列列上上及及三三维维结结构构上上均均比比表表面面环区环区更保守。更保守。同源的蛋白质往往具有相似的三维结构;但具有相似的同源的蛋白质往往具有相似的三维结构;但具
19、有相似的三维结构的蛋白质序列不一定是同源的。三维结构的蛋白质序列不一定是同源的。第26页,讲稿共79张,创作于星期三6.3 二级结构预测二级结构预测 第27页,讲稿共79张,创作于星期三28 蛋白质蛋白质 序列:序列:二级结构:二级结构:蛋白质二级结构预测是蛋白质结构预测的主蛋白质二级结构预测是蛋白质结构预测的主要组成部分之一要组成部分之一 。第28页,讲稿共79张,创作于星期三29一、蛋白质一、蛋白质二级结构预测概述二级结构预测概述蛋白质的二级结构预测的基本依据是:蛋白质的二级结构预测的基本依据是:每一段相邻的氨基酸残基具有形成一定二级结构每一段相邻的氨基酸残基具有形成一定二级结构的倾向。的
20、倾向。二级结构预测问题是模式分类问题二级结构预测问题是模式分类问题二级结构预测的目标二级结构预测的目标:判断每一段中心的残基是否处于判断每一段中心的残基是否处于 螺旋、螺旋、折叠、转折叠、转角(或其它状态)之一的二级结构态,即三态。角(或其它状态)之一的二级结构态,即三态。第29页,讲稿共79张,创作于星期三30基本策略(1)相似序列相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK第30页,讲稿共79张,创作于星期三31二、蛋白质二级结构预测的意义二、蛋白质二级结构预测的意义蛋蛋白白质质二二级级结结构构预预测测不不仅仅仅仅可可以以给给出出二二级级结结构构信信息息,在在实实
21、际际工工作作中中有广泛的用途。有广泛的用途。由由蛋蛋白白质质二二级级结结构构统统计计分分析析得得到到的的规规则则可可用用于于全全新新蛋蛋白白质质设设计计或蛋白质突变体的设计或蛋白质突变体的设计。当当序序列列同同源源性性较较低低时时,二二级级结结构构的的指指认认有有助助于于确确定定蛋蛋白白质质间间结结构与功能的关系构与功能的关系。在在同同源源蛋蛋白白质质模模建建中中,二二级级结结构构预预测测有有助助于于建建立立正正确确的的序序列列比对关系比对关系。在在基基于于二二级级结结构构片片段段堆堆积积的的三三级级结结构构预预测测中中正正确确的的二二级级结结构构预预测测是第一步。是第一步。二二级级结结构构的
22、的预预测测有有助助于于多多维维核核磁磁共共振振中中二二级级结结构构的的指指认认,同同时也有助于晶体结构的解析。时也有助于晶体结构的解析。第31页,讲稿共79张,创作于星期三32三、蛋白质二级结构预测的主要方法三、蛋白质二级结构预测的主要方法二级结构预测的方法大体分为三代:二级结构预测的方法大体分为三代:第一代第一代是基于是基于单个氨基酸残基单个氨基酸残基统计分析统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,以此从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。作为二级结构预测的依据。第二代第二代预测方法是基于预测方法是基于氨基酸片段氨基酸片段的统计分
23、析的统计分析统计的对象是氨基酸片段统计的对象是氨基酸片段片段的长度通常为片段的长度通常为11-2111-21片段体现了中心残基所处的片段体现了中心残基所处的环境环境在预测中心残基的二级结构时,以残基在特定环境形成特定在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据二级结构的倾向作为预测依据 第32页,讲稿共79张,创作于星期三33第一代和第二代预测方法对三态预测的准确第一代和第二代预测方法对三态预测的准确率都小于率都小于70%70%,而对,而对 折叠预测的准确率仅为折叠预测的准确率仅为2828 48%48%。其主要原因是只利用局部信息其主要原因是只利用局部信息第三
24、代第三代方法方法:考虑多条序列的同源进化信息考虑多条序列的同源进化信息 运用长程信息和蛋白质序列的进化信息运用长程信息和蛋白质序列的进化信息 准确度有了比较大的提高准确度有了比较大的提高第33页,讲稿共79张,创作于星期三341 1ChouChouFasmanFasman方法方法 ChouChouFasmanFasman方方法法曾曾经经是是、现现在在仍仍然然是是最最为为普普遍遍应应用用的的方方法法。其其基基本本出出发发点点在在于于对对于于蛋蛋白白质质2020种种不不同同的的氨氨基基酸酸残残基基在在不不同同的的二二级级结结构构中中出出现现的的几几率率进进行行统统计计分分析析得得出出在在不不同二级
25、结构中出现的倾向性。同二级结构中出现的倾向性。2 2GORGOR方法方法 GORGOR(GarnierGarnierOsguthorpeOsguthorpeRobsonRobson)方方法法基基于于信信息息论论算法,是所有算法,是所有统计算法统计算法中理论基础最好的。中理论基础最好的。3 3最近邻居方法最近邻居方法 在在最最近近邻邻居居方方法法(nearest nearest neighbor neighbor methodmethod)中中新新测测定定的的序序列被归类于与已知的最相近的序列具有相同的二级结构。列被归类于与已知的最相近的序列具有相同的二级结构。第34页,讲稿共79张,创作于星期
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 结构 预测 原理 方法 精选 PPT
限制150内