欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    蛋白质结构预测的原理与方法精选PPT.ppt

    • 资源ID:43306833       资源大小:3.09MB        全文页数:79页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    蛋白质结构预测的原理与方法精选PPT.ppt

    关于蛋白质结构预测的原理与方法1第1页,讲稿共79张,创作于星期三6.1 概述概述第2页,讲稿共79张,创作于星期三3一、基本概念一、基本概念蛋白质结构预测蛋白质结构预测:指从蛋白质的氨基酸序列预测出其三维:指从蛋白质的氨基酸序列预测出其三维空间结构。空间结构。蛋白质折叠蛋白质折叠:指蛋白质的氨基酸序列可折叠成具有生物:指蛋白质的氨基酸序列可折叠成具有生物活性的三维空间结构。活性的三维空间结构。第二套遗传密码第二套遗传密码:蛋白质的氨基酸序列与其三维空间结蛋白质的氨基酸序列与其三维空间结构间的关系。构间的关系。第3页,讲稿共79张,创作于星期三4序列模体(序列模体(motif):通常指蛋白质序列中相邻或相近的一通常指蛋白质序列中相邻或相近的一组具有保守性的残基(或称基序),它与蛋白质分子及其家组具有保守性的残基(或称基序),它与蛋白质分子及其家族的功能有关。族的功能有关。第4页,讲稿共79张,创作于星期三5二、蛋白质结构数据的获得二、蛋白质结构数据的获得圆二色性(圆二色性(circular dichroism,CD),),描绘了不对称分子的用描绘了不对称分子的用左右圆偏振光吸收差异谱表示的光学活性。在左右圆偏振光吸收差异谱表示的光学活性。在160-240nm的的CD光谱光谱可以快速了解蛋白质的二级结构,因为可以快速了解蛋白质的二级结构,因为螺旋,螺旋,折叠和卷曲产生折叠和卷曲产生不同的不同的CD谱。谱。X射线晶体衍射射线晶体衍射核磁共振光谱(核磁共振光谱(nuclear magnetic resonance spectroscopy,NMR)第5页,讲稿共79张,创作于星期三6三、蛋白质结构预测要解决的问题三、蛋白质结构预测要解决的问题蛋白质结构预测问题蛋白质结构预测问题 “序列序列-结构结构-功能功能”三者之间的关系三者之间的关系.-Gly-Ala-Glu-Phe-.FUNCTION第6页,讲稿共79张,创作于星期三7 又称蛋白质侵染因子。朊病毒是一类能侵染动物并在宿又称蛋白质侵染因子。朊病毒是一类能侵染动物并在宿主细胞内复制的主细胞内复制的小分子无免疫性疏水蛋白质小分子无免疫性疏水蛋白质。目前发现的由朊病毒引起的疾病并不多,目前发现的由朊病毒引起的疾病并不多,主要有:人类主要有:人类中的中的库鲁病库鲁病(Kuru病)、克病)、克雅氏综合症(雅氏综合症(CJD)、)、格格斯特曼综合症(斯特曼综合症(GSS)及致死性家族性失眠症(及致死性家族性失眠症(FFI),),动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦动物中的水貂脑软化病,羊搔症,马鹿和鹿的慢性消瘦病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主病(萎缩病),猫的海绵状脑病,疯牛病。这些疾病主要是引起神经系统和肌肉组织的损坏。要是引起神经系统和肌肉组织的损坏。案例:案例:朊病毒朊病毒第7页,讲稿共79张,创作于星期三8折叠,正常折叠,正常3致病致病43第8页,讲稿共79张,创作于星期三9致病机理致病机理19821982年年普鲁辛纳普鲁辛纳提出了朊病毒致病的提出了朊病毒致病的“蛋白质构象致病假蛋白质构象致病假说说”,以后魏斯曼等人对其逐步完善。其要点如下:,以后魏斯曼等人对其逐步完善。其要点如下:朊朊病毒蛋白有两种构象:病毒蛋白有两种构象:细胞型(正常型细胞型(正常型PrPcPrPc)和瘙痒型(致和瘙痒型(致病型病型PrPscPrPsc)。两者的主要区别在于其空间构象上的差异。两者的主要区别在于其空间构象上的差异。PrPcPrPc仅存在仅存在a a螺旋,而螺旋,而PrPscPrPsc有多个有多个折叠存在,后者溶解度折叠存在,后者溶解度低,且抗蛋白酶解;低,且抗蛋白酶解;PrpscPrpsc可胁迫可胁迫PrPcPrPc转化为转化为PrPscPrPsc,实实现自我复制,并产生病理效应;现自我复制,并产生病理效应;基因突变可导致细胞型基因突变可导致细胞型PrPscPrPsc中的中的螺旋结构不稳定,至一定量时产生自发性转螺旋结构不稳定,至一定量时产生自发性转化,化,片层增加,最终变为片层增加,最终变为PrPscPrPsc型,并通过多米诺效应倍型,并通过多米诺效应倍增致病。增致病。第9页,讲稿共79张,创作于星期三10.-Gly-Ala-Glu-Phe-.结构预测问题FUNCTION?关键限制因素第10页,讲稿共79张,创作于星期三11解决方法.-Gly-Ala-Glu-Phe-.FUNCTION!解决方案第11页,讲稿共79张,创作于星期三12四、蛋白质预测的一般流程四、蛋白质预测的一般流程第12页,讲稿共79张,创作于星期三13五、影响蛋白质折叠的因素五、影响蛋白质折叠的因素 影响蛋白质结构稳定性的非共价键有:影响蛋白质结构稳定性的非共价键有:范德华力。范德华力。偶极相互作用。偶极相互作用。部分电荷或完整电荷间静电相互作用。部分电荷或完整电荷间静电相互作用。氢键。氢键是形成蛋白质中规则二级结构的主要作用力。氢键。氢键是形成蛋白质中规则二级结构的主要作用力。熵效应熵效应。除了原子间的共价连接以外,蛋白质结构的形成及稳除了原子间的共价连接以外,蛋白质结构的形成及稳定性在很大程度上依赖于定性在很大程度上依赖于非键相互作用非键相互作用。第13页,讲稿共79张,创作于星期三14熵效应:熵效应:是热力学的一个概念。它是指在一个是热力学的一个概念。它是指在一个封闭的并存在能量差异的系统中,虽然系统内封闭的并存在能量差异的系统中,虽然系统内总能量保持守衡,但能量却总是不可逆转地由总能量保持守衡,但能量却总是不可逆转地由高能区向低能区流动,最终达到能量的分散与高能区向低能区流动,最终达到能量的分散与平衡的一种状态和趋势。平衡的一种状态和趋势。第14页,讲稿共79张,创作于星期三6.2 蛋白质结构分析蛋白质结构分析第15页,讲稿共79张,创作于星期三16一、蛋白质结构分类一、蛋白质结构分类蛋白质结构依据不同的层次可以分为四类:蛋白质结构依据不同的层次可以分为四类:1 1)一级结构(氨基酸序列)一级结构(氨基酸序列)2 2)二级结构(规则结构,如)二级结构(规则结构,如a a螺旋、螺旋、折叠)折叠)3 3)三级结构(简单蛋白质的三维空间结构,或复杂蛋)三级结构(简单蛋白质的三维空间结构,或复杂蛋白质亚基的三维空间结构)白质亚基的三维空间结构)4 4)四级结构(亚基的组装)四级结构(亚基的组装)第16页,讲稿共79张,创作于星期三17.-Gly-Ala-Glu-Phe-.一级结构一级结构二级结构二级结构三级结构三级结构四级结构四级结构第17页,讲稿共79张,创作于星期三18四级结构四级结构(quaternary structure):由多个亚基由多个亚基组成的蛋白质分子的空间结构。组成的蛋白质分子的空间结构。五级结构(五级结构(quinternary structure):蛋白质与蛋白蛋白质与蛋白质、蛋白质与核酸相互作用时的空间位置关系。质、蛋白质与核酸相互作用时的空间位置关系。第18页,讲稿共79张,创作于星期三19二、周期性的二级结构二、周期性的二级结构1 1)螺螺旋旋是是蛋蛋白白质质结结构构中中最最常常见见的的二二级级结结构构,由由于于在在螺螺旋旋内内部部每每隔隔3 34 4个个氨氨基基酸酸残残基基形形成成氢氢键键,因因而而本本身身的的稳稳定定性性较较好好。螺螺旋旋由由于于与与溶溶剂剂的的作作用用或或中中间间有有脯脯氨氨酸酸等等也也会会发发生生弯弯曲曲。不同的残基对于不同的残基对于螺旋中间部位及螺旋中间部位及N N端或端或C C端出现的倾向性不同。端出现的倾向性不同。2 2)折折叠叠片片是是由由带带状状的的折折叠叠股股间间形形成成氢氢键键而而构构成成的的,在在氨氨基基酸酸序序列列上上往往往往是是不不连连续续的的。几几乎乎所所有有的的折折叠叠片片在在沿沿着着折折叠叠股股的的方方向向均均发发生生右右手手的的扭扭曲曲,在在折折叠叠股股间间形形成成左左手手的的扭扭曲曲。某些残基倾向于出现在某些残基倾向于出现在折叠中折叠中。第19页,讲稿共79张,创作于星期三20三、非周期性的二级结构三、非周期性的二级结构 连连接接规规则则二二级级结结构构间间的的区区域域统统称称为为环环区区(looploop或或CoilCoil,简简写为写为C C),),这些环区本身的结构也是遵循一定规律的。这些环区本身的结构也是遵循一定规律的。转转角角是是由由四四个个残残基基构构成成的的,使使得得蛋蛋白白质质主主链链的的走走向向形形成成180180度度的的回回折折。转转角角可可以以分分为为几几种种特特定定的的类类型型,并并具具有有一一定的氨基酸残基倾向性。定的氨基酸残基倾向性。由三个残基构成的主链的回折称之为由三个残基构成的主链的回折称之为 转角转角。反反平平行行的的折折叠叠形形成成的的发发夹夹具具有有特特定定的的结结构构。螺螺旋旋间间的短连接具有特定的结构与的短连接具有特定的结构与堆积堆积。当较大的环区的当较大的环区的N N端与端与C C端靠近时就形成端靠近时就形成 环环。非规则性环区非规则性环区也可以按照其平面性、手性及也可以按照其平面性、手性及N N端与端与C C端的端的相对位置进行分类。相对位置进行分类。第20页,讲稿共79张,创作于星期三21折叠折叠/折叠+折叠第21页,讲稿共79张,创作于星期三22四、超二级结构四、超二级结构 二级结构间特定的组合构成超二级结构。二级结构间特定的组合构成超二级结构。1)1)螺螺旋旋一一般般以以特特定定的的角角度度相相堆堆积积,使使得得一一个个螺螺旋旋的的突突出出部部分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。分及凹槽部分与另外一个螺旋的凹槽部分及突出部分相嵌合。2)2)折折叠叠片片/折折叠叠片片、螺螺旋旋/折折叠叠片片间间的的堆堆积积有有常常出出现现的的特特定定模模式式。折折叠叠片片中中的的折折叠叠股股以以多多种种拓拓扑扑结结构构相相连连接接,如如希希腊腊钥钥匙匙型型结结构构等等。平平行行的的折折叠叠股股间间的的连连接接(特特别别是是单元)总是右手型的。单元)总是右手型的。随着已知蛋白质结构的增加,不断有新的超二级结构类型随着已知蛋白质结构的增加,不断有新的超二级结构类型出现。出现。第22页,讲稿共79张,创作于星期三23五、蛋白质结构域的折叠模式与蛋白质结构分类数据库五、蛋白质结构域的折叠模式与蛋白质结构分类数据库蛋白质结构域(蛋白质结构域(domaindomain):是蛋白质分子中介于二级结构和三级是蛋白质分子中介于二级结构和三级结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条结构之间的结构层次。在分子量较大的球形蛋白质分子中,一条多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构多肽链可能折叠成两个或多个空间上互相独立的区域,称为结构域。域。结构域可以按照二级结构的种类及排列方式进行分类:结构域可以按照二级结构的种类及排列方式进行分类:主要含有主要含有螺旋的螺旋的/结构;结构;主要含有主要含有折叠片的折叠片的/结构;结构;以以螺旋和螺旋和折叠交替出现的折叠交替出现的/结构;结构;混和型的混和型的结构;结构;小于小于100100残基的不含有明显规则二级结构的小蛋白。残基的不含有明显规则二级结构的小蛋白。1 蛋白质结构域的折叠模式蛋白质结构域的折叠模式第23页,讲稿共79张,创作于星期三242蛋白质折叠模式的有限性蛋白质折叠模式的有限性 研究表明,一些序列功能很不同的蛋白质采用类似的结构,研究表明,一些序列功能很不同的蛋白质采用类似的结构,这就提示人们蛋白质折叠模式的种类可能是有限的。这就提示人们蛋白质折叠模式的种类可能是有限的。当务之急当务之急发展快速的能够对蛋白质的折叠类型进行识别的方法。发展快速的能够对蛋白质的折叠类型进行识别的方法。第24页,讲稿共79张,创作于星期三253蛋白质分类数据库蛋白质分类数据库蛋白质结构分类数据库蛋白质结构分类数据库 对于蛋白质预测具有重要对于蛋白质预测具有重要的意义。的意义。两个重要的蛋白质结构分类数据库:两个重要的蛋白质结构分类数据库:1 1)SCOPSCOP数据库数据库2 2)CATHCATH数据库数据库第25页,讲稿共79张,创作于星期三26六、蛋白质的进化六、蛋白质的进化1 1)同同源源性性的的蛋蛋白白质质(homologous homologous proteinprotein)是是从从一一个个共共同同的的祖祖先先进进化化而而来来的的,往往往往具具有有相相关关的的功功能能(例例如如丝丝氨酸蛋白酶)并采取相似的三维结构。氨酸蛋白酶)并采取相似的三维结构。2 2)序序列列的的相相似似性性有有时时可可低低到到2020以以下下,但但三三维维结结构构在总体上是保守的。在总体上是保守的。3 3)蛋蛋白白质质结结构构的的核核心心在在序序列列上上及及三三维维结结构构上上均均比比表表面面环区环区更保守。更保守。同源的蛋白质往往具有相似的三维结构;但具有相似的同源的蛋白质往往具有相似的三维结构;但具有相似的三维结构的蛋白质序列不一定是同源的。三维结构的蛋白质序列不一定是同源的。第26页,讲稿共79张,创作于星期三6.3 二级结构预测二级结构预测 第27页,讲稿共79张,创作于星期三28 蛋白质蛋白质 序列:序列:二级结构:二级结构:蛋白质二级结构预测是蛋白质结构预测的主蛋白质二级结构预测是蛋白质结构预测的主要组成部分之一要组成部分之一 。第28页,讲稿共79张,创作于星期三29一、蛋白质一、蛋白质二级结构预测概述二级结构预测概述蛋白质的二级结构预测的基本依据是:蛋白质的二级结构预测的基本依据是:每一段相邻的氨基酸残基具有形成一定二级结构每一段相邻的氨基酸残基具有形成一定二级结构的倾向。的倾向。二级结构预测问题是模式分类问题二级结构预测问题是模式分类问题二级结构预测的目标二级结构预测的目标:判断每一段中心的残基是否处于判断每一段中心的残基是否处于 螺旋、螺旋、折叠、转折叠、转角(或其它状态)之一的二级结构态,即三态。角(或其它状态)之一的二级结构态,即三态。第29页,讲稿共79张,创作于星期三30基本策略(1)相似序列相似结构QLMGERIRARRKKLKQLMGAERIRARRKKLK第30页,讲稿共79张,创作于星期三31二、蛋白质二级结构预测的意义二、蛋白质二级结构预测的意义蛋蛋白白质质二二级级结结构构预预测测不不仅仅仅仅可可以以给给出出二二级级结结构构信信息息,在在实实际际工工作作中中有广泛的用途。有广泛的用途。由由蛋蛋白白质质二二级级结结构构统统计计分分析析得得到到的的规规则则可可用用于于全全新新蛋蛋白白质质设设计计或蛋白质突变体的设计或蛋白质突变体的设计。当当序序列列同同源源性性较较低低时时,二二级级结结构构的的指指认认有有助助于于确确定定蛋蛋白白质质间间结结构与功能的关系构与功能的关系。在在同同源源蛋蛋白白质质模模建建中中,二二级级结结构构预预测测有有助助于于建建立立正正确确的的序序列列比对关系比对关系。在在基基于于二二级级结结构构片片段段堆堆积积的的三三级级结结构构预预测测中中正正确确的的二二级级结结构构预预测测是第一步。是第一步。二二级级结结构构的的预预测测有有助助于于多多维维核核磁磁共共振振中中二二级级结结构构的的指指认认,同同时也有助于晶体结构的解析。时也有助于晶体结构的解析。第31页,讲稿共79张,创作于星期三32三、蛋白质二级结构预测的主要方法三、蛋白质二级结构预测的主要方法二级结构预测的方法大体分为三代:二级结构预测的方法大体分为三代:第一代第一代是基于是基于单个氨基酸残基单个氨基酸残基统计分析统计分析从有限的数据集中提取各种残基形成特定二级结构的倾向,以此从有限的数据集中提取各种残基形成特定二级结构的倾向,以此作为二级结构预测的依据。作为二级结构预测的依据。第二代第二代预测方法是基于预测方法是基于氨基酸片段氨基酸片段的统计分析的统计分析统计的对象是氨基酸片段统计的对象是氨基酸片段片段的长度通常为片段的长度通常为11-2111-21片段体现了中心残基所处的片段体现了中心残基所处的环境环境在预测中心残基的二级结构时,以残基在特定环境形成特定在预测中心残基的二级结构时,以残基在特定环境形成特定二级结构的倾向作为预测依据二级结构的倾向作为预测依据 第32页,讲稿共79张,创作于星期三33第一代和第二代预测方法对三态预测的准确第一代和第二代预测方法对三态预测的准确率都小于率都小于70%70%,而对,而对 折叠预测的准确率仅为折叠预测的准确率仅为2828 48%48%。其主要原因是只利用局部信息其主要原因是只利用局部信息第三代第三代方法方法:考虑多条序列的同源进化信息考虑多条序列的同源进化信息 运用长程信息和蛋白质序列的进化信息运用长程信息和蛋白质序列的进化信息 准确度有了比较大的提高准确度有了比较大的提高第33页,讲稿共79张,创作于星期三341 1ChouChouFasmanFasman方法方法 ChouChouFasmanFasman方方法法曾曾经经是是、现现在在仍仍然然是是最最为为普普遍遍应应用用的的方方法法。其其基基本本出出发发点点在在于于对对于于蛋蛋白白质质2020种种不不同同的的氨氨基基酸酸残残基基在在不不同同的的二二级级结结构构中中出出现现的的几几率率进进行行统统计计分分析析得得出出在在不不同二级结构中出现的倾向性。同二级结构中出现的倾向性。2 2GORGOR方法方法 GORGOR(GarnierGarnierOsguthorpeOsguthorpeRobsonRobson)方方法法基基于于信信息息论论算法,是所有算法,是所有统计算法统计算法中理论基础最好的。中理论基础最好的。3 3最近邻居方法最近邻居方法 在在最最近近邻邻居居方方法法(nearest nearest neighbor neighbor methodmethod)中中新新测测定定的的序序列被归类于与已知的最相近的序列具有相同的二级结构。列被归类于与已知的最相近的序列具有相同的二级结构。第34页,讲稿共79张,创作于星期三354 4神经网络方法神经网络方法相相对对而而言言神神经经网网络络方方法法便便于于应应用用,有有较较高高的的预预测测准准确确度度。最最大大的的缺缺点点是是没没有有明明确确的的物物理理化化学学意意义义。其其中中PHDPHD方方法法 是是广泛应用的预测方法。广泛应用的预测方法。5 5基于多重序列比对的二级结构预测基于多重序列比对的二级结构预测 基基于于单单个个序序列列的的二二级级结结构构预预测测方方法法的的预预测测准准确确度度相相对对较较低低,大大约约在在5858左左右右。而而基基于于多多重重序序列列比比对对的的二二级级结结构构预预测测方法方法PSI-PREDPSI-PRED的预测准确度可达到的预测准确度可达到7777。第35页,讲稿共79张,创作于星期三36四、二级结构预测的准确度四、二级结构预测的准确度二级结构预测方法针对不同蛋白质所给出的准二级结构预测方法针对不同蛋白质所给出的准确度可能会有很大差别。确度可能会有很大差别。1 1)单序列的预测准确度在)单序列的预测准确度在6060左右。左右。2 2)应用多重序列对比信息的二级结构预测准确度在)应用多重序列对比信息的二级结构预测准确度在 65658585之间。之间。第36页,讲稿共79张,创作于星期三37五、二级结构在线预测五、二级结构在线预测许许多多蛋蛋白白质质二二级级结结构构预预测测程程序序可可以以从从因因特特网网上上免免费费下下载载至至本本地地计计算算机机进进行行蛋蛋白白二二级级结结构构预预测测。另另外外,还还可可以以进进行行在在线线计计算:可以通过送算:可以通过送EmailEmail的方式,也可以在因特网上实时计算。的方式,也可以在因特网上实时计算。可以进行二级结构可以进行二级结构在线预测在线预测两个网站为:两个网站为:1 1PHDPHD算法算法 PredictProteinPredictProtein网站的地址为:网站的地址为:http:/www.predictprotein.org/2 2SSPro 4.0(SSPro 4.0(神经网络)神经网络)http:/scratch.proteomics.ics.uci.edu/第37页,讲稿共79张,创作于星期三38PredictProteinhttp:/www.predictprotein.org/可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息蛋白质序列的结构信息该方法的平均准确率超过该方法的平均准确率超过72%,最佳残基预测准确率达,最佳残基预测准确率达90%以上。以上。因此,被视为蛋白质二级结构预测的标准。因此,被视为蛋白质二级结构预测的标准。需要学术邮箱注册需要学术邮箱注册第38页,讲稿共79张,创作于星期三39PredictProtein提交界面提交界面第39页,讲稿共79张,创作于星期三401D序列预测PROFsec(默认)是PHDsec的改进版本:基于轮廓(profile)的神经网络算法预测蛋白质二级结构PROFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDhtm(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性来预测蛋白质结构域CHOP预测蛋白质结构域结构表面识别ConSeq预测蛋白质表面结构功能关键区域分析方法程序详解分析方法程序详解第40页,讲稿共79张,创作于星期三41跨膜区跨膜区非跨膜区非跨膜区第41页,讲稿共79张,创作于星期三42LoopHelixSheet第42页,讲稿共79张,创作于星期三43第43页,讲稿共79张,创作于星期三44结果发送至邮箱结果发送至邮箱第44页,讲稿共79张,创作于星期三45结果直接发送至邮箱,如下:结果直接发送至邮箱,如下:第45页,讲稿共79张,创作于星期三46(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(多通道跨膜蛋白)(d)-Lipid chain-anchored membrane proteins(链吸附酯膜蛋白)(e)-GPI-anchored membrane proteins(GPI吸附膜蛋白)(糖基磷脂酰肌醇)糖基磷脂酰肌醇)六、蛋白质跨膜区分析六、蛋白质跨膜区分析第46页,讲稿共79张,创作于星期三47螺旋跨膜区主要是由螺旋跨膜区主要是由20-30个疏水性氨基酸(个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成。等)组成。亲水残基往往出现在疏水残基之间,对功能有重要的亲水残基往往出现在疏水残基之间,对功能有重要的作用。作用。基于亲基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量。偏好性量。蛋白质跨膜区特性蛋白质跨膜区特性第47页,讲稿共79张,创作于星期三48跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 -Landolt Marticorena et al.,1993胞外末端Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外-内分界区域Trp(色氨酸)跨膜区Leu(亮氨酸(亮氨酸)、Ile(异亮氨酸异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸(甘氨酸)胞内-外分界区域Tyr(酪氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端Lys(赖氨酸)和Arg(精氨酸)第48页,讲稿共79张,创作于星期三常用蛋白质跨膜区域分析工具常用蛋白质跨膜区域分析工具工具网站备注DAShttp:/www.sbc.su.se/miklos/DAS/用Dense Alignment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPhttp:/www.enzim.hu/hmmtop/由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具TMpredhttp:/www.ch.embnet.org/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序第49页,讲稿共79张,创作于星期三50TMpredTMpred工具工具:http:/www.ch.embnet.org/software/TMPRED_form.html依靠跨膜蛋白数据库Tmbase预测跨膜区和跨膜方向在在Expasy网站上有链接:网站上有链接:http:/expasy.org/tools/第50页,讲稿共79张,创作于星期三51第51页,讲稿共79张,创作于星期三52主要参数主要参数/选项选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列第52页,讲稿共79张,创作于星期三53输出结果输出结果包含四个部分可能的跨膜螺旋区相关性列表可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表位置位置分值分值 片段中点位置片段中点位置第53页,讲稿共79张,创作于星期三5454 跨膜拓扑模型及图示跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型每一位置计算分值每一位置计算分值最优拓最优拓扑结构扑结构第54页,讲稿共79张,创作于星期三55TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM/第55页,讲稿共79张,创作于星期三56输出结果输出结果第56页,讲稿共79张,创作于星期三6.4 三三级结构预测级结构预测第57页,讲稿共79张,创作于星期三58三维结构数据与一维序列数据在量上增长速度严三维结构数据与一维序列数据在量上增长速度严重不协调。重不协调。原因:原因:1直接测定法:速度慢直接测定法:速度慢2预测法:在方法上,还没有一个方法或程序可以真预测法:在方法上,还没有一个方法或程序可以真正做到所谓的正做到所谓的“从头从头”预测蛋白的三维结构。预测蛋白的三维结构。第58页,讲稿共79张,创作于星期三59一、同源蛋白质结构预测一、同源蛋白质结构预测 又称又称同源模型化方法同源模型化方法主要思想:主要思想:对于一个未知结构的蛋白质,找到一个已知结构的同源蛋对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。立结构模型。依据:依据:任何一对蛋白质,如果两者的序列任何一对蛋白质,如果两者的序列等同等同部分超过部分超过30%30%,则它们,则它们具有相似的三维结构,即两个蛋白质的基本折叠相同,只具有相似的三维结构,即两个蛋白质的基本折叠相同,只是在非螺旋和非折叠区域的一些细节部分有所不同。是在非螺旋和非折叠区域的一些细节部分有所不同。第59页,讲稿共79张,创作于星期三60同源蛋白质结构预测的方法同源蛋白质结构预测的方法1)片段组装法:)片段组装法:SWISS-MODEL2)距离几何法:)距离几何法:MODELLERSWISS-MODEL:http:/swissmodel.expasy.org/SWISS-MODEL.html第60页,讲稿共79张,创作于星期三61第61页,讲稿共79张,创作于星期三62第62页,讲稿共79张,创作于星期三63最后的预测结果最后的预测结果第63页,讲稿共79张,创作于星期三64模板序列与查询模板序列与查询序列的装载序列的装载结构的精细比对结构的精细比对分子骨架的形成分子骨架的形成侧链形成和优化侧链形成和优化加入氢原子、优加入氢原子、优化回环化回环能量最小化、结能量最小化、结构封装构封装SWISS-MODEL的工作过程:的工作过程:第64页,讲稿共79张,创作于星期三65二、蛋白质折叠类型识别二、蛋白质折叠类型识别又称又称线索化方法线索化方法有有很很多多蛋蛋白白质质具具有有相相似似的的空空间间结结构构,但但它它们们的的序列等同部分小于序列等同部分小于25%,即远程同源。,即远程同源。对对于于这这类类蛋蛋白白质质,很很难难通通过过序序列列比比对对找找出出它它们们之之间间的关系,必须设计新的分析方法。的关系,必须设计新的分析方法。第65页,讲稿共79张,创作于星期三66对于一个未知结构的蛋白质(对于一个未知结构的蛋白质(U),),如果找到一个已知结构的远程同源蛋白质(如果找到一个已知结构的远程同源蛋白质(T),),那么可以根据那么可以根据T的结构模板通过的结构模板通过远程同源模型化方远程同源模型化方法法建立建立U的三维结构模型。的三维结构模型。U T(远程同源)第66页,讲稿共79张,创作于星期三67线索化的主要思想:线索化的主要思想:利用氨基酸的结构倾向(如形成二级结构的利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构对应的结构是否能够适配到一个给定的结构环境中。环境中。第67页,讲稿共79张,创作于星期三68线索化方法一般有线索化方法一般有5个基本组成部分:个基本组成部分:(1)已知三维折叠结构的数据库;)已知三维折叠结构的数据库;(2)一种适合于进行序列)一种适合于进行序列-结构比对的三维折叠信结构比对的三维折叠信息的表示方法;息的表示方法;(3)一个序列)一个序列-结构匹配函数,该函数对匹配程度结构匹配函数,该函数对匹配程度进行打分;进行打分;(4)建立最优线索的策略,或者是进行序列)建立最优线索的策略,或者是进行序列-结结构比对的策略;构比对的策略;(5)一种评价序列)一种评价序列-结构比对显著性的方法。结构比对显著性的方法。第68页,讲稿共79张,创作于星期三69假设存在有限数目的核心折叠(假设存在有限数目的核心折叠(core folds)核心折叠实际上是构成蛋白质空间形状的基本模式。核心折叠实际上是构成蛋白质空间形状的基本模式。建立核心折叠数据库建立核心折叠数据库预测预测-建立线索建立线索U序列与数据库核心与数据库核心折叠比对折叠比对取最佳核心取最佳核心折叠折叠U结构模型第69页,讲稿共79张,创作于星期三70http:/www.sbg.bio.ic.ac.uk/phyre/index.cgiphyre与已知折叠与已知折叠子比对子比对第70页,讲稿共79张,创作于星期三71三、蛋白质结构从头预测三、蛋白质结构从头预测在既没有已知结构的同源蛋白质、也没在既没有已知结构的同源蛋白质、也没有已知结构的远程同源蛋白质的情况下,有已知结构的远程同源蛋白质的情况下,上述两种蛋白质结构预测的方法都不能上述两种蛋白质结构预测的方法都不能用,这时只能采用从头预测方法,即直用,这时只能采用从头预测方法,即直接或仅仅根据序列本身来预测其结构。接或仅仅根据序列本身来预测其结构。第71页,讲稿共79张,创作于星期三72从头预测方法一般由下列从头预测方法一般由下列3个部分组成:个部分组成:(1)一种蛋白质几何的表示方法)一种蛋白质几何的表示方法由于表示和处理所有原子和由于表示和处理所有原子和溶剂环境溶剂环境的计算开销非常大,的计算开销非常大,因此需要对蛋白质和溶剂的表示形式作近似处理。因此需要对蛋白质和溶剂的表示形式作近似处理。(2)一种)一种势函数势函数及其参数及其参数通过对已知结构的蛋白质进行统计分析确定势函数中的各通过对已知结构的蛋白质进行统计分析确定势函数中的各个参数。个参数。(3)一种构象空间搜索技术)一种构象空间搜索技术 构象空间搜索和势函数的建立是从头预测方法的关键。构象空间搜索和势函数的建立是从头预测方法的关键。第72页,讲稿共79张,创作于星期三73能量函数和优化能量函数和优化 需要考虑的相互作用需要考虑的相互作用疏水作用疏水作用氢键氢键二硫桥二硫桥静电作用静电作用范德华力范德华力溶剂作用溶剂作用第73页,讲稿共79张,创作于星期三74基于势函数或者力场的结构预测方法在实际应用中基于势函数或者力场的结构预测方法在实际应用中存在许多问题,主要原因存在许多问题,主要原因:我们还没有完全了解究竟是哪些力决定了蛋白质的折叠过程,我们还没有完全了解究竟是哪些力决定了蛋白质的折叠过程,同时这些力之间又是如何相互作用的。同时这些力之间又是如何相互作用的。力场参数不精确,没有对溶剂处理的好方法。力场参数不精确,没有对溶剂处理的好方法。构象搜索过程容易陷入局部能量极小点。构象搜索过程容易陷入局部能量极小点。自然折叠的蛋白质结构与一般蛋白质构象之间的能量差比较小。自然折叠的蛋白质结构与一般蛋白质构象之间的能量差比较小。研究蛋白质折叠的研究蛋白质折叠的计算量非常大计算量非常大。第74页,讲稿共79张,创作于星期三75方法特点工具同源建模法(Homology/Comparative modelling)基于序列同源比对,对于序列相似度30的序列模拟比较有效,最常用的方法 SWISS-MODEL,CPHmodels 线索化法/折叠识别法(Threading/Fold recognition)“穿”入已知的各种蛋白质折叠骨架内,适于对蛋白质核心结构进行预测,计算量大PHYRETHREADER,从头预测法(Ab initio/De novo methods)基于分子动力学,寻找能量最低的构象,计算量大,只能做小分子预测HMMSTR/ROSSETA蛋白质三维结构预测方法比较蛋白质三维结构预测方法比较第75页,讲稿共79张,创作于星期三76 对各种方法所得到的蛋白质结构预测结果需要进行验证,以确对各种方法所得到的蛋白质结构预测结果需要进行验证,以确定预测方法是否可行,确定其适应面。定预测方法是否可行,确定其适应面。验证的一种方法是取已知结构的蛋白质,对这些蛋白质进行模拟结验证的一种方法是取已知结构的蛋白质,对这些蛋白质进行模拟结构预测,并将预测结构与真实结构进行比较,分析两者之间的差距。构预测,并将预测结构与真实结构进行比较,分析两者之间的差距。权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在权威的评判机构,建立公共认可的蛋白质结构测试数据集。设立在加利福尼亚大学的加利福尼亚大学的蛋白质结构预测中心蛋白质结构预测中心就是这样一个系统就是这样一个系统(http:/predictioncenter.gc.ucdavis.edu/)四、预测方法评价四、预测方法评价第76页,讲稿共79张,创作于星期三77五、蛋白质结构预测发展趋势五、蛋白质结构预测发展趋势1997年,美、欧、加、日科学家提出年,美、欧、加、日科学家提出“结构基

    注意事项

    本文(蛋白质结构预测的原理与方法精选PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开