生物信息学-第六章-蛋白质结构预测及分子设计课件.ppt
《生物信息学-第六章-蛋白质结构预测及分子设计课件.ppt》由会员分享,可在线阅读,更多相关《生物信息学-第六章-蛋白质结构预测及分子设计课件.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物信息学第六章 蛋白质结构预测及分子设计引子单个蛋白n 涉及的问题结构预测(2D, 3D)物理化学性质功能空间位置n 研究方法提取纯化制作晶体,决定结构理解机制,功能多个蛋白n 涉及的问题表达过程(DNARNA蛋白,调控网络)相互作用(yeast two-hybrid,亲和层析)蛋白家族(family)检测(2D-PAGE,质谱仪,蛋白质芯片)n 研究方法基因组测序蛋白预言计算机分析结构理解机制,功能 一级结构(primary):氨基酸序列 二级结构(secondary):螺旋、片层、. 三级(维)结构(tertiary):亚基,结构域 四级结构(quaternary):亚基之间特定的空间关
2、系蛋白质的结构n 一些单氨基酸(aa)突变可引起蛋白结构的重大变化n CFTR的F508突变改变螺旋结构,从而改变其功能n 另一些变化则不明显n 一些蛋白引起的疾病n 囊肿性纤维化(cystic fibrosis): CFTRn 镰刀性贫血: 血红蛋白n 疯牛病: 朊蛋白n 阿尔兹海默氏征: 淀粉样前体蛋白蛋白结构与人类疾病 (重要性)蛋白结构的主要仓库 PDB PDB 始建于1971 32000个结构数据(其中约3万是蛋白)读取读取PDB文件的门户网站文件的门户网站解释解释PDB文件的数据库文件的数据库用”PubMed”PubMed”搜蛋白结构(NCBI)(NCBI)1、进入”PubMed”
3、2、选择”Structure”3、输入要找的蛋白名称或ID号等(如RecBCD, E. coli DNA repair)4、点击”Go”5、点击感兴趣的结果(1W36,进入MMDB)n 结果列表中包含相关蛋白(powered by BLAST)、文献、结构域(domain)、配体(ligand)、3D缩略图、三维查看器在MMDBMMDB看搜到蛋白的结构(NCBI)(NCBI) MMDB (Molecular Modeling Database): NCBI的大分子三维结构数据库,数据来自PDB 打开的单个蛋白的页面中包括 文献、简单描述、入库日期、物种(taxonomy) 该蛋白的PDB, V
4、AST链接(entire chain/View 3D Alignment) 三维查看器(Cn3D) 分子成分(图): chain, 3D domain, classification/family, ligand点击其中的PDB (RCSB)PDB (RCSB)链接,显示 三维结构实验数据 蛋白分类pSCOP链接: 结构域(家族,超家族)pCATH链接: 域, Class, Architecture, Topology, HomologypGO链接: 功能,过程,细胞组成 更多信息p生化性质,配体,SNPp(Sequence Details)图形显示各域的分布,类别,DSSP二级结构,PDP域
5、p更多外部链接(对于RecBCD多达26个)更多有用的链接 PDB的外部链接中Compute pI Mw点击Chain B (可计算各链分子量) 在打开的Compute pI/Mw页面中点击EX5B_ECOLI (ExPASy,大量信息,链接) 在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824-MONOMER (biocyc,参与的反应/路径图)蛋白质结构分析蛋白质结构分析蛋白质一级结构蛋白质一级结构蛋白质基本理化性质分析蛋白质基本理化性质分析蛋白质亲疏水性分析蛋白质亲疏水性分析蛋白质跨膜区结构预测蛋白质跨膜区结构预测蛋白质二级结构蛋白质二级结构蛋白质二级
6、结构预测蛋白质二级结构预测(螺旋,螺旋,折叠等)折叠等)蛋白质超二级结构蛋白质超二级结构蛋白质结构域分析蛋白质结构域分析蛋白质三级结构蛋白质三级结构蛋白质三维结构模拟蛋白质三维结构模拟蛋白质结构预测过程蛋白质结构预测过程ORF翻译翻译实验数据实验数据蛋白质理化性质蛋白质理化性质和一级结构和一级结构数据库搜索数据库搜索结构域匹配结构域匹配已知结构的已知结构的同源蛋白?同源蛋白?三维结构模型三维结构模型可用的折可用的折叠模型?叠模型?同源同源建模建模有有二级二级结构预测结构预测无无串线法串线法有有从头从头预测预测无无蛋白质的基本性质:蛋白质的基本性质:相对分子质量 氨基酸组成 等电点(pI) 消光
7、系数半衰期 不稳定系数 总平均亲水性 .AACompldent利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白Compute pI/Mw计算蛋白质序列的等电点和分子量ProtParam对氨基酸序列多个物理和化学参数(分子量、等电点、吸光系数等)进行计算PeptideMass计算相应肽段的pI和分子量SAPS利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白质理化性质分析工具蛋白质理化性质分析工具ProtParam 工具简介工具简介基于蛋白质序列的组分分析基于蛋白质序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考氨基酸亲疏水性等分析为高级结构预测提供参考Expasy 开发的针对
8、蛋白质基本理化性质的分析:开发的针对蛋白质基本理化性质的分析: ProtParam 工具工具 计算以下物理化学性质:计算以下物理化学性质:相对分子质量 氨基酸组成等电点(pI) 消光系数半衰期 不稳定系数总平均亲水性 如果分析如果分析Swiss-ProtSwiss-Prot和和TrEMBLTrEMBL数据库中序列数据库中序列 直接填写直接填写Swiss-Prot/TrEMBL ACSwiss-Prot/TrEMBL AC号号(accession number)(accession number) 如果分析新序列:如果分析新序列: 直接在搜索框中粘贴氨基酸序列直接在搜索框中粘贴氨基酸序列prot
9、eins in water measured at 280 nm: Ext(Tyr) = 1490, Ext(Trp) = 5500, Ext(Cystine) = 125注意:注意:ProtParamProtParam没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。蛋白质结构预测跨膜区预测:跨膜区预测:膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,同时发膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,
10、同时发挥着重要的生理功能。挥着重要的生理功能。一、跨膜区分析(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins蛋白质跨膜区特性蛋白质跨膜区特性 典型的跨膜螺旋区主要是由2030个疏水性疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成; 亲水残基往往出现在疏水残基之间,对功能有重要的作用; 基于亲
11、/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。跨膜蛋白序列跨膜蛋白序列“ “边界边界” ”原则原则 胞外末端胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸) 胞外胞外- -内分界区内分界区:Trp(色氨酸) 跨膜区跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸) 胞内胞内- -外分界区外分界区:Tyr(络氨酸)、 Trp(色氨酸)和Phe(苯丙氨酸) 胞内末端胞内末端:Lys(赖氨酸)和Arg(精氨酸)DAS用Dense Ali
12、gnment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOP由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUI由Nagoya大学开发一个具有图形显示跨膜区的程序TMAP基于多序列比对来预测跨膜区的程序TMHMM基于HMM方法的蛋白质跨膜区预测工具TMpred基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPred是一个位于法国的蛋白质拓扑结构预测程序TMpred 工具简介工具简介 依靠跨膜蛋白数据库依靠跨膜蛋白数据库TMbaseTMbase 预测跨膜区和跨膜方向预测跨膜区和跨膜方向主要参数主要参数/ /选项选项序列在线提交形式:
13、序列在线提交形式:直接贴入蛋白序列直接贴入蛋白序列填写填写SwissProt/TrEMBL/EMBL/EST的的ID或或AC输出结果输出结果可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表26二、信号肽分析信号肽:信号肽:指分泌蛋白表达时氨基端(指分泌蛋白表达时氨基端(N-N-,有时不在,有时不在N N端)的端)的2020余个氨基酸,将引余个氨基酸,将引导该蛋白质最终分泌到细胞外,但这段信号肽会被信号肽酶切掉,所以成熟的分导该蛋白质最终分泌到细胞外,但这段信号肽会被信号肽酶切掉,所以成熟的分泌蛋白是不含这段信号肽的。信号肽可以指导蛋白质的跨膜转移。泌蛋白是不含这段信号肽的。信号肽可以指导蛋
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 第六 蛋白质 结构 预测 分子 设计 课件
限制150内