蛋白质结构和功能预测PPT课件.ppt
《蛋白质结构和功能预测PPT课件.ppt》由会员分享,可在线阅读,更多相关《蛋白质结构和功能预测PPT课件.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于蛋白质结构与功能预测第一张,PPT共七十八页,创作于2022年6月2实习一实习一基因组数据注释和功能分析基因组数据注释和功能分析实习二实习二核苷酸序列分析核苷酸序列分析实习三实习三芯片的基本数据处理和分析芯片的基本数据处理和分析实习四实习四蛋白质结构与功能分析蛋白质结构与功能分析实习五实习五蛋白质组学数据分析蛋白质组学数据分析实习六实习六系统生物学软件实习系统生物学软件实习实习课程内容实习课程内容基因组学基因组学转录物组学转录物组学蛋白质组学蛋白质组学系系统统生生物物学学第二张,PPT共七十八页,创作于2022年6月3DNA sequenceProtein sequenceProtein
2、structureProtein function第三张,PPT共七十八页,创作于2022年6月蛋白质序列分析蛋白质序列分析蛋白质一级序列蛋白质一级序列蛋白质基本理化性质分析蛋白质基本理化性质分析蛋白质亲疏水性分析蛋白质亲疏水性分析跨膜区结构预测跨膜区结构预测翻译后修饰位点预测翻译后修饰位点预测蛋白质二级结构蛋白质二级结构蛋白质二级结构预测蛋白质二级结构预测蛋白质序列信号位点分析蛋白质序列信号位点分析蛋白质超二级结构蛋白质超二级结构蛋白质结构域分析蛋白质结构域分析蛋白质三级结构蛋白质三级结构蛋白质三维结构模拟蛋白质三维结构模拟蛋白质序列分析主要内容蛋白质序列分析主要内容第四张,PPT共七十八页
3、,创作于2022年6月5蛋白质结构预测过程ORF翻译实验数据蛋白质序列蛋白质理化性质和一级结构数据库搜索结构域匹配已知结构的同源蛋白?三维结构模型可用的折叠模型?同源建模有二级结构预测无串线法有从头预测无第五张,PPT共七十八页,创作于2022年6月6ExPASy(Expert Protein Analysis System)Tools(http:/expasy.org/tools/)第六张,PPT共七十八页,创作于2022年6月7一、蛋白质理化性质分析使用工具:Protparam二、跨膜区分析使用工具:Tmpred三、二级结构分析使用工具:PredictProtein Server四、结构域
4、分析使用工具:InterProScan五、蛋白质三级结构分析使用工具:SWISS-MODEL/SWISS-PdbViewer数据:C:ZCNIshixi4protein.txt 课程安排课程安排第七张,PPT共七十八页,创作于2022年6月一、蛋白质基本理化性质分析一、蛋白质基本理化性质分析 蛋白质理化性质是蛋白质研究的基础蛋白质的基本性质:相对分子质量 氨基酸组成等电点(PI)消光系数半衰期 不稳定系数总平均亲水性 实验方法:相对分子质量的测定、等电点实验、沉降实验缺点:费时、耗资基于实验经验值的计算机分析方法第八张,PPT共七十八页,创作于2022年6月工具工具网站网站备备注注AAComp
5、ldenthttp:/expasy.org/tools/aacomp/利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白Compute pI/Mwhttp:/expasy.org/tools/pi_tool.html计算蛋白质序列的等电点和分子量ProtParamhttp:/expasy.org/tools/protparam.html对氨基酸序列多个物理和化学参数(分子量、等电点、吸光系数等)进行计算PeptideMasshttp:/expasy.org/tools/peptide-mass.html计算相应肽段的pI和分子量SAPShttp:/www.isrec.isb-sib.ch/s
6、oftware/SAPS_form.html利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白蛋白质质理化性理化性质质分析工具分析工具第九张,PPT共七十八页,创作于2022年6月10AACompIdent PeptideMass第十张,PPT共七十八页,创作于2022年6月ProtparamProtparam基于蛋白质序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy 开发的针对蛋白质基本理化性质的分析:Protparam 工具 http:/www.expasy.org/tools/protparam.html计算以下物理化学性质:计算以下物理化学性质:相对分子质量
7、氨基酸组成等电点(PI)消光系数半衰期 不稳定系数总平均亲水性 第十一张,PPT共七十八页,创作于2022年6月12主要选项主要选项/参数参数如果分析SWISS-PORT和TrEMBL数据库中序列直接填写Swiss-Prot/TrEMBL AC号(accession number)如果分析新序列:直接在搜索框中粘贴氨基酸序列输入输入Swiss-Prot/TrEMBL AC号号打开打开protein.txt,将蛋白质序列将蛋白质序列粘贴在搜索框中粘贴在搜索框中第十二张,PPT共七十八页,创作于2022年6月13输入Swiss-Prot/TrEMBL AC号分不同的功能域肽段输出结果输出结果 功能
8、域功能域用户自定义区段用户自定义区段第十三张,PPT共七十八页,创作于2022年6月14返回结果返回结果氨基酸数目氨基酸数目相对分子质量相对分子质量理论理论 pI 值值氨基酸组成氨基酸组成正正/负电荷残基数负电荷残基数第十四张,PPT共七十八页,创作于2022年6月15消光系数消光系数半衰期半衰期原子组成原子组成分子式分子式总原子数总原子数第十五张,PPT共七十八页,创作于2022年6月16不稳定系数不稳定系数脂肪系数脂肪系数总平均亲水性总平均亲水性40 unstable第十六张,PPT共七十八页,创作于2022年6月17练习一:练习一:ProtparamProtparamhttp:/www.
9、expasy.org/tools/protparam.html数据:C:ZCNIshixi4protein.txt第十七张,PPT共七十八页,创作于2022年6月(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins二、蛋白质跨膜区分析二、蛋白质跨膜区分析第十八张,PPT共七十八页,创作于2022年6月螺旋跨膜区主要是
10、由20-30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成亲水残基往往出现在疏水残基之间,对功能有重要的作用基于亲/疏水量和蛋白质膜区每个氨基酸的统计学分布偏好性量蛋白质跨膜区特性蛋白质跨膜区特性第十九张,PPT共七十八页,创作于2022年6月20跨膜蛋白序列跨膜蛋白序列“边界边界”原则原则 -Landolt Marticorena et al.,1993胞外末端Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)胞外-内分界区域Trp(色氨酸)跨膜区Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cy
11、s(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞内-外分界区域Tyr(络氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞内末端Lys(赖氨酸)和Arg(精氨酸)第二十张,PPT共七十八页,创作于2022年6月常用蛋白常用蛋白质质跨膜区域分析工具跨膜区域分析工具工具工具网站网站备备注注DAShttp:/www.sbc.su.se/miklos/DAS/用Dense Alignment Surface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOPhttp:/www.enzim.hu/hmmtop/由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUI
12、http:/bp.nuap.nagoya-u.ac.jp/sosui/由Nagoya大学开发一个具有图形显示跨膜区的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比对来预测跨膜区的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于HMM方法的蛋白质跨膜区预测工具TMpredhttp:/www.ch.embnet.org/software/TMPRED_form.html基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqan
13、al/interfaces/toppred.html是一个位于法国的蛋白质拓扑结构预测程序第二十一张,PPT共七十八页,创作于2022年6月22TMpredTMpred工具工具:http:/www.ch.embnet.org/software/TMPRED_form.html依靠跨膜蛋白数据库Tmbase预测跨膜区和跨膜方向第二十二张,PPT共七十八页,创作于2022年6月23主要参数主要参数/选项选项序列在线提交形式:直接贴入蛋白序列填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式输出格式最短和最长的跨膜螺旋疏水区长度最短和最长的跨膜螺旋疏水区长度输入序列名(可选)
14、输入序列名(可选)选择序列的格式选择序列的格式贴入贴入protein.txt蛋白蛋白质序列质序列第二十三张,PPT共七十八页,创作于2022年6月24输出结果输出结果包含四个部分可能的跨膜螺旋区相关性列表可能的跨膜螺旋区可能的跨膜螺旋区相关性列表相关性列表位置位置分值分值 片段中点位置片段中点位置第二十四张,PPT共七十八页,创作于2022年6月25 跨膜拓扑模型及图示跨膜拓扑模型及图示建议的跨膜拓扑模型建议的跨膜拓扑模型每一位置计算分值每一位置计算分值最优拓最优拓扑结构扑结构第二十五张,PPT共七十八页,创作于2022年6月26TMHMM第二十六张,PPT共七十八页,创作于2022年6月27
15、第二十七张,PPT共七十八页,创作于2022年6月28练习二:练习二:TMpredhttp:/www.ch.embnet.org/software/TMPRED_form.html数据:C:ZCNIshixi4protein.txt第二十八张,PPT共七十八页,创作于2022年6月三、蛋白质二级结构预测三、蛋白质二级结构预测 基本的二级结构螺旋,折叠,转角,无规则卷曲(coils)以及模序(motif)等蛋白质局部结构组件 分析方法:基于统计和机器学习方法进行预测Chou-Fasman算法GOR算法多序列列线预测基于神经网络的序列预测基于已有知识的预测方法(knowledge based me
16、thod)混合方法(hybrid system method)第二十九张,PPT共七十八页,创作于2022年6月工具工具网站网站备备注注BCM SearchLauncher http:/searchlauncher.bcm.tmc.edu/包括了常见的蛋白质结构分析程序入口,一般分析可以以此服务器作为起点HNNhttp:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_nn.html基于神经网络的分析工具,含序列到结构过程和结构到结构处理Jpredhttp:/pbio.dundee.ac.uk/www-jpred/submit.html基
17、于Jnet神经网络的分析程序,并采用PSI-BLAST来构建序列Profile进行预测,对于序列较短、结构单一的蛋白预测较好nnPredicthttp:/pbio.ucsf.edu/nomi/nnpredict.html预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋NNSSPhttp:/bioweb.pasteur.fr/seqanal/interfaces/nnssp-simple.html基于双层前反馈神经网络为算法,还考虑到蛋白质结构分类信息PREDATORhttp:/bioweb.pasteur.fr/seqanal/interfaces/predator-simple.html预测时
18、考虑了氨基酸残基间的氢键蛋白蛋白质质二二级结级结构分析工具构分析工具第三十张,PPT共七十八页,创作于2022年6月工具工具网站网站备备注注PredictProteinhttp:/www.predictprotein.org/提供多项蛋白质性质分析,并有较好准确性Profhttp:/www.aber.ac.uk/phiwww/prof/基于多重序列比对预测工具PSIpredhttp:/bioinf.cs.ucl.ac.uk/psipred/psiform.html提供跨膜蛋白拓扑结构预测和蛋白profile折叠结构识别工具SOPMAhttp:/npsa-pbil.ibcp.fr/cgi-bin
19、/npsa_automat.pl?page=npsa_sopma.html可以比较各种分析方法得到的结果,也可输出“一致性结果”SSPREDhttp:/coot.embl.de/fmilpetz/SSPRED/sspred.html基于数据库搜索相似蛋白并构建多重序列比对蛋白蛋白质质二二级结级结构分析工具构分析工具第三十一张,PPT共七十八页,创作于2022年6月32第三十二张,PPT共七十八页,创作于2022年6月33PredictProteinPredictProteinPredictProteinhttp:/www.predictprotein.org/可以获得功能预测、二级结构、基序、
20、二硫键结构、结构域等许多蛋白质序列的结构信息该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准第三十三张,PPT共七十八页,创作于2022年6月PredictProtein提交界面提交界面可展开可展开选项选项第三十四张,PPT共七十八页,创作于2022年6月35PredictProtein提交界面详解提交界面详解提交邮件提交邮件地址(必填)地址(必填)蛋白名称(可蛋白名称(可选)选)分析方法分析方法第三十五张,PPT共七十八页,创作于2022年6月361D序列预测PROFsec(默认)基于轮廓(profile)的神经网络算法预测蛋白质二级结构PR
21、OFacc(默认)基于轮廓(profile)的神经网络算法预测残基溶剂可及性PHDhtm(默认)基于多序列比对预测跨膜区位置和拓扑结构ASP(默认)识别二级结构中构型变化的氨基酸COILS(默认)识别卷曲螺旋PROFtmb识别革兰氏阴性菌膜Beta桶蛋白结构序列基序识别ProSite(默认)搜索序列中保守基序SEG(默认)过滤序列中低复杂区域PredictNLS(默认)基于实验数据预测序列核定位区域二硫键识别DISULFIND(默认)识别序列中二硫键位置折叠子识别AGAPE基于折叠结构识别远源蛋白序列残基接触预测PROFcon预测单链中原子残基接触性结构域预测ProDom(默认)基于序列同源性
22、来预测蛋白质结构域CHOP预测蛋白质结构域结构表面识别ConSeq预测蛋白质表面结构功能关键区域分析方法程序详解分析方法程序详解第三十六张,PPT共七十八页,创作于2022年6月37跨膜螺旋预测(跨膜螺旋预测(PHDhtm)高级选项)高级选项Ambivalent序列识别(序列识别(ASP)高级选项)高级选项CHOP结构域分析工具高级选项结构域分析工具高级选项第三十七张,PPT共七十八页,创作于2022年6月38比对内容比对内容从从SWISS-PROT数据库返回数据库返回BLAST搜索结果搜索结果MaxHom参数选项参数选项最低序列比对最低序列比对一致性一致性空位间隔罚分空位间隔罚分空位延伸罚分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 蛋白质 结构 功能 预测 PPT 课件
限制150内