《课程设计77297(10页).doc》由会员分享,可在线阅读,更多相关《课程设计77297(10页).doc(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-课程设计77297-第 10 页1. 课程设计目的:专业课程设计是面向生物技术方向高年级学生的综合性课程。目的是使学生进一步巩固加深所学的基础理论、基本技能和专业知识,使之系统化、综合化;培养学生独立工作、独立思考并运用已学的基本理论和知识解决实际问题的能力;培养学生的科学素质,提高学生的抽象思维能力、加强培养学生自己获取知识和更新知识的能力。本课程通过应用生物信息学的方法,从公用数据库上收集自己所需的数据,并用计算机进行处理,从而获取自己所需要的信息。独立于另外两个专业课设,此次课设主要应用生物信息学的方法,通过网络资源挖掘所需的核酸与蛋白质的秘密,完成所给任务。2. 课程设计题目选择:课
2、设题目选择:此次课程设计包括两个方面(任选一个):为核酸和蛋白质。前者为在人的基因组中,搜索可能的新基因。后者为应用网络资源对所感兴趣蛋白质进行分析,分析其结构与功能关系或对一未知功能的蛋白质进行功能预测与分析。蛋白质直接关系表达结果问题,研究意义重大。分析蛋白质结构、功能及其关系是蛋白质组计划中的一个重要组成部分。研究蛋白质结构,有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质(或其它分子)之间的相互作用,这无论是对于生物学还是对于医学和药学,都是非常重要的。对于未知功能或者新发现的蛋白质分子,通过结构分析,可以进行功能注释,指导设计进行功能确认的生物学实验。通过分析
3、蛋白质的结构,确认功能单位或者结构域,可以为遗传操作提供目标,为设计新的蛋白质或改造已有蛋白质提供可靠的依据,同时为新的药物分子设计提供合理的靶分子结构。 课设题目确定: 上学期被选进福州大学生物工程研究所细胞组,承担对毕赤酵母发酵的PTD(TAT)-SOD蛋白分子即PS2蛋白分子性质的表征。经过凝胶过滤层析技术和SDSPAGE,糖蛋白的BSA染色,多糖电泳确定了PS2在分子结构特征上存在多聚体、和糖基化现象。为此想以此课程设计为契机,对PS2蛋白分子进行生物信息学的分析进一步评价PS2蛋白结构和功能的关系。本文借助从UnProt蛋白数据库中搜集到足够数量和不同物种来源Cu,ZnSOD;运用生
4、物信息学软件进行序列比对,和绘制进化树。对所得结果进行分析。然后用得到的保守序列作为出发序列搜索相关数据库,(例如PROSITE数据库),从而分析该序列的功能和结构信息,及功能和结构的关系,并对PS2蛋白分子进行基于一级结构的物理化学性质和生物化学性质、二级结构信息等进行预测。3PS2蛋白简介人铜,锌超氧化物歧化酶(hCuZn-SOD)是一种重要的胞内酶,对机体的氧化和抗氧化平衡起着至关重要的作用,此酶能清除超氧阴离子自由基,保护细胞免受损伤,因此SOD有非常广泛的应用前景,但是SOD是一种大分子物质,外源的野生型SOD很难跨膜进入细胞发挥其生物活性。蛋白转导区域(PTD)的核心序列是段多肽片
5、断,该多肽片断介导蛋白的转导及其在细胞内的定位。本研究所巧妙地运用该多肽片断,构建毕赤酵母菌株将PTD与SOD联接,制备出PTD-SOD4-5,即PS2活性蛋白。 TAT-PTD的发现人类免疫缺陷病病毒(HIV)表达反式激活蛋白TAT是一个与RNA 结合的核蛋白,为HIV感染早期所合成的小分子调节蛋白,能促进HIV基因表达,增加HIV病毒的复制和感染性。1988年Green56和Frankel57首次报告了HIV-1TAT蛋白具有穿过生物膜的能力,全长86个氨基酸,具有3个功能结构域:其一是对于反式激活尤为重要的酸性N-端区域;其二是富含半胱氨酸的DNA结合区(2237位氨基酸),带有一个锌指
6、基元;其三为碱性区(包括第4758位氨基酸),该功能区主要介导Tat蛋白发生细胞内在化。1994年,Fawell et al60.将这一理论衍生,他们指出将TAT的36个氨基酸与一个异源蛋白化学交联后可将此蛋白转导入细胞。Vives61等对TAT通过细胞膜的转导作用进行了研究,发现该蛋白分子中一个富含碱性氨基酸、具有较多正电荷的多肽片段(TAT48-60)与TAT的跨膜转导有关。随后,Dowdy62等通过蛋白或多聚肽与TAT短肽的融合改善Tat蛋白的跨膜递送,该短肽区域即Tat蛋白跨膜递送的核心序列(4757残基):YGRKKRRQRRR,这11个残基富含带正电荷的碱性氨基酸:其中有6个精氨酸
7、(Arg)、2个赖氨酸(Lys),简称TAT-PTD。3.2 Cu,ZnSOD简介Cu/Zn-SOD作为SOD结构上的第一族,是人们对于SOD结构研究的突破口,也是人们了解最多的一种SOD。比较不同来源的Cu/Zn-SOD的氨基酸序列可以发现,它们的同源性都很高6。有些氨基酸还很保守,在所有序列中都不变,这暗示着这些氨基酸与活性中心有关。如图11牛红细胞Cu/Zn-SOD的结构所示:每个铜原子除分别与4个组氨基酸残基(His444661118)的咪唑氮配位外,还与一轴向水分子形成远距离的第五配位,Zn则与3个组氨酸残基(His616978)和1个天冬氨酸(D81)配位。Cu、Zn共同连接组氨酸
8、61组成“咪唑桥”结构。图11牛红细胞Cu/Zn-SOD的结构示意图73.1课设软件的介绍: UniProt SwissProt NCBI EBI CLC3.2 各物种各类Cu,Zn-SOD氨基酸序列的获得:进入UniProt数据库: 界面如下:输入:Superoxide dismutase Cu-Zn后逐步进行限定,包括对酶标号EC,片段fragment,交叉参考:cross-reference进行限定。最终的检索词为:Superoxide dismutase Cu-Zn AND ec:.1 NOT chaperone AND fragment:no NOT database:pir NOT
9、 database:refseq NOT database:refseq NOT database:unigene。运行输出界面如下:点击,进入下载页面:获得FASTA文件。后将已知的PS2分子序列复制到FASTA文件的第一条序列。以便一下分析。文件格式如下:3.3搜索保守序列clustalw2在线分析比对:进入网站:运行,输出结果如下:其中可以下载比对结果文件:.aln,.dnd/点击进入界面:同源的分数比较:一般70分以上的可以认定为在同一物种中,因此一般选用的分数为30分以上70分以下。这样分析出的结果既可保证其物种间的基本联系,还可使所分析的不是同一物种,但是如果个数很多,这种方法就不
10、适用了。此次比对得分在30-70分的结果如下: 保守序列结构:3.4一级结构的分析:由上述详细的比对可以得出一个共同点:出现组氨酸(H),甘氨酸(G)的地方都比较保守。一般情况下:出现组氨酸时一般是位金属离子提供配位点,或者为活性中心。而出现甘氨酸时一般预示着存在着折叠片二级结构。通过比对得出保守结构(一般保守结构大于8个AA):148161位置:TGNAGSRLACGKIG.2 二级结构分析:.3 三级结构分析:预测工具:Swiss-Model(由SwissProt提供的目前最著名的蛋白质三级结构预测服务)预测思想:同源比较建模 (homology comparatvie modeling)
11、 显示及分析工具:RasMol分析过程如下:首先将PS2分子序列提交给SwissModel Automatic Modelling Mode 界面如下:输出结果如下:由上述结果可以得出:直接生成三维结构:随后进行3D-Blast比对结果如下: 理化性质预测:.1 分子量、等电点及化学组成:采用SwissProt在线预测软件界面如下:输出预测结果如下:.2 酶切和断裂位点预测: .3 跨膜预测:采用SwissProt在线跨膜螺旋预测软件 进入界面如下:请输入氨基酸单字母序列输出结果如下:根据上述预测结果PS2蛋白并不存在跨膜结构。.2 SignalP 3.0 Server采用SwissProt在
12、线信号肽预测软件SignalP 3.0 Server 进入界面如下:请输入氨基酸单字母序列输出结果如下:说明:S - 评分的信号肽预测是根据每个氨基酸所处提交序列的位置做出评分,高分数表明了相应的氨基酸是一个信号肽,低分数表明氨基酸是一个成熟蛋白。C - 评分是裂解位点评分。 For each position in the submitted sequence, a C-score is reported, which should only be significantly high at the cleavage site.对于每个职位提出的序列,一架C -评分报告,其中只应在显着高的裂
13、解位点。当裂解位点的位置是指由一个单一号码第一个残留的成熟蛋白,如裂解位点的氨基酸之间的对应26-27号这说明种成熟的蛋白质始于(并包括)的27号氨基酸 。由上述软件预测得出:PS2蛋白存在信号肽,并且不是分泌蛋白。在与实际PS2蛋白的性质不同,因为PS2本身就是一个成熟蛋白,并能在毕赤酵母中分泌表达。可能原因是:在PS2构建的毕赤酵母上就存在信号肽,并在酵母体系中分泌表达。.3 预测真核蛋白的亚细胞定位。.4 LipoP 1.0 Server LipoP 1.0 Server用来预测脂蛋白,也用来区分脂蛋白信号肽、其他信号肽和格兰氏阴性菌N端膜螺旋。 .1 NetPhos 2.0 Serve
14、r NetPhos 2.0 Server预测真核蛋白普通磷酸化位点,主要对Ser,Thr,Tyr位点进入界面:请输入氨基酸单字母序列输出结果如下:.2 NetPhosK 1.0 ServerNetPhosK 1.0 Server预测真核蛋白激酶特异磷酸化位点,蛋白激酶如PKA, PKC, PKG, CKII, Cdc2, CaM-II, ATM, DNA PK, Cdk5, p38 MAPK, GSK3, CKI, PKB, RSK, INSR, EGFR和Src。进入界面如下:请输入氨基酸单字母序列输出结果:.3 NetNGlyc 1.0 Server DictyOGlyc 1.1 Serv
15、er预测人体蛋白N-糖基化位点在线软件进入界面如下:请输入氨基酸单字母序列输出结果如下:由上面可以看出:PS2蛋白序列中的确存在一个N糖基化位点。这与实验结果和文献介绍都是相符的。.4 NetOGlyc 3.1 ServerNetOGlyc 3.1 Server预测哺乳动物蛋白中O-糖基化预测在线分析软件界面如下:请输入氨基酸单字母序列输出结果如下:由上述结果可以看出:PS2分子潜在多个不同的0-糖基化位点。符合实验猜想。 NetGlycate 1.0 server为预测哺乳动物蛋白赖氨酸 氨基的糖基化在线分析软件:界面如下:输出结果如下:同样得出:PS2蛋白存在赖氨酸的糖基化位点。 NecA
16、cet 1.0 Server3为预测潜在的N端乙酰化潜在位点在线分析软件界面如下:输出结果如下:由上述看出:PS2并不存在潜在的N端乙酰化位点. 3.1.10 蛋白免疫功能预测:.1 HLA Peptide Binding Predictions (型组织相容型抗原预测) 界面如下:输出结果如下:由上输出结果表明PS2存在着潜在的HLA的结合位点,这主要与PS2蛋白在细胞外(血液)的半衰期有关。.2 Epitope pretiction(表位预测)界面如下:输出结果如下:有上面预测可得:PS2蛋白不存在潜在的抗原表位。.3 DiscoTope 1.2 Server DiscoTope 1.2
17、Server从蛋白的三级结构来预测不连续B细胞表位界面如下:输出结果如下:得分之后“=B”“=B”。总共PS2分子有38个B细胞表位。.4 NetChop 3.0 Server NetChop 3.0 Server预测人类蛋白酶体中的可剪切位点(MHC配体预测)。界面如下:输出结果如下:由上面结果表明:PS2蛋白分子存在51个剪切位点,在表中的“C”列以“s”表示,可见该序列中含有较多的MHC配基位点。.5 NetMHC 3.0 ServerNetMHC 3.0 Server利用ANNs和weight matrices预测不同HLA等位基因的MHC结合位点。界面如下:输出结果如下:由上面可以看出所有片断值多大于500,说明PS2分子和MHC的结合基序与结合能力都不显著。.6 NetMHCII 1.0 ServerNetMHCII 1.0 Server利用PSSM来预测不同HLA-DR等位基因的结合表位。输出结果如下:由上面可以看出:PS2分子有SB强结合位点有0个,弱结合位点也有29个,说明该序列与MHC的结合基序和结合能力都较很弱。.7 NetMHCIIpan ServerNetMHCIIpan Server 利用ANNs来预测不同的500 种HLA-DR等位基因结合表位。 界面如下: 输出结果如下:有上面可以看出:PS2分子有8个强的结合位点,50个弱的结合位点。
限制150内