最新序列比较的生物学基础PPT课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《最新序列比较的生物学基础PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新序列比较的生物学基础PPT课件.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、序列比较的生物学基础序列比较的生物学基础序列比较的生物学基础v构成生命的基本单位是蛋白质。而作为在细胞中催化各种化学反应的分子机器的酶,也是蛋白质。另外,细胞的许多结构也是蛋白质组成的。连非蛋白质的构成部分也是由属于蛋白质的酶所催化生产的。一个人体含有大约100,000种不同的蛋白质,正是这100,000种蛋白质的特性及其相互作用使我们无所不能。序列比较的生物学基础序列比较的生物学基础v4种核苷酸组成种核苷酸组成64个三联密码子。个三联密码子。4种核苷酸可以组成64个不同的三联密码子(triplet codes),用于编码20种氨基酸绰绰有余。其中三个为终止密码子,代表多肽序列的末端,一种氨基
2、酸可以由16个三联密码子编码。由多个密码子编码的氨基酸,不同密码子的使用频率并不相等,这种使用频率的不同分布称为“密码子偏好”(coden usage)。不同种的生物密码子偏好不同。序列比较的生物学基础序列比较的生物学基础v4种核苷酸组成61个编码氨基酸的密码子和3个终止密码子,它们不能与tRNA的反密码子配对,但能被终止因子或释放因子识别,终止肽链的合成。由一种以上密码子编码同一个氨基酸的现象称为简并(degeneracy),对应于同一氨基酸的密码子称为同义密码子(synonymous codon)。序列比较的生物学基础序列比较的生物学基础v形成形成6个开放读码框个开放读码框 由于氨基酸是由
3、三联密码子编码的,因此DNA序列就包含三个不同的开放读码框,取决于从第一、第二或第三位核苷酸开始(第四位和第一位同框)。而双链DNA的两条链都可以转录RNA,后者翻译蛋白质。因此,一个DNA序列及其互补链可以有6个不同的读码框(reading frames)。序列比较的生物学基础序列比较的生物学基础v基因基因一般概念一般概念 基因作为唯一能够自主复制、永久存在的单位,其生理学功能以蛋白质形式得到表达。DNA序列是遗传信息的贮存者,它通过自主复制得到永存,并通过转录生成mRNA,翻译生成蛋白质的过程控制所有生命现象。编码链(coding strand)又称sense strand,是指与mRNA
4、序列相同的那条链。非编码链(anticoding strand),又称antisense strand,是指那条根据碱基互补原则指导mRNA生物合成的DNA链。序列比较的生物学基础序列比较的生物学基础v基因表达的一般概念基因表达的一般概念 基因表达包括转录(transcription)和翻译(translation)两个阶段。转录是指拷贝出一条与DNA链序列完全相同(除了TU之外)的RNA单链的过程,是基因表达的核心步骤。翻译是指以新生的mRNA为模板,把核苷酸三联子遗传密码翻译成氨基酸序列、合成蛋白质多肽链的过程,是基因表达的最终目的。只有mRNA所携带的遗传信息才被用来指导蛋白质生物合成,
5、所以人们一般用U、C、A、G这4种核苷酸而不是T、C、A、G的组合来表示遗传性状。序列比较的生物学基础序列比较的生物学基础vv序列测定。序列测定。序列测定。序列测定。可以用化学方法测定蛋白质的氨基酸序列以及DNA和RNA的核苷酸序列。可是,就目前来说,测定DNA的核苷酸序列比测定RNA序列和蛋白质序列容易的多。由于蛋白质序列可以由编码它的DNA序列推导出来,许多已知的蛋白质序列其实就是从DNA序列推导出来的。将mRNA转为DNA(cDNA)是一个简单的实验技术,因此RNA分子的序列通常是以cDNA序列测定的。序列分析其实就是从已知蛋白质、RNA、DNA序列作出生物学推论的过程。序列分析的困难序
6、列分析的困难v技术欠缺vDNA非编码区比编码区多v编码区不连续:内含子、外显子vmRNA非编码区、tRNA、SnRNAv从DNA序列推导蛋白质序列v从蛋白质序列推导结构和功能v二级结构:alpha helix、beta sheetv超级二级结构、三级结构、四级结构v为什么结构命名如此复杂?v结构决定功能、实验方法欠缺v蛋白质三级结构推导的基础v目前不能从结构推导功能序列分析的困难序列分析的困难vv技术欠缺技术欠缺技术欠缺技术欠缺。尽管从理论上来说,知道一个蛋白质的序列后,完全可以推导出它的特性,可是目前的生物学技术还远远不能做到这一点。当前的序列分析手段实际能做的与希望做到的还相去甚远。下面就
7、谈谈序列分析困难在哪里。另外,上面也已提到,由于蛋白质序列测定的困难,目前大多数的蛋白质序列其实都是由编码它的DNA推导出来的。遗憾的是,从DNA转录RNA再翻译蛋白质的细胞学途径所具有的特点使这种推导难度大增。序列分析的困难序列分析的困难vvDNA非编码区比编码区多。非编码区比编码区多。许多蛋白质是由一个片段的DNA编码的,所以当分析DNA序列时,生物学家只需要知道蛋白质编码区从哪里开始,到哪里结束。然而在人类基因组中情况就不是那么简单了,因为人类基因组中包含着远远多于编码区的非编码区序列,随机获取的一个片段很可能并不编码任何蛋白质。序列分析的困难序列分析的困难vv编码区不连续编码区不连续:
8、内含子、外显子内含子、外显子。编码蛋白质的DNA并不是连续的,而是在其中分布有许多叫做“内含子”的分隔区。大多数情况下,这个问题可以通过测定mRNA(cDNA)的序列来解决,因为cDNA中所含的非编码的额外部分很少,而原来被分隔开的外显子(exons)在mRNA(cDNA)中已经被连接成为一个连续的片段。当然,在某些特殊情况下,难以分析RNA而只能分析DNA本身。序列分析的困难序列分析的困难vvmRNA非编码区、非编码区、tRNA、SnRNA。虽然RNA分子中编码蛋白质的区域相对非编码区的比例远大于DNA分子,然而RNA分子中也还存在非编码区,如编码区的上游和下游,有时甚至比编码区还大。许多R
9、NA分子并不编码任何蛋白质。例如,核糖体RNA(Ribosomal RNA,rRNA),转移RNA(transfer RNA,tRNA)以及一些核仁小分子RNA(small nuclear ribonucleoproteins,SnRNA)等就属于非编码的RNA。序列分析的困难序列分析的困难vv从DNA序列推导蛋白质序列。就目前来说,从DNA序列推导编码的蛋白质序列还没有一个总体的、通用的、完全的解决办法。不过,通过各种计算方法以及一些实验生物学,人们已经比较成功的做到这一点。目前,这个问题仍然是计算生物学最重要的问题之一。序列分析的困难序列分析的困难vv从蛋白质序列推导结构和功能从蛋白质序列
10、推导结构和功能。当我们得到一个蛋白质序列之后,从序列推导它的结构和功能遇到的困难更大。上面提过,蛋白质的结构是通过多肽链本身的折叠,有时还有多个多肽链的组合。这种折叠通过组成肽链的氨基酸内部的化学键的转动和氨基酸之间肽键的转动而达成。遗憾的是,折叠的可能方式实际上是无限多的。为了帮助解决这一棘手问题,生物学家们将蛋白质的结构特征分成了等级。一级结构指的是蛋白质中氨基酸的序列(primary structure),这是我们已经知道的。序列分析的困难序列分析的困难vv二级结构:二级结构:alpha helixalpha helix、beta sheetbeta sheet。几十年前,人们发现多肽链
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 序列 比较 生物学 基础 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内