分子生物学 基因组与基因组学.docx
《分子生物学 基因组与基因组学.docx》由会员分享,可在线阅读,更多相关《分子生物学 基因组与基因组学.docx(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二章 基因组与基因组学学习目标掌握:1原核生物基因组和真核生物基因组的特点。 2基因组学的研究内容。熟悉:1病毒基因组的特点。 2人类基因组的结构特点,人类基因组计划的研究内容。 3基因组学的分类及研究内容。了解:1基因组学在现代医药学上的应用。基因组(genome),又称染色体组,是物种遗传信息的“总词典”、控制发育的“总程序”、生物进化历史的“总档案”。一般的定义是单倍体细胞中的全套染色体为一个基因组,或是单倍体细胞中的全部基因为一个基因组。基因组DNA测序的结果研究发现,基因编码序列只占整个基因组序列的很小一部分。因此,基因组应定义为单倍体细胞中全部的核苷酸序列(包括编码序列和非编码序
2、列)。RNA病毒不含有DNA,其遗传信息的携带者为RNA,因此,基因组也可指RNA病毒颗粒中的全部RNA分子。第一节 基因组一、病毒基因组的特点病毒是最简单的生物,完整的病毒颗粒包括外壳蛋白和内部的基因组DNA或RNA。病毒不能独立地复制,必需进入宿主细胞中借助细胞内的一些酶类和细胞器才能使病毒得以复制。病毒基因组主要有以下特点:1病毒基因组较小 病毒基因组与细菌或真核细胞基因组相比,病毒基因组很小。但是不同的病毒之间其基因组相差甚大,如乙肝病毒DNA只有3kb大小,所含信息量也较小,只能编码4种蛋白质,而痘病毒的基因组有300kb之大,可以编码几百种蛋白质,不但为病毒复制所涉及的酶类编码,甚
3、至为核苷酸代谢的酶类编码,因此,痘病毒对宿主的依赖性较乙肝病毒小得多。2病毒基因组为DNA或RNA 病毒基因组可以由DNA组成 也可以由RNA组成。每种病毒颗粒中只含有一种核酸,或为DNA或为RNA,两者一般不共存于同一病毒颗粒中。组成病毒基因组的DNA和RNA可以是单链的,也可以是双链的,可以是闭环分子,也可以是线性分子。如乳头瘤病毒是一种闭环的双链DNA病毒,而腺病毒的基因组则是线性的双链DNA,脊髓灰质炎病毒是一种单链的RNA病毒,而呼肠孤病毒的基因组是双链的RNA分子。一般说来,大多数DNA病毒的基因组是双链DNA分子,而大多数RNA病毒的基因组是单链RNA分子。3RNA病毒基因组为一
4、条或多条RNA 多数RNA病毒的基因组只有一条核糖核酸链,但也有些病毒的基因组RNA含有多条核酸链。如禽流感病毒的基因组RNA分子是节段性的,由8条RNA分子构成,每条RNA分子都含有编码蛋白质分子的信息(图2-1);而呼肠孤病毒的基因组由双链的节段性的RNA分子构成,共有10个双链RNA片段,同样每段RNA分子都编码一种蛋白质。目前,还没有发现有节段性的DNA分子构成的病毒基因组。图2-1 8节段的禽流感病毒(H5N1)单链RNA4病毒基因组含有基因重叠 基因重叠是指同一段DNA片段含有2种以上编码蛋白质的核苷酸序列。这种现象在其它的生物细胞中仅见于线粒体和质粒DNA,所以也可以认为是病毒基
5、因组的结构特点。这种结构使较小的基因组能够携带较多的遗传信息。基因重叠是1977年Sanger在研究X174时发现的。X174是一种单链DNA病毒,宿主为大肠杆菌,因此,又称为噬菌体。它感染大肠杆菌后共合成11个蛋白质分子,相当于6078个核苷酸所编码的2381个氨基酸的蛋白质信息量。而该病毒DNA本身只有5386个核苷酸,最多能编码1795个氨基酸。可见,X174基因组存在基因重叠现象。X174基因组见图2-2。图2-2噬菌体X174基因组DNA基因重叠有以下3种情况: 完全重叠,一个基因完全被包含在另一个基因里面; 部分重叠,两个基因只有部分核苷酸序列共用;两个基因只有一个核苷酸的重叠,见
6、图2-3。这些重叠基因尽管它们的DNA大部分相同,但是由于将mRNA翻译成蛋白质时的读码框不一样,产生的蛋白质分子往往并不相同。有些重叠基因读码框重叠,只是起始部位不同,重叠序列编码出完全不同的蛋白质氨基酸序列;有些重叠基因读码框重叠,起始部位也相同,但是读码框大小不同,编码出两种不同的蛋白质,出现一种蛋白质包含有另外一种蛋白质的氨基酸序列。图2-3 基因重叠5病毒基因组几乎全部为编码序列 病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部分不被翻译,这与真核细胞DNA的冗余现象不同。如在X174中不翻译的部份只占217/5375,G4 DNA中占282/5577,都不到5%。不翻译的DN
7、A顺序通常是基因表达的控制序列。如X174的H基因和A基因之间的序列(39063973),共67个碱基,包括RNA聚合酶结合位点,转录的终止信号及核糖体结合位点等基因表达的控制区。乳头瘤病毒是一类感染人和动物的病毒,基因组约8.0Kb,其中不翻译的部份约为1.0kb,该区同样也是其他基因表达的调控区。6病毒基因组常为多顺反子转录 病毒基因组DNA序列中功能相关的编码蛋白质的基因或编码rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。该转录单元被转录成含多个蛋白质编码序列的mRNA,称为多顺反子mRNA(polycistronic mRNA),然后再加工成多种蛋白
8、质的mRNA模板。如X174基因组中的D-E-J-F-G-H基因转录生成同一mRNA分子,然后再翻译成功能相关的各种蛋白质,其中 J、F、G及H都是编码外壳蛋白的,D蛋白与病毒的装配有关,E蛋白负责细菌的裂解。7病毒基因组多为单倍体 除逆转录病毒外,其他病毒基因组都是单倍体。逆转录病毒基因组有两个拷贝,如人类免疫缺陷病毒(HIV),其基因组为二倍体的单链RNA。8真核细胞病毒基因组含有内含子 噬菌体(细胞病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,含有内含子。除了正链RNA病毒之外,真核细胞病毒的基因都是先转录成mRNA前体,再经加工才能切除内含子成为成熟的mRNA。更为有趣的是,有
9、些真核病毒的内含子或其中的一部分,对某一个基因来说是内含子,而对另一个基因却是外显子。如SV40和多瘤病毒(polyomavirus)的早期基因就是这样。SV40的早期基因即大T和小t抗原的基因都是从5146开始反时针方向进行,大T抗原基因到2676位终止,而小t抗原到4624位即终止,但是,从4900到4555之间一段346bp的片段是大T抗原基因的内含子,而该内含子中从4900-4624之间的DNA序列则是小t抗原的编码基因。同样,在多瘤病毒中,大T抗原基因中的内含子则是小t抗原的编码基因。二、原核生物基因组的特点原核生物基因组的结构基因数量和功能的类型远大于病毒基因组,但与真核生物基因组
10、相比,其基因组较小。大多数原核生物基因组小于5Mb(兆碱基对),所能容纳的基因数量有限。原核生物基因组主要有以下特点:1原核生物基因组较小 原核生物基因组通常只有一个环形或线形的DNA分子。基因组DNA虽与蛋白结合,但并不形成染色体结构。基因组中只含有一个复制起始点。2原核生物基因组有操纵子结构 原核生物的结构基因与调控序列以操纵子的形式组织在一起。操纵子结构是原核生物基因组的一个突出的结构特点,操纵子是指几个功能相关的序列常串连在一起,由共同的调控元件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成(图2-7)。由操纵子转录的RNA为多顺反子(polycistron)。在E.coli中
11、已发现有260个多基因具有操纵子结构。操纵子的结构与功能见第六章。3原核生物基因组重复序列较少 大多数原核生物基因组没有高拷贝数的全基因组范围的重复序列。然而,可能在基因组的某处含有一些重复序列,且大多为转座子序列。4原核生物基因组结构基因多为单拷贝基因 原核生物基因组中的结构基因多为单拷贝,但编码rRNA的基因往往是多拷贝的,这有利于核糖体的快速组装,便于急需蛋白质的快速合成。5原核生物基因组多为编码基因 原核生物基因组的大部分序列是用来编码蛋白质的,所占比例远远大于真核生物基因组而小于病毒基因组。编码区在基因组中所占的比例约为50%,非编码区主要是一些调控序列。原核生物基因组基本是连续的,
12、结构基因中无内含子,因此转录后不需要剪接,翻译与转录偶联进行。6原核生物基因组无基因重叠 原核生物结构基因一般无重叠现象,这与病毒基因组是不同的。基因重叠现象可见于原核生物的质粒DNA中。7原核生物基因组存在可移动的DNA序列 与真核生物基因组类似,原核生物基因组中存在可移动的DNA序列,如转座子和质粒等。三、真核生物基因组的特点真核生物基因组包含两部分,染色体基因组和染色体外基因组(线粒体或叶绿体基因组)。真核生物的染色体基因组的基本结构尽管相似,但不同生物的基因组大小有很大差异。最小的真核生物基因组长度不到10Mb,最大的超过了100000Mb。真核生物基因组主要有以下特点:1真核生物基因
13、组较大真核生物的基因组由多条线形的染色体构成,每条染色体有一个线形的DNA分子,每个DNA分子有多个复制起点。真核生物中,配子(精子和卵子)基因组为单倍体,体细胞基因组为双倍体。2真核生物基因为单顺反子真核生物的基因与原核生物不同,不以操纵子结构形式存在,其结构基因的转录产物为单顺反子(monocistron),即一个基因转录成一条mRNA,翻译成一条蛋白质多肽链。3真核生物基因存在大量的重复序列真核生物基因组结构庞大,出现大量重复序列,可占基因组的35%左右,功能相关基因构成各种基因家族。根据重复程度不同,可分为高度重复序列、中度重复序列、轻度重复序列。高度重复序列是指重复次数大于105,如
14、卫星DNA (satellite DNA)等。中度重复序列是指重复次数在102105之间,如rRNA基因和tRNA基因等。中度重复序列一般具有种特异性,因此在适当的情况下,可以应用它们作为探针区分不同种哺乳动物细胞的DNA。轻度重复序列是指重复次数在10102之间。真核生物基因组中50-80%的基因为单拷贝基因,在基因组中出现一次或几次。4真核生物结构基因为断裂基因真核生物结构基因为断裂基因,即含有不编码的内含子和编码的外显子序列,二者间隔排列。5真核基因组含有端粒真核基因组DNA末端都有一特殊结构称为端粒,该结构是由一段短而简单的串联重复序列和蛋白质形成的复合体,仅在真核细胞染色体末端存在。
15、6真核基因组存在可移动的DNA序列真核基因组存在一些可移动的遗传因子,如在人类基因组中发现的逆转座子、在果蝇中发现的DNA转座子等。知识拓展线粒体基因组线粒体是真核细胞的一种细胞器,有它自己的基因组,编码细胞器的一些蛋白质与RNA。线粒体基因突变率高,母系遗传,具有很高的研究价值。除了少数低等真核生物的线粒体基因组是线状DNA分子外(如纤毛原生动物Tetrahymena pyriformis和Paramecium aurelia以及绿藻Clamydoomonas reinhardtii) 等,一般都是一个环状DNA分子。由于一个细胞里有许多个线粒体,而且一个线粒体里也有几份基因组拷贝,所以一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分子生物学 基因组与基因组学 基因组
限制150内