分子生物学-第二章-基因与基因组-新ppt课件.ppt
《分子生物学-第二章-基因与基因组-新ppt课件.ppt》由会员分享,可在线阅读,更多相关《分子生物学-第二章-基因与基因组-新ppt课件.ppt(277页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第二章 基因与基因组第一节 基因与基因组的概念 一一 基因概念的发展基因概念的发展 从遗传学史的角度看,基因概念的发展大致分以下几个阶段:孟德尔的遗传因子阶段,摩尔根的基因阶段,顺反子阶段,操纵子阶段和现代基因阶段。 (一)孟德尔的遗传因子(一)孟德尔的遗传因子 1865年,奥地利的孟德尔在植物杂交试验的论文中提出生物体的各种特定性状受遗传因子所控制,一个因子决定一种性状。 作为基因雏形名词的遗传因子,只是一种逻辑推理概念,没有任何物质内容。 (二)摩尔根的基因概念(二)摩尔根的基因概念 染色体遗传学之父摩尔根和他的学生们通过果蝇研究把基因定位在染色体上,首先使基因物质化了。 1953年沃森
2、-克里克DNA双螺旋结构模型的提出,这个模型表明基因实际上就是DNA分子的一段核苷酸序列。 20世纪40年代末至50年代初,基因是通知控制特定蛋白质合成来控制代谢,进而决定生物性状的原理变得清晰起来。 (三)(三) 顺反子顺反子 1957年,法国遗传学家本兹尔的噬菌体重组试验结果表明: 基因可被分为更小的单位; 一个顺反子就相当于一个基因,它是一个功能单位,决定一个酶或一条多肽链的表达。 (四)操纵子及其基因(四)操纵子及其基因 1961年,法国分子生物学家雅各布和莫诺基于细菌酶诱导的研究,提出了关于原核生物基因表达调控的“乳糖操纵子模型”。 作为原核生物基因表达调控单元的操纵子,其基因根据功
3、能可分为结构基团、调节基团(?)和控制基团(包括启动基因和操纵基团)三类。(五五) 现代基因概念的扩展现代基因概念的扩展 1. 重叠基因 重叠基因即一个基因包含或部分包含另一基因。 重叠基因的发现揭示了遗传物质的一种经济而巧妙的编排密码子共用核苷酸序列,通过不同的三联体密码子读框编码不同的多肽链。 2. 断裂基因 出现在成熟的mRNA上的DNA序列是不连续的,它们被一些间隔区DNA序列所分隔。 这些间隔区序列在RNA的转录后的加工成熟过程中被切除。 这种基因内部的间隔区DNA序列称为内含子, 出现在成熟RNA中的各个DNA区段称为外显子。 由若干个外显子和内含子互相间隔而组成的嵌和体称为断裂基
4、团。 3. 跳跃基因 跳跃基团又称为转座元件,它是指那些可从染色体的一个位置跳到另一个位置,或从一条染色体跳到另外一条染色体上的可移动遗传元件。 4. 假基因 假基因也称“拟基因”,是一类没有功能的特殊基团。 假基因的核苷酸序列与其相应的有功能基因基本相同,原来也可能是有功能的基因,由于缺失或点突变等原因失去活性,成为无功能基因。 二 . 基因的概念 (一) 基因的概念 基因(gene)是生物体传递和表达遗传信息的基本单位。 从化学角度观察,基因则是一段具有特定功能和结构的连续的脱氧核糖核酸序列,是构成巨大遗传单位染色体的重要组成部分。 指表达一种或多种蛋白质或功能指表达一种或多种蛋白质或功能
5、RNARNA的遗传物的遗传物质的基本单位。质的基本单位。 一段制造功能产物的完整的染色体片段(一段制造功能产物的完整的染色体片段(a complete chromosomal segment responsible for making a functional product.*)。包含基因的产物、基因的功能包含基因的产物、基因的功能性及性及完整性完整性(包括一个蛋白质或(包括一个蛋白质或RNA的全部的全部编码序列编码序列和编码区之外对编码区转录功能所必要的非编码的和编码区之外对编码区转录功能所必要的非编码的调调控区控区。)。)基因的分子生物学定义基因的分子生物学定义 一个基因不仅是编码有功
6、能的蛋白质多肽链或RNA所必需的核酸序列(通常指DNA序列),而且还包括为保证转录所必需的调控序列、5端非翻译序列、内含子以及3非翻译序列等核酸序列。根据基因是否具有表达功能可以将其分为三类 第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶、其他功能蛋白和结构蛋白的结构基因以及编码阻遏蛋白的调节基团。 第二类是只有转录功能而没有翻译功能的基团,包括tRNA基因和rRNA基因。 第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因,这类基因也称控制基因。( (二二) ) 基因的命名法基因的命名法 目前对基因的命名一般根据种属习惯,方法并未统一。 基因的命名一般用斜体
7、字,按种属字母和数学符号来表示。 如果表示蛋白产物和表型,就用大写字母。 如果表示隐性突变,用小写字母。表示显性突变,第一个字母要大写。 在其它一些种属包括人的基因命名中,基因全由大写字母表示。大肠杆菌和其他细菌 三个小写字母表示一个操纵子,接着的大写字母表示不同基因座。 例如:lac操纵子;基因座:lacZ,lacY,lacA。 蛋白质:LacZ,LacY,LacA。 另外还采用特殊惯例命名B.subilis的孢子发生基因。 这些基因以spo后加上表示孢子发生的形态阶段的罗马数字表示,再用大写字母表示表示操纵子,而后为基因座, 例如,spoGA就表示在第二阶段表达的操纵子G的第一个基因座。
8、酵母 三个字母表明基因功能,而后的数字表示不同的基因座。 啤酒酵母基因GAL4,CDC28; 蛋白质:GAL4,CDC28。 非洲蜀酒酵母基因gal4,cdc2; 蛋白质:Gal4,Cdc2。 线虫 用三个小写字母表示突变表型,如存在不只一个基因座,用连字符号接数字表示, 例如,基因unc-86,ced-9;蛋白UNC-86;CED-9。 果蝇 来自突变表型的描述可以用1-4个字母表示。 例 如 , 基 因w h i t e ( w ),tailless(tll),hedgehog(hh);而蛋白为White,Tailless,Hedgehog。 植物 虽然没有适用于所有植物的惯用法,但大多数
9、用1-3个小写字母表示。 Arabidopsis基因用果蝇的方法命名,但 使 用 大 写 字 母 , 例 如 , 基 因AGAMOUS(AG),蛋白AGAMOUS。 脊椎动物 一般以描述基因功能的1-4个小写字母和数字表示其基因功能。 例如,基因sey,myc,蛋白Sey,Myc。 人类 方法如脊椎动物但需大写。例如基因MYC、ENO1。二. 基因组的概念 基因组(genome)是细胞或生物体的全套遗传物质。 The genome is the complete set of sequences in the genetic material of an organism. It includ
10、es the sequence of each chromosome plus any DNA in organelles. 是一种生物染色体内全部遗传物质的总和,包括构成基因和基因之间区域的所有DNA。 就细菌和噬菌体而言,它们的基因组是指单个染色体上所含的全部基因; 而二倍体真核生物的基因组则是指维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。(即由一个物种的单倍体的染色体构成。由一个物种的单倍体的染色体构成。/任一任一 生物染色体的单个单倍体组。生物染色体的单个单倍体组。) 基因组基因组在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍
11、体)的总和,在分子水平代表一个物种所有DNA分子的总和。 简而言之,它表示一种生物的DNA或RNA所含的全部遗传信息。 基因组与基因,一般以DNA的长度和序列来表示。 生物的复杂性与基因组内的基因数量有关,进化程度越高,基因组越复杂。 第二节 病毒(噬菌体) 基因组 病毒病毒(virus)是一类没有细胞结构但有遗传、变异、共生和干扰等生命现象的微生物。 在结构上,没有细胞结构,因此称为病毒颗粒而非病毒细胞; 在化学组成上,完整的病毒颗粒通常由一种或几种蛋白质和一种核酸组成,有些种类还含有一定量的脂类物质和碳水化合物,而类病毒仅仅以核酸形式存在; 在生命活动上,这种最简单的生命形式需借助其他生物
12、细胞完成其生命过程,基因组信息的遗传与变异是其生命活动的最主要内容。一. 病毒基因组核酸的主要类型 病毒(virus)是最简单的生物,外壳蛋白包裹着里面的遗传物质核酸。 1、双链DNA 多数动物病毒,如腺病毒、疱疹病毒、痘病毒,环形、线形。2、单链DNA 动物病毒中仅微小病毒为单链病毒;噬菌体中仅含单链DNA。 RNA病毒基因组所携带的遗传信息一般在同一条链上,序列与mRNA相同的为正股(+),与mRNA互补的为负股()3、双链RNA 以负链RNA为模板转录出mRNA如呼肠孤病毒及噬真菌体。4、单链负股RNA 5、单链正股RNA: 如逆转录病毒二. 病毒基因组结构与功能1、不同病毒的基因组的大
13、小差异很大。 比细菌基因组小,只能编码少数蛋白,遗传信息量较小。 2、不同病毒的基因组可以是不同结构的核酸; 每种病毒基因组由DNA或RNA中的一种组成。 核酸的结构可以是单链或双链,闭合环状或线状分子。 根据基因组的核酸类型,病毒可分为DNA病毒和RNA病毒。3、病毒基因组有连续的也有不连续的; 噬菌体的基因是连续的。而多数真核细胞的病毒常含有不连续基因。 除正链RNA病毒外,真核细胞病毒的基因先转录成mRNA前体,再加工为成熟的mRNA。故病毒基因的特性更像真核生物基因。 4、病毒基因组的编码序列大于90%; 大部分序列用来编码蛋白,基因之间的间隔序列(spacer sequence)非常
14、短。 如X174的非编码区只占217/ 5386.5、一般属单倍体基因组 ;7、功能上相关的基因往往集中成簇,在基因组的特定部位构成一个功能单位或转录单元。 转录产物往往是多顺反子的RNA,然后加工成各蛋白质的mRNA。8、病毒的DNA复制及基因表达往往依赖于宿主细胞的系统。 根据宿主不同,病毒又可分为动物病毒、植物病毒和噬菌体。9、常有基因重叠现象. 一个基因可以完全在另一基因内,或者部分重叠,甚至两个基因之间只有一个核苷酸重叠。 重叠基因可能使用共同的核苷酸序列,但转录成的mRNA有不同的阅读框架(open reading frame,ORF) ,产生的蛋白质分子大不相同。 有些重叠基因会
15、使用相同的阅读框架,但起始或终止密码子不同。 基因重叠时,共同序列上发生的突变可能影响一个基因甚至两个基因的功能。 重叠基因现象反映了原核生物利用有限遗传资源表达更多生物功能的能力。 真核生物基因组中极少重叠基因现象。 例如, 174DNA全部5386个核苷酸序列的11个基因中,除了基因B完全在基因A内,基因D和E部分重叠外,特别有趣的是蛋白D的终止密码子最后一个核苷酸是蛋白J起始密码子的第一个核苷酸。 剑桥的分子生物学家D.C.Show和J.E.Walker等,在测定G4噬菌体DNA的核苷酸序列时,又发现了一种三重重叠基因。 图图3-6 174噬菌体噬菌体DNA中基因中基因D和和E(以及相应
16、的编码以及相应的编码蛋白质)的起点与终点蛋白质)的起点与终点 第三节 原核生物基因组 一. 染色体基因组 原核生物原核生物是一些由无细胞核的细胞组成的单细胞或多细胞的低等生物,主要包括细菌、支原体和植物中的蓝藻门。 原核生物无真正的细胞核,无核膜,遗传物质存在于整个细胞中。 DNA有时相对集中,以裸露的形式存在。 可与蛋白质结合,但不构成染色体结构,此结构又叫类核体,习惯上仍将其基因组DNA与支架蛋白组成的结构称为染色体,有时也将其核酸分子称做原核生物染色体。 原核生物基因组都很小,如大肠杆菌,整个基因组由4.6(也有说4.2的)106bp组成,相对分子质量为2.4109,大约包括300040
17、00个基因。 所有原核生物的遗传物质均为DNA。 与病毒相比,原核生物有较完整的代谢系统,进行较复杂的代谢活动,如从外界环境摄取营养物质、对外界环境的改变做出反应等。故原核生物基因组结构基因的数量和功能远多于病毒基因组。 二. 染色体基因组的特点1. 常仅由一条环状双链DNA分子组成 细菌染色体的环化性使得在缺少端粒(telomere)的情况下,仍能够完整的复制。 这条环状双链DNA分子在细胞内形成一个较为致密的区域,称为类核。 类核无核膜与胞浆分开,其中央部分由RNA和支架蛋白组成,外围是呈超螺旋状的双链闭环染色体DNA。 但现在也发现有线形基因组。2. 只有一个复制起始点,一个复制起点 。
18、3. 具有操纵子(operon)结构。 DNA序列中功能相关的RNA或蛋白质基因往往前后排列在一起形成一个转录单位,从同一启动子开始转录形成一个多顺反子mRNA,再被分别表达成不同的RNA或蛋白质。4. 基因组的序列绝大部分是用来编码蛋白质的,只有极少部分不转录,而不转录部分通常是控制基因表达的序列。 越是简单的生物,其已知 基因数越接近于从其DNA分子量所估计的基因数。 5. 基因是连续的,无内含子,转录后不需剪接。6. 编码区在基因组中所占比例远远大于真核基因组,小于病毒基因组小于病毒基因组。 编码蛋白质的结构基因是单拷贝的,而rRNA基因往往是多拷贝的。7. 存在着少量基因重叠的现象。
19、编码顺序一般不会重叠。8、基因组中重复序列很少,一般为单拷贝,如结构基因。 但编码rRNA的基因往往是多拷贝。9、具有编码同工酶的基因(isogene).10、细菌基因组中存在可移动的细菌基因组中存在可移动的DNA序列,序列,包括插入序列和转座子。包括插入序列和转座子。11、基因组DNA有多种调控区(也有人称之为功能识别区域),如复制起始区、终止区、转录启动子、终止子等特殊序列,还有重复序列,比病毒基因组要复杂。病毒和原核生物基因组总结病毒和原核生物基因组总结病毒基因组病毒基因组细菌基因组细菌基因组基因组较小,编码少数蛋白质基因组较小,编码少数蛋白质基因组基因组 106 bp ;具有单一的复制
20、起点具有单一的复制起点可以为单可以为单/双链、环状双链、环状/线性线性DNA或或RNA;单一片段或多个片段单一片段或多个片段(节段基因组)(节段基因组)环状或线形,均为环状或线形,均为DNA; “类核类核”的主基的主基因组和独立的因组和独立的DNA分子(质粒)分子(质粒)常为常为重叠基因重叠基因存在存在重叠基因重叠基因非编码区占基因组的小部分非编码区占基因组的小部分非编码区占基因组比例很小非编码区占基因组比例很小功能相关基因集中成簇,构成一功能相关基因集中成簇,构成一个功能单元或转录单位个功能单元或转录单位有有操纵子操纵子结构结构连续(噬菌体)连续(噬菌体)/不连续基因不连续基因(真核细胞病毒
21、)(真核细胞病毒)连续,无内含子连续,无内含子大部分序列是单一序列(结构基因和调大部分序列是单一序列(结构基因和调控区);控区);重复序列少重复序列少, 1%, 拷贝数拷贝数 10有可移动的有可移动的DNA序列序列三. 质粒(plasmid)基因组 (一) 质粒的概念 质粒是细菌细胞内携带的染色体外的DNA分子,是共价闭合的环状DNA分子(covalent closed circular DNA cccDNA),大小在1200 kb,能独立进行复制。 它存在于许多细菌以及酵母菌等生物中。 质粒离开宿主细胞则无法复制和扩增,质粒“友好”地借居于宿主细胞内。靠宿主细胞才能完成自己的复制。 而质粒对
22、宿主细胞的生存而言却不是必需的,宿主细胞丢失了质粒依然能够存活。 质粒不是单纯的寄生,所携带的遗传信息能赋予细菌特定的遗传性状。 例如,致育性质粒(F质粒)可以决定细菌的性别; 耐药性质粒(R质粒)带有耐药基因,可以使宿主菌获得耐受相应抗生素的能力; 大肠杆菌素质粒(Col质粒)能使大肠杆菌合成大肠杆菌素,后者可以杀死不含大肠杆菌素质粒的亲缘细菌。(二) 质粒的分类 1.严紧型粒和松弛型粒 根据复制性质,可以把质粒划分为两类: 一是严紧型粒(stringent plasmid),当细胞染色体复制一次时质粒也复制一次,每个细胞只有12个质粒,也称为低拷贝数质粒; 另一类是松弛型粒(relaxed
23、 plasmid),当染色体复制停止后仍继续复制,每一个细胞内一般有20个左右的质粒,也称为高拷贝数质粒。 一般分子量较大的质粒属严紧型,分子量较小的属松弛型。 需要指出,一种质粒属于松弛型还是严紧型并不是绝对的,这往往同宿主的状况有关。 同一质粒在不同的宿主细胞中可能具有不同的复制型,这说明质粒的复制不仅受自身的制约,同时还受到宿主的控制。 2.接合质粒和非接合型质粒 根据质粒DNA中是否含有接合转移基因,可以分成两大类。 接合型质粒(conjugative plasmid)也称自我转移的质粒,这类质粒除含有自我复制的基因外,还带有一整套控制细菌配对和质粒接合转移的基因,因此能从一个细胞自我
24、转移到另的细胞。 如F质粒,部分R质粒和部分Col质粒。 如F质粒,雌雄细胞通过性纤毛相互接触而结合,质粒便从一个细胞传递给另一个细胞。 非接合型质粒也称不能自我转移的质粒。 此类质粒含有自我复制的基因,能进行自我复制,但不含转移基因。 因此,这类质粒不能从一个细胞自我转移到另外的细胞。 3.相容性质粒和不相容性质粒 质粒有相容性和不相容性两种。 相容性质粒可以在同一宿主菌的细胞内同时存在。 但也有些质粒不能相容,不能在同一个宿主菌的细胞内同时存在。 通常亲缘关系密切的两种质粒不能在同一宿主细胞中稳定共存,这一现象称为质粒的不相容性(plasmid incompatibility),也称不亲和
25、性。 4.窄宿主谱质粒和广宿主谱质粒 窄宿主谱质粒存在于一种或数种密切相关的宿主,而广宿主谱质粒可以在不同科,属,种细菌之间传递。 质粒的宿主范围是由质粒复制时对宿主的依赖程度决定的。 5.按功能分类 R质粒:抗药性质粒 F质粒(fertility factor):性质粒(sex plasmid)可决定细菌的性别 Col质粒:大肠杆菌素质粒,合成大肠杆菌素,杀死不含大肠杆菌素质粒的亲缘细菌。质粒质粒DNApBR322EcoR、Pst、Hind、BamH、Sal只有一个酶切位点,便于外源基因的插入。(三) 质粒的遗传控制 1. 复制调控系统:控制质粒的拷贝数。 复制调控系统控制质粒的拷贝数。 该
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分子生物学 第二 基因 基因组 ppt 课件
限制150内