基因及基因组结构.ppt





《基因及基因组结构.ppt》由会员分享,可在线阅读,更多相关《基因及基因组结构.ppt(131页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 基因及基因组结构基因及基因组结构一、基因(gene)n(一)定义(一)定义n生物学定义:生物学定义:具有遗传功能的具有遗传功能的DNA片段。片段。n分子生物学定义:分子生物学定义:DNA分子中含有特定遗传信息的核苷酸分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功序列,是遗传物质的最小功能单位。合成有功能的多肽链或能的多肽链或RNA所必需的全部核酸序列(通所必需的全部核酸序列(通常是常是DNA序列)。序列)。(二)基因的组成n一个基因应包含不仅是编码蛋白质肽链或一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控的核酸序列,还包
2、括为保证转录所必需的调控序列、序列、5非翻译序列、内含子以及非翻译序列、内含子以及3非翻译序非翻译序列等所有的核酸序列(蛋白质基因和列等所有的核酸序列(蛋白质基因和RNA基因)基因)。(三)基因分类基因分类n第一类是编码蛋白质的基因,第一类是编码蛋白质的基因,它具有转录和翻它具有转录和翻译功能,译功能,包括编码酶和结构蛋白的结构基因以包括编码酶和结构蛋白的结构基因以及编码阻遏蛋白的调节基因及编码阻遏蛋白的调节基因n第二类是只有转录功能而没有翻译功能的基因第二类是只有转录功能而没有翻译功能的基因,包括包括tRNA基因和基因和rRNA基因基因n第三类是不转录的基因,第三类是不转录的基因,它对基因表
3、达起调节它对基因表达起调节控制作用,控制作用,包括启动基因和操纵基因包括启动基因和操纵基因二、基因组(genome)n(一)定义n生物学定义:生物学定义:细胞内所携带的全部遗传信息细胞内所携带的全部遗传信息DNA的总和;对多倍体生物指单倍体的总和;对多倍体生物指单倍体DNA的的总和。总和。n分子生物学定义:分子生物学定义:n携带生物体全部遗传信息的核酸量。携带生物体全部遗传信息的核酸量。n 编码蛋白的结构基因编码蛋白的结构基因n 基因组基因组DNA 复制转录的调控序列复制转录的调控序列n 功能尚不清楚的区域功能尚不清楚的区域n不同生物体中具有不同的基因组大小不同生物体中具有不同的基因组大小对人
4、类而言:对人类而言:22+X+Y+mtDNA22+X+Y+mtDNA。virusesplasmidsbacteriafungiplantsalgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotide pairs(base-pairs)10410810510610710111010109The size of the humangenome is 3 X 109 bp;almost all of its complexityis in single-copy DNA.The human genome is thoughtto
5、 contain 30,000 to 40,000 genes.bony fishamphibians(二)遗传物质组成n 病毒基因组病毒基因组n核基因组核基因组 原核生物基因组原核生物基因组n 真核生物基因组真核生物基因组n 线粒体线粒体DNAn核外遗传物质核外遗传物质 叶粒体叶粒体DNAn 质粒质粒DNAn非独立的基因组:非独立的基因组:n 转位因子转位因子-能在基因组能在基因组DNA中移动的中移动的DNA序序列,不能独立存在,需插入核或核外列,不能独立存在,需插入核或核外DNA中。中。(三)(三)基因组结构与进化的关系:基因组结构与进化的关系:n1.基因组的物质组成从多样基因组的物质组成
6、从多样 单一;单一;n DNA、RNA分工明确分工明确n 单链、双链,线状、环状单链、双链,线状、环状 双链线状双链线状n2.基因组由小基因组由小 大;大;n3.DNA的利用率越来越低;(多拷贝、非编码的利用率越来越低;(多拷贝、非编码n 区、基因不连续)区、基因不连续)n4.调控序列增多,调控方式更复杂。调控序列增多,调控方式更复杂。第一节第一节 病毒基因组的结构病毒基因组的结构(一)病毒的基本结构(一)病毒的基本结构n外壳蛋白外壳蛋白:识别、侵袭特定的宿主细识别、侵袭特定的宿主细 胞,并保护基因组不被胞,并保护基因组不被 核酸酶破坏;核酸酶破坏;nDNADNA(RNARNA):):编码结构
7、蛋白和少量编码结构蛋白和少量 调控蛋白。调控蛋白。n不能独立复制,必需进入宿主细胞,借助不能独立复制,必需进入宿主细胞,借助细胞内一些酶类和细胞器才能得以复制。细胞内一些酶类和细胞器才能得以复制。(二)病毒基因组的结构特点:(二)病毒基因组的结构特点:n1.基因组较小,大小差异较大;基因组较小,大小差异较大;n CAV DNA 2.3kb,编码,编码3种蛋白质种蛋白质n 乙肝病毒乙肝病毒RNA 3kb,编码,编码4种蛋白质种蛋白质n 痘病毒痘病毒DNA 300kb,编码几百种蛋白,编码几百种蛋白 n基因组越小,编码蛋白越少,对寄主依赖基因组越小,编码蛋白越少,对寄主依赖性越大。性越大。2.2.
8、化学组成多样化学组成多样n DNA病毒、病毒、RNA病毒病毒n 单链、双链单链、双链n 线状、环状线状、环状n 分节段、不分节段分节段、不分节段单链环状单链环状DNA,基因组,基因组共共5386个核苷酸,构成个核苷酸,构成3个个转录单元,共编码转录单元,共编码11个个蛋白质,蛋白质,总分子量总分子量为为25万万左右,相当于左右,相当于6078个个核苷酸所容纳核苷酸所容纳的信息量。的信息量。其中非编码序列只有其中非编码序列只有217/5386,不足,不足5%。3.3.基因重叠现象普遍存在基因重叠现象普遍存在重叠基因重叠基因n 定义:定义:核苷酸序列彼此重叠的核苷酸序列彼此重叠的2个基因个基因为重
9、叠基因为重叠基因overlapping genes,或称,或称嵌套基因嵌套基因nested genes。n 类型:类型:一个基因的核苷酸序列完全包含在另一个基因中;一个基因的核苷酸序列完全包含在另一个基因中;两个基因的核苷酸序列部分重叠;两个基因的核苷酸序列部分重叠;两个基因只有一个碱基重叠。两个基因只有一个碱基重叠。一个基因终止密码子的最后一个碱基是另一个基因一个基因终止密码子的最后一个碱基是另一个基因起始密码子的第一个碱基。起始密码子的第一个碱基。5GCTGGTGGAAAATGAGGAAATTCAAT3 DNA序列序列 Leu Val Glu Asn Glu Glu Ile Gln K蛋白
10、蛋白 Ala Gly Gly Lys Ter A蛋白蛋白 FMetArg Lys Phe Asn C蛋白蛋白 噬菌体噬菌体G4一段一段DNA序列内序列内A、C、K基因三重重叠基因三重重叠基因基因读框相同读框相同,只是起始部位不同,只是起始部位不同重叠基因重叠基因n 实质:实质:两个基因虽共用一段核苷酸序列,但其两个基因虽共用一段核苷酸序列,但其读码结构互不相同,编码不同的蛋白质。读码结构互不相同,编码不同的蛋白质。n 意义:意义:使使DNA的利用率提高,是基因表达调控的利用率提高,是基因表达调控的方式之一。的方式之一。n目前,在少数原核生物(大肠杆菌、病毒)中目前,在少数原核生物(大肠杆菌、病
11、毒)中发现,在少数真核生物中也发现了类似的基因发现,在少数真核生物中也发现了类似的基因重叠现象(果蝇)。重叠现象(果蝇)。4.4.结构简练结构简练n大部分可编码蛋白质大部分可编码蛋白质,只有非常小的一只有非常小的一部份不编码蛋白质部份不编码蛋白质(通常是基因表达的通常是基因表达的控制序列)控制序列)(非编码序列较少);(非编码序列较少);X174 DNAX174 DNA中不翻译的部份只占中不翻译的部份只占 217/5375 217/5375 G4 DNA G4 DNA中不翻译的部份占中不翻译的部份占282/5577282/5577 乳头瘤病毒基因组中不翻译的部份占乳头瘤病毒基因组中不翻译的部份
12、占1.0/8.0 Kb1.0/8.0 Kb5.5.基因组中功能基因丛集成一个或几个特定区域,基因组中功能基因丛集成一个或几个特定区域,形成一个功能单位或转录单元,即形成形成一个功能单位或转录单元,即形成多顺反子多顺反子结构(结构(polycistroniepolycistronie)。)。多顺反子多顺反子mRNA:mRNA:可编码两条或两条以上蛋白质分可编码两条或两条以上蛋白质分子的子的mRNAmRNA的分子的分子。6.6.除反转录病毒外,病毒基因组只除反转录病毒外,病毒基因组只有一个拷贝;有一个拷贝;n7.有的病毒基因组中具有宿主细胞基因有的病毒基因组中具有宿主细胞基因组的结构特点;组的结构
13、特点;n比如:某些病毒基因组中的原癌基因与宿主比如:某些病毒基因组中的原癌基因与宿主细胞具有类似结构。细胞具有类似结构。第二节第二节 原核生物基因组结构原核生物基因组结构(一)细菌基因组的结构特点:(一)细菌基因组的结构特点:n1.拟核(类核)结构;拟核(类核)结构;n2.存在存在多顺反子结构;多顺反子结构;n3.除除RNA基因外,基本是单拷贝的;基因外,基本是单拷贝的;n利于核糖体的快速组装,短时间内合成大量核糖体。利于核糖体的快速组装,短时间内合成大量核糖体。n4.非编码序列相对较少;非编码序列相对较少;(相对于真核生物)(相对于真核生物)n5.基因多是连续的;基因多是连续的;n6.存在不
14、同的功能识别区存在不同的功能识别区n 复制起始区、复制终止区等复制起始区、复制终止区等大肠杆菌的类核结构大肠杆菌的类核结构核中央由支架蛋白核中央由支架蛋白和和RNA组成,环状组成,环状双链双链DNA绕在支架绕在支架蛋白的外围,只有蛋白的外围,只有一个复制起点,一个复制起点,DNA与细胞膜粘在与细胞膜粘在一起一起DNA上有结合上有结合蛋白。蛋白。(二)大肠杆菌基因组结构:大肠杆菌基因组结构:n1.基因组基因组DNA在在4000kb,估计有,估计有3500个基因,个基因,已确定的基因有已确定的基因有900个,已确定有个,已确定有260个基因具有个基因具有操纵子结构(操纵子结构(75个操纵子中),每
15、个基因平均长个操纵子中),每个基因平均长度度1000bp;n2.已确定的基因中,多数是与代谢有关的酶、核已确定的基因中,多数是与代谢有关的酶、核糖体蛋白;糖体蛋白;n3.大多数基因是随机分布的,两条单链作为模板大多数基因是随机分布的,两条单链作为模板的概率基本相等;的概率基本相等;n4.多数基因都是单拷贝。多数基因都是单拷贝。第三节第三节 真核生物核基因组真核生物核基因组(一)真核生物核基因组特点(一)真核生物核基因组特点n1.1.基因组较大;基因组较大;n低低等等真真核核生生物物:107-108 bp,较较原原核核生生物物大大10倍;倍;n高高等等真真核核生生物物:5X108-1010 bp
16、,某某些些植植物物和两栖生物可达和两栖生物可达1011 bp;n哺哺乳乳类类生生物物大大于于2X109它它们们可可编编码码100万万个个基基因。因。Nucleosome structureNucleosome core(left)146 bp DNA;1 3/4 turns of DNA DNA is negatively supercoiled two each:H2A,H2B,H3,H4(histone octomer)Nucleosome(right)200 bp DNA;2 turns of DNA plus spacer also includes H1 histonen2.2.真核
17、生物核真核生物核DNADNA与蛋白质结合,与蛋白质结合,形成核小体,再缠绕成染色质(染色体);形成核小体,再缠绕成染色质(染色体);Nucleofilament structuren3.基因组一般为双倍体(基因组一般为双倍体(diploid););n4.基因为单顺反子。基因为单顺反子。单单顺顺反反子子:一一个个基基因因单单独独转转录录,一一个个基基因一条因一条mRNAmRNA,翻译成一条多肽链;,翻译成一条多肽链;n5.存存在在大大量量重重复复序序列列,重重复复次次数数可可高高达达百万倍;百万倍;n6.基基因因组组中中非非编编码码序序列列多多于于编编码码序序列列,有大量的冗余有大量的冗余DNA
18、;n7.大大部部分分基基因因有有内内含含子子,因因此此基基因因不不连续;连续;n8.具有多个复制起点,而每个复制子具有多个复制起点,而每个复制子的长度较小。的长度较小。n真核生物基因组的突出特点:真核生物基因组的突出特点:n 重复性、基因家族、不连续性。重复性、基因家族、不连续性。Properties of the human genomeNuclear the haploid human genome has 3 X 109 bp of DNA single-copy DNA comprises 75%of the human genome the human genome contains
19、 30,000 to 40,000 genes most genes are single-copy in the haploid genome genes are composed of from 1 to 75 exons genes vary in length from 2,300,000 bp Alu sequences are present throughout the genomeMitochondrial circular genome of 17,000 bp contains 40 genes Type of DNA%of Genome Features Single-c
20、opy(unique)75%Includes most genes 1Repetitive Interspersed15%Interspersed throughout genome between and within genes;includes Alu sequences 2 and VNTRs or mini(micro)satellites Satellite(tandem)10%Highly repeated,low complexity sequences usually located in centromeres and telomeres1 Some genes are r
21、epeated a few times to thousands-fold and thus would be in the repetitive DNA fraction。2 Alu sequences are about 300 bp in length and are repeated about 300,000 times in the genome.They can be found adjacent to or within genes in introns or nontranslated regions.501000I I I I I I I I Ifast 10%interm
22、ediate 15%slow(single-copy)75%Classes of repetitive DNAInterspersed(dispersed)repeats(e.g.,Alu sequences)TTAGGGTTAGGGTTAGGGTTAGGGTandem repeats(e.g.,microsatellites)GCTGAGGGCTGAGGGCTGAGG间隔重复序列串联重复序列(二)重复性(重复序列)重复性(重复序列)n复杂度复杂度(X)是指在基因组)是指在基因组DNA分子中无重复核分子中无重复核苷酸序列的最大长度。例如,(苷酸序列的最大长度。例如,(ATAT)n的复的复杂度为
23、杂度为2,(,(ATGC)n的复杂度为的复杂度为4,噬菌体,噬菌体T4是由是由2105不重复核苷酸对的不重复核苷酸对的DNA分子组成,分子组成,其复杂度为其复杂度为2105。nC0t1/2值是复性反应进行到一半时,单链值是复性反应进行到一半时,单链DNA初始浓度和所需时间的乘积,初始浓度和所需时间的乘积,C0t1/2值越大表值越大表明复性反应越慢,重复序列少,所以明复性反应越慢,重复序列少,所以C0t与与DNA中非重复序列的核苷酸数量成正比。中非重复序列的核苷酸数量成正比。n来自不同生物的来自不同生物的DNA,如果反应条件和,如果反应条件和DNA片段大小相同,则复杂度越大,复片段大小相同,则复
24、杂度越大,复性速度就越慢,而性速度就越慢,而C0t12 值就越大。值就越大。也就是说,基因组的复杂度与其也就是说,基因组的复杂度与其C0t12值成正比,即:值成正比,即:x=C0t12 基因的重复次数基因的重复次数=实际长度实际长度/DNA复杂度复杂度真核生物真核生物DNA复性的各项参数复性的各项参数序列种类序列种类 占基因组占基因组DNA的比例的比例 C0t12值值 复杂度复杂度(X)重复频率重复频率(f)高度重复高度重复 25%0.0013 340bp 500000 中度重复中度重复 30%1.9 6.0105bp 350 单一序列单一序列 45%630 3.0108bp 1 据基因组重复
25、次数高低:据基因组重复次数高低:n单拷贝序列单拷贝序列n 轻度重复序列轻度重复序列 2 101n重复序列重复序列 中度重复序列中度重复序列 10 102n 高度重复序列高度重复序列 102 1061.1.单拷贝序列:单拷贝序列:n只有一个拷贝,只有一个拷贝,占基因组的占基因组的40-70%.主要是功能基因。主要是功能基因。n单拷贝序列又称为非重复序列单拷贝序列又称为非重复序列,在一个,在一个基因组中只有一个拷贝,基因组中只有一个拷贝,在在DNA复性曲复性曲线中,它是最慢速复性的部分线中,它是最慢速复性的部分。大多数。大多数结构基因都属于这一类型,但单拷贝序结构基因都属于这一类型,但单拷贝序列并
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 基因组 结构

限制150内