真核生物基因组结构.pptx
《真核生物基因组结构.pptx》由会员分享,可在线阅读,更多相关《真核生物基因组结构.pptx(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、C C值(值(C-valueC-value):一个物种单倍体基因组的:一个物种单倍体基因组的DNADNA含量,含量,通常称为该物种的通常称为该物种的C C值。值。每个物种的每个物种的C C值是相对恒定的,不同物种的值是相对恒定的,不同物种的C C值差值差异极大。异极大。一般一般随着生物结构和功能复杂程度的增加而随着生物结构和功能复杂程度的增加而C C值增值增大大,即:生物细胞中的,即:生物细胞中的C C值具有从低等生物到高等生物值具有从低等生物到高等生物逐渐增加的趋势。逐渐增加的趋势。一、真核生物基因组的大小一、真核生物基因组的大小第1页/共67页支原体细菌酵母霉菌蠕虫昆虫鸟类两栖类哺 乳类1
2、010109108107106第2页/共67页 低等动物的低等动物的C C值大于高等动物值大于高等动物 如:两栖类的如:两栖类的C C值大于哺乳类值大于哺乳类 肺鱼的肺鱼的C C值比哺乳动物大值比哺乳动物大10101515倍倍 同一门中的动物同一门中的动物C C值变化很大值变化很大如:两栖类中的如:两栖类中的C C值变化很大,可相差值变化很大,可相差100100倍倍家蝇的比果蝇的大家蝇的比果蝇的大6 6倍倍指指 C C值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象,也,也叫叫 C C值反常理论值反常理论。说明真核生物基因组中许多的说明真核生物基因组中许多的DNADNA
3、序列不编码蛋白质。序列不编码蛋白质。表现:表现:C值悖理理论(C-value paradox)第3页/共67页植物鸟类哺乳动物爬行动物两栖动物硬骨鱼软骨鱼棘皮动物甲壳动物昆虫软体动物蠕虫霉菌藻类真菌格兰氏阳性菌格兰氏阴性菌支原体阴影部分为一个门内C-值的范围第4页/共67页二、真核生物基因组的基因数量二、真核生物基因组的基因数量 不同物种编码基因差别很大,从不同物种编码基因差别很大,从500500个到个到5000050000个,个,有有100100倍的差距。倍的差距。真核生物的基因数量通常在真核生物的基因数量通常在60006000到到5000050000之间。之间。人的人的基因组的全长为大约基
4、因组的全长为大约3 X 103 X 109 9对对碱基,编码碱基,编码 3-43-4万个基因万个基因;但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量可能不超过可能不超过30003000个,比很多细菌的基因数量还少。个,比很多细菌的基因数量还少。第5页/共67页其中,其中,C C是单链是单链DNADNA在在t t时刻的浓度。时刻的浓度。k k复性速度常数复性速度常数三、真核生物基因组的非重复序列和重复序列三、真核生物基因组的非重复序列和重复序列1.DNA复性动力学复性动力学DNADNA的复性过程遵循二级反应动力学。的复性过程遵循二级反应动力学。的复性过程
5、遵循二级反应动力学。的复性过程遵循二级反应动力学。DNADNA复性过程中复性的速度用公式表示:复性过程中复性的速度用公式表示:dC/dt=-dC/dt=-k kC C0 02 2第6页/共67页 对上式积分后重排,对上式积分后重排,对上式积分后重排,对上式积分后重排,得出得出得出得出复性动力学方程复性动力学方程复性动力学方程复性动力学方程:C CC C0 01 1(1 1 k k C C0 0t t)C C0 0为单链为单链DNADNA的起始浓度,的起始浓度,C C为单链为单链DNADNA在在t t时刻的浓度,时刻的浓度,单位单位mol/Lmol/L。t t为复性时间为复性时间,单位为单位为s
6、 s(秒)。重组速率常数(秒)。重组速率常数k k的的单位为单位为L/molL/mol,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和DNADNA序列的复杂性。序列的复杂性。当 C/C0=1/2 时的C0t值定义为C0t1/2C /C0=1/2=1/(1+k C0t(1/2)Cot(1/2)=1/k(mol.Sec/L)即复性反应完成一半时第7页/共67页p在在控控制制反反应应条条件件(初初始始浓浓度度、温温度度、离离子子强强度度、片片段段大大小小)相相同同的的前前提提下下,DNA分分子子的的C0t(1/2)值值,取取决决于于核核苷苷酸的排列复杂性。酸的排列复杂性。
7、pDNA序序列列的的复复杂杂度度(complexity)X:最最长长的的没没有有重重复复序序列列的核苷酸对的数值。的核苷酸对的数值。AAAAAAAA X=1ATCGATCGATCG X=4 N=105 X=105DNA序列的复杂性、初始浓度、片段大小、温度、离子强度DNA复性的影响因素:复性的影响因素:X=k Cot1/2第8页/共67页n相同核苷酸数量的DNA,复杂性小的DNA分子复性快,Cot(1/2)值小;复杂性大的DNA分子复性慢,Cot(1/2)大。nCot曲线:表示复性速度与DNA顺序复杂性的关系。Cot(1/2)=1/k(mol.Sec/L)第9页/共67页 Cot曲线第10页/
8、共67页2.利用复性动力学鉴定基因组序列第11页/共67页原核生物Cot曲线的特点:形状相似(跨越2-3个数量级),Cot(12)不相同单一序列,只是复杂性不同。第12页/共67页复杂性复杂性X 1不同原核生物的Cot曲线复性分数(1-c/c0)Cot第13页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第14页/共67页 根据复性动力学特征的不同,将真核生物DNA序列分为4类:p 零时复性序列p 快速复性序列p 中速复性序列p 慢速复性序列第15页/共67页1)零时复性序列:具有反向重复结构(也称回文结构),可在同一条链内形成双链区,变性
9、后再复性时,在链间复性之前就已发生链内复性,因此不遵循二级反应动力学方程。由于这种序列的复性速度非常快,在动力学上称为零时(或瞬时)复性序列。DNA复性后可出现发卡形结构。这种序列常常是DNA复制酶、转录酶以及特异蛋白质的结合部位。第16页/共67页2 2)快速复性序列:也叫高度重复序列(Highly repetitive sequence)大部分集中于异染色质区,特别是在着丝粒和端粒区,往往没有转录功能。占基因组的10-60%,长度6 200bp,重复次数在105以上。第17页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第18页/共67
10、页3)中速复性序列:基因组中重复次数105的重复顺序,重复单位平均长度约300bp;复性速度快于单拷贝顺序,慢于高度重复顺序。多与单拷贝基因间隔排列。多为非编码序列,如Alu序列也有编码基因产物的,如rDNA、tDNA、组蛋白基因家族,一般往往以基因家族的形式存在。也叫中度重复序列(moderate repetitive sequences)第19页/共67页Alu family(Alu 家族):长约300bp的片段,大多数片段含有一个限制性内切酶Alu的酶切位点(AGCT);均匀分散在整个基因组中的非重复序列间;在人类基因组中占1 3;第20页/共67页4)慢速复性序列:C0t1/2一般在1
11、03mol.s/L以上,复性速度极慢,在一个基因组中只有一个拷贝或23个拷贝,也称非重复序列(单一序列、单拷贝序列)。l结构基因(蛋白质基因)大多是单拷贝序列。第21页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第22页/共67页大部分结构基因位于非重复的DNA序列内第23页/共67页第二节第二节 断裂基因(断裂基因(split gene)不连续基因(不连续基因(interrupted gene)编码某一编码某一RNARNA的基因中有些序列并不出现在成熟的基因中有些序列并不出现在成熟的的RNARNA序列中,成熟序列中,成熟RNARNA的序
12、列在基因中被其他的的序列在基因中被其他的序列隔开。序列隔开。一、断裂基因由外显子和内含子组成一、断裂基因由外显子和内含子组成1 1、断裂基因的发现、断裂基因的发现 通过成熟通过成熟mRNAmRNA(或(或cDNAcDNA)与编码基因的)与编码基因的DNADNA杂杂交试验而发现。交试验而发现。第24页/共67页鸡卵清蛋白成熟mRNA与DNA杂交电镜图DNAmRNA第25页/共67页断裂基因由外显子和内含子组成。1978 Gilbert 首创这两个概念 二、外显子(外元、Exon)DNA 与成熟RNA间的对应区域氨基酸的编码区(amino acid coding region)非间隔区(unspa
13、cer)原初转录物中通过原初转录物中通过RNARNA拼接反应而保留于拼接反应而保留于成熟成熟RNARNA中的序列中的序列或基因中与成熟或基因中与成熟RNARNA序列相对应的序列相对应的DNADNA序列序列。2.断裂基因的结构断裂基因的结构第26页/共67页1.外显子具有保守的序列 不同物种中的同源基因的外显子序列通常是保守的。尤其是编码区内的外显子具有很强的保守性,但处于5和3非编码区的外显子有时会发生变化。2.外显子对应基因的功能性单位外显子与蛋白质的结构域相对应。3.不同基因可能存在相关的外显子不同基因中的某个或某几个外显子可能具有相关性。第27页/共67页三、内含子(内元、Intron)
14、DNA 与成熟RNA间的非对应区域 氨基酸的非编码区(uncoding region)间隔区(spacer)但被转录 原初转录物中通过原初转录物中通过RNARNA拼接反应而被拼接反应而被去除的去除的RNARNA序序列列或基因中与这种或基因中与这种RNARNA序列相对应的序列相对应的DNADNA序列。序列。R R环(环(R-loopR-loop):mRNAmRNA与编码单链与编码单链DNADNA杂交时,不杂交时,不互补的内含子部分形成的环。互补的内含子部分形成的环。第28页/共67页鸡卵清蛋白成熟mRNA与DNA杂交电镜图DNAmRNA第29页/共67页断裂基因前体mRNAIntrons 去除E
15、xons 连接第30页/共67页1.内含子的相位和类型(1 1)内含子相位内含子相位 内含子可以出现在转录本的任何位置,甚至在以后成为密内含子可以出现在转录本的任何位置,甚至在以后成为密码子的三核苷酸之间。码子的三核苷酸之间。若内含子位于一密码子的第三位核苷酸和另一密码子的第若内含子位于一密码子的第三位核苷酸和另一密码子的第一位核苷酸一位核苷酸(即两密码子之间即两密码子之间),则被称为,则被称为0 0位内含子位内含子;相应地,;相应地,位于一密码子的第一位和第二位核苷酸之间的内含子被称为位于一密码子的第一位和第二位核苷酸之间的内含子被称为1 1位位内含子内含子;位于第二和第三位之间时,则被称为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 基因组 结构
限制150内