分子生物学第1章细胞核基因组.ppt
《分子生物学第1章细胞核基因组.ppt》由会员分享,可在线阅读,更多相关《分子生物学第1章细胞核基因组.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1.1 核基因组大小核基因组大小1.2 重复序列重复序列1.3 基因家族基因家族1.4 真核基因的断裂结构真核基因的断裂结构1细胞核基因组1.1 核基因组大小 一一个个物物种种中中所所包包含含的的基基因因就就是是一一个个基基因因组组,确确切切地地说说,基基因因组组是是指指一一个个物物种种的的单单倍倍体体的的染染色色体体所所包包含含的的全全部部基基因因。对对于于只只有有一一个个染染色色体体的的原原核核生生物物来来说说,它它的的一一个个细细胞胞中中(一一个个染染色色体体)的的全全部部基基因因组组成成其其基基因因组组;对对于于通通常常的的二二倍倍体体生生物物来来说说,是是指指能能维维持持配配子子或或
2、配配子子体体正正常常功功能能的的最最低低数数目目的的一一套套染染色色体体所所包包含含的的全全部部基基因因。真真核核生生物物基基因因组组包包括括核核基基因组和细胞器基因组。因组和细胞器基因组。衡量基因组大小的单位 一一个个真真核核生生物物的的核核基基因因组组的的大大小小可可以以通通过过化化学学分分析析、DNA复复性性动动力力学学等等方方法法进进行行测测定定。如如果果一一个个DNA分分子子(双双链链)重重1pg(1012g),就就意意味味着着它它长长约约31cm,含含有有10 9 bp(base pair,碱碱基基对对),分分子量为子量为1011道尔顿。道尔顿。C值的概念 一一个个单单倍倍体体基基
3、因因组组的的DNA含含量量是是恒恒定定的的,它它代代表表着着一一个个生生物物种种的的特特征征,称称为为物物种种DNA的的C值值。C值值可可以以用用pg为为单单位位表表示示,也也可可以以用用bp为为单单位位表表示示。各各种种生生物物的的C值值相相差差很很大大,并并有有随随着着有有机机体体复复杂杂度度增增加加而而C值值增增大大的的趋趋势势,说说明明随随着着有有机机体体复复杂杂度度的的增增加加,对对遗遗传传物物质质DNA量量的的需需要要也也随随之之增增加加。DNA是是遗遗传传信信息息的的载载体体,较较复复杂杂的的有有机机体体需需要要较较多多的的遗遗传传信信息息是好理解的。是好理解的。表表11 一些生
4、物物种的一些生物物种的DNA质量质量生物物种生物物种DNA质量质量(2C值)值)/pg染色体数染色体数(2n)生物物种生物物种DNA质量质量(2C值)值)/pg染色体数染色体数(2n)两栖鲵两栖鲵168.024贝母贝母196.724蝾螈蝾螈85.324百合百合72.224赤蛙赤蛙10.926小麦小麦34.614牛牛6.460玉米玉米11.020人人6.446烟草烟草7.824羊羊5.754油菜油菜3.238鼠鼠5.040水稻水稻2.024果蝇果蝇0.28亚麻亚麻1.430拟南芥拟南芥0.1410粘菌粘菌0.384(1C)7(1n)大肠杆菌大肠杆菌0.0040酵母酵母0.026(1C)15(1n
5、)噬菌体噬菌体0.000055图图11 不同有机体的不同有机体的C值大小值大小C值悖论 一一般般来来说说,一一种种生生物物的的形形态态学学复复杂杂性性应应该该与与其其C值值的的大大小小大大致致相相关关,因因为为一一种种生生物物的的形形态态学学复复杂杂性性必必然然是是它它基基因因复复杂杂性性的的反反映映。然然而而仔仔细细研研究究有有机机体体复复杂杂度度和和C值值的的关关系系,就就会会发发现现难难以以解解释释的的问问题题。如如人人与与两两栖栖动动物物C值值的的比比较较。另另外外,一一些些密密切切相相关关的的种种属属的的C值值呈呈现现出出惊惊人人的的差差异异,如如两两栖栖类类动动物物中中C值值可可相
6、相差差50倍倍,豆豆科科植植物物中中的的蚕蚕豆豆比比百百脉脉根根的的C值值大大100倍倍。只只有有低等生物的情况符合这种设想。这就是低等生物的情况符合这种设想。这就是C值悖论。值悖论。对基因数目的估计 通通过过估估计计不不同同种种类类mRNA的的数数目目,可可以以估估计计出出一一个个特特定定哺哺乳乳动动物物细细胞胞中中能能表表达达的的基基因因总总数数约约为为10,000个个,考考虑虑到到不不同同细细胞胞类类型型有有些些不不同同的的基基因因表表达达,我我们们可可以以认认为为哺哺乳乳动动物物细细胞胞基基因因组组有有功功能能的的基基因因数数目目在在30,00040,000个个之之间间。假假设设哺哺乳
7、乳类类基基因因的的平平均均大大小小为为5,0008,000bp(它它们们实实际际上上比比大大多多数数已已知知的的基基因因要要长长些些),根根据据C值值计计算算,哺哺乳乳类类基基因因组组中的基因数目理论上应在中的基因数目理论上应在40万万60万个之间。万个之间。对基因数目的估计 果果蝇蝇必必需需的的基基因因总总数数约约为为5000个个,由由于于对对昆昆虫虫基基因因大大小小的的合合理理估估计计为为2,000bp,那那么么,5,000个个基基因因的的总总长长度度为为107bp,而而果果蝇蝇的的C值值为为108bp。这这些分析说明,基因组中大部分些分析说明,基因组中大部分DNA是不表达的。是不表达的。
8、DNA变性 在在受受到到加加热热、高高浓浓度度盐盐处处理理时时,DNA双双螺螺旋旋碱碱基基配配对对结结合合的的氢氢键键会会断断裂裂,双双螺螺旋旋链链分分开开成成单单链链,这这个个过过程程称称为为变变性性(denaturation)或或解解链链作作用用(melting)。)。DNA的热变性增色效应 核核酸酸中中的的碱碱基基有有很很强强的的紫紫外外吸吸收收,它它的的吸吸收收峰峰在在260nm。当当DNA以以双双螺螺旋旋形形式式存存在在时时,浓浓度度为为50g/ml的的A260=1.00(光光径径1cm),变变性性成成单单链链后后,同同样样浓浓度度的的核核酸酸溶溶液液的的A260=1.37,这就是增
9、色效应。,这就是增色效应。影响Tm值的因素 G-C对对含含量量越越高高,Tm就就越越高高,G-C对对含含量量每每增增加加1%,Tm大大约约增增加加0.4。在在近近似似生生理理条条件件下下,DNA的的Tm一一般般在在8595之之间间。溶溶液液中中的的离离子子强强度度对对Tm有有很很大大影影响响,在在一一定定的的范范围围内内,一一价价阳阳离离子子浓浓度度每每增增加加10倍倍,Tm增增加加16.6。若若要要降降低低Tm,可可加加入入甲甲酰酰胺胺,因因为为甲甲酰胺能降低氢键的稳定性。酰胺能降低氢键的稳定性。复性与杂交 在在适适宜宜的的条条件件下下,两两条条分分开开的的互互补补链链可可重重新新形形成成双
10、双螺螺旋旋,这这个个反反应应称称为为复复性性(renaturation)。使使两两条条互互补补的的单单链链形形成成双双螺螺旋旋的的过过程程称称为为退退火火(anneal)。两两条条不不同同来来源源的的互互补补单单链链经经退退火火形形成成双双链链的的反反应应称称为为杂杂交交(hybridization),杂杂交交可可以以在在DNA单单链链之之间间进进行行,也也可可以以在在DNA单单链链和和RNA单链之间进行。单链之间进行。复性动力学 复复性性动动力力学学指指的的是是复复性性核核酸酸的的量量随随着着时时间间变变化化的的情情况况。它它可可以以用用来来检检测测DNA的的复复杂杂性性。高高度度重重复复序
11、序列列多多则则复复杂杂性性低低,单单一一序序列列多则复杂性高。多则复杂性高。复性动力学的测定 首首先先将将纯纯化化的的DNA通通过过高高速速搅搅拌拌或或小小孔孔喷喷射射,以以取取得得大大小小均均匀匀的的片片段段;100瞬瞬间间处处理理后后(使使其其变变性性)迅迅速速冷冷却却到到适适当当温温度度复复性性,如如温温度度控控制制在在低低于于Tm 20左左右右,在在标标准准的的磷磷酸酸缓缓冲冲液液中中保保温温,每每隔隔一一定定时时间间测测定定DNA复复性性的的数数量。量。复性动力学的测定 测测DNA复复性性的的方方法法有有两两种种,一一种种是是测测A260的的变变化化,另另一一种种是是用用羟羟基基磷磷
12、灰灰石石柱柱分分离离双双链链和和单单链链DNA,双双链链DNA吸吸附附而而单单链链DNA流流出出,再测定流出单链再测定流出单链DNA的量。的量。复性动力学方程的推导 DNA复复性性取取决决于于两两条条单单链链的的随随机机碰碰撞撞,因因此此它它遵循二级反应动力学,其反应符合下列方程式:遵循二级反应动力学,其反应符合下列方程式:式式中中C为为时时间间t t时时,单单链链DNA的的浓浓度度;k k为为反反应应速速度常数。度常数。,(2),(1)当复性完成一半时,当复性完成一半时,带入(,带入(1 1)式得)式得 ,复性动力学方程的推导复性动力学方程的意义 从从(1)式式和和(2)式式可可以以看看出出
13、,控控制制复复性性反反应应的的参参数数是是单单链链DNA初初始始浓浓度度 和和复复性性时时间间 的的乘积,称为乘积,称为 。越大,越大,越小。越小。(1)(2)简单基因组的Co o t曲线横坐标横坐标C 0 0 tC0t1/2值与基因组大小的比例关系 可可以以作作为为衡衡量量一一个个基基因因组组大大小小的的尺尺度度,但但必必须注意前提条件须注意前提条件(非重复序列)(非重复序列)。真核生物基因组的单一序列和重复序列 当当基基因因组组中中存存在在有有重重复复序序列列时时,情情况况就就复复杂杂了了。由由于于重重复复序序列列相相互互碰碰撞撞的的几几率率较较高高,复复性性速速率率也也就就较较快快。既既
14、有有单单一一序序列列又又有有重重复复序序列列的的基基因因组的组的 曲线会出现若干个拐点。曲线会出现若干个拐点。假设的真核基因组的Cot曲线 三三个个部部分分的的表表观观 分分别别为为、和和630,分分别别占占基基因组的百分数为因组的百分数为25%、30%和和45%。高度重复序列高度重复序列中度重复序列中度重复序列单一序列单一序列重复序列单位长度的计算 为为了了推推算算每每一一部部分分DNA所所对对应应的的bp数数,必必须须把把每每一部分当成独立的组成来考虑。三个部分的实际一部分当成独立的组成来考虑。三个部分的实际应应为为30%=0.57,63045%=283。以以大大肠肠杆杆菌菌的的 作为标准
15、,则三个部分的作为标准,则三个部分的bp数应为(视作单一序列):数应为(视作单一序列):重复频率的计算 以以上上三三个个结结果果为为动动力力学学复复杂杂长长度度。此此模模式式基基因因组的复杂度记为组的复杂度记为“3.01086.0105340 bp”重复频率(重复频率(f)=化学复杂长度化学复杂长度动力学复杂长度动力学复杂长度 用用化化学学法法测测得得的的DNA总总长长度度为为108 bp,其其中中25%为为108 bp,30%为为108 bp,45%为为108 bp。这这三三个个结结果果为为化化学学复复杂杂长长度度。代代入入上上式式可可以以计计算算出出三部分的重复频率分别为三部分的重复频率分
16、别为500,000、350、1。重复频率的计算 在在同同一一条条复复性性曲曲线线中中,任任何何两两个个组组分分的的重重复复频频率率和和它它们们的的表表观观 成成反反比比关关系系。因因此此,如如果果我我们们假假设设非非重重复复组组分分DNA确确实实是是单单拷拷贝贝的的(f=1),那那么可以用下式计算其它重复组分的重复频率。么可以用下式计算其它重复组分的重复频率。(这里的(这里的 应为表观应为表观 )非重复序列 在在基基因因组组中中只只有有一一个个拷拷贝贝的的序序列列称称为为单单一一序序列列或或非非重重复复序序列列。在在原原核核细细胞胞基基因因组组中中,都都是是非非重重复复序序列列;而而在在真真核
17、核细细胞胞基基因因组组中中,非非重重复复序序列列占占有有不不同同的的比比例例。用用从从烟烟草草叶叶子子mRNA制制备备的的cDNA与与不不同同 部部分分的的烟烟草草基基因因组组变变性性DNA杂杂交交试试验验观观察察到到,杂杂交交只只在在单单一一序序列列DNA组组分分中中形形成成,这这表表明明烟烟草草叶叶子子中中表达的基因大部分是单一序列基因。表达的基因大部分是单一序列基因。表达基因的比例 比比较较单单一一序序列列的的总总bp数数和和表表达达的的bp数数可可以以发发现现,表表达达的的基基因因只只占占单单一一序序列列总总量量的的很很少少一一部部分分,在在烟烟草草中中这这个个比比例例为为5%。单单一
18、一序序列列中中有有很很多多是是非非编编码码序序列列,如如调调控控序序列列、内内含含子子等等,还还有有沉沉默默基基因。因。1.2 重复序列 基基因因组组中中具具有有2个个以以上上拷拷贝贝数数的的序序列列称称为为重重复复序序列列,其其中中有有些些重重复复序序列列是是有有编编码码功功能能的的,如如rRNA基基因因、tRNA基基因因、人人的的珠珠蛋蛋白白基基因因、组组蛋蛋白白基基因因等等。大大部部分分重重复复序序列列是是没没有有编编码码功功能能的的。根根据据重重复复频频率率的的大大小小,又又将将重重复复序序列列分分为为中中度度重重复复序序列列和高度重复序列。和高度重复序列。图图14 不同生物基因组中不
19、同生物基因组中 不同序列组分的比例不同序列组分的比例重复序列家族 基基因因组组中中(真真核核细细胞胞)含含有有许许多多重重复复序序列列家家族族,每每个个家家族族含含有有数数目目不不等等的的成成员员,各各个个家家族族之之间间成成员员的的大大小小也也不不一一样样。要要注注意意的的是是。同同一一家家族族成成员员之之间间的的序序列列不不一一定定完完全全一一样样,可可以以是是具具有有很很高高的的同同源源性性、并并具具有有某某些些共共同同特特点点的的序序列列。人人类类基基因因组组中中有有一一个个Alu序序列列家家族族,它它有有3105个个成成员员,每每个个成成员员长长300bp;在在170bp处处均均有有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分子生物学 细胞核 基因组
限制150内