《真核生物基因组精选课件.ppt》由会员分享,可在线阅读,更多相关《真核生物基因组精选课件.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于真核生物基因组第一页,本课件共有56页细胞核基因组(细胞核基因组(cytoblast cytoblast genomegenome)细胞器基因组(细胞器基因组(organelle organelle genomegenome)第二页,本课件共有56页由染色体由染色体DNADNA组成:组成:DNADNA+蛋白质蛋白质=核小体核小体线性双链线性双链DNADNA分子分子染色体的数目,绝大多数真核生物体染色体的数目,绝大多数真核生物体细胞都是二倍体细胞都是二倍体基因表达与染色质结构相关基因表达与染色质结构相关(一)细胞核基因组(一)细胞核基因组第三页,本课件共有56页*M期期染色体形式染色体形式大
2、部分细胞周期大部分细胞周期染色质染色质(弥散状弥散状)第四页,本课件共有56页 DNADNA染色质的电镜图像染色质的电镜图像a a、常染色质:密度较低,、常染色质:密度较低,一部分基因能被表达一部分基因能被表达b b、异染色质:密度较高,、异染色质:密度较高,不被表达不被表达(着丝粒、端粒着丝粒、端粒)第五页,本课件共有56页DNADNA:约约200bp200bp 组蛋白:组蛋白:H1H1 H2A H2A,H2BH2B H3 H3 H4 H4 核小体核小体 染色体的基本结构多染色体的基本结构多为为第六页,本课件共有56页 串珠状核小体结构串珠状核小体结构第七页,本课件共有56页念珠样结构不利于
3、基念珠样结构不利于基因表达因表达乙酰化组蛋白有利于乙酰化组蛋白有利于基因表达基因表达 核小体的细微结构影响基因表达核小体的细微结构影响基因表达第八页,本课件共有56页 细胞核基因组的特征细胞核基因组的特征第九页,本课件共有56页1.真核生物基因组都是由大分子双链线状真核生物基因组都是由大分子双链线状DNA构成。染色体通常成对出现(双倍构成。染色体通常成对出现(双倍体)。体)。真核生物基因组的一般特征真核生物基因组的一般特征2.基因组非常庞大,结构非基因组非常庞大,结构非常复杂,有多个复制起始常复杂,有多个复制起始位点。位点。第十页,本课件共有56页3.基因组中存在大量的基因组中存在大量的重复序
4、列重复序列以及以及非编非编码序列码序列。真核生物基因组内非编码序列。真核生物基因组内非编码序列占占90%以上,是与细菌、病毒的重要区以上,是与细菌、病毒的重要区别,在一定程度上也是生物进化的标尺。别,在一定程度上也是生物进化的标尺。4.功能基因大多不连续,存在有内含子和功能基因大多不连续,存在有内含子和外显子;外显子;5.真核生物基因组中也存在一些可移动的真核生物基因组中也存在一些可移动的DNA序列(转座元件)。序列(转座元件)。第十一页,本课件共有56页单顺反子结构单顺反子结构多数的真核生物不存在操纵子结构,每一个基多数的真核生物不存在操纵子结构,每一个基因都单独构成一个转录单位,转录产生单
5、顺反因都单独构成一个转录单位,转录产生单顺反子子mRNA,及编码一种蛋白质。,及编码一种蛋白质。这是原核生物基因这是原核生物基因的操纵子结构,转的操纵子结构,转录产生多顺反子录产生多顺反子mRNA,可编码,可编码多种蛋白质。多种蛋白质。第十二页,本课件共有56页原核生物的多顺反子原核生物的多顺反子真核生物的单顺反子真核生物的单顺反子非编码序列非编码序列核蛋白体结合位点核蛋白体结合位点起始密码子起始密码子终止密码子终止密码子编码序列编码序列PPP5 3 蛋白质蛋白质PPPmG-5 3 蛋白质蛋白质AAA 第十三页,本课件共有56页 真真核核生生物物结结构构基基因因的的DNA序序列列由由编编码码序
6、序列列和和非非编编码码序序列列两两部部分分交交替替组组成成,编编码码序序列列是是不不连连续续的的,被被非非编编码码序序列列分分割割开开来来,称称为断裂基因。其包括外显子和内含子。为断裂基因。其包括外显子和内含子。断裂基因断裂基因(split gene)第十四页,本课件共有56页外显子(外显子(exonexon):编码的:编码的DNADNA序列,即被序列,即被表达的表达的DNADNA区段区段内含子(内含子(intronintron):非编码的:非编码的DNADNA序列序列Gilbert Gilbert(19781978年)提出内含子、外显子概念年)提出内含子、外显子概念第十五页,本课件共有56页
7、 5GT AG 3法则法则在每个外显子和内含子的接头区都是一段在每个外显子和内含子的接头区都是一段高度保守的共有序列,内含子的高度保守的共有序列,内含子的5端是端是GT,3端是端是AG,这种接头方式称为,这种接头方式称为GT-AG法法则则,普遍存在于真核生物中,是,普遍存在于真核生物中,是RNA剪接的剪接的识别信号,转录后的前体识别信号,转录后的前体RAN中的内含子中的内含子剪接位点。剪接位点。第十六页,本课件共有56页 断裂基因存在的意义断裂基因存在的意义断裂基因存在是生物进化的结果,是从断裂基因存在是生物进化的结果,是从复制水平而言,复制水平而言,不同的外显子可分别编码不同的外显子可分别编
8、码不同的功能结构域,基因外显子不同的组不同的功能结构域,基因外显子不同的组合产生新的编码蛋白质,即是外显子改组合产生新的编码蛋白质,即是外显子改组。如血红蛋白和肌红蛋白均由独立的外显子编如血红蛋白和肌红蛋白均由独立的外显子编码结合血红素的结构域。码结合血红素的结构域。第十七页,本课件共有56页真核生物的重复序列真核生物的重复序列 重重复复序序列列:多多拷拷贝贝的的相相同同或或近近似似序序列列的的DNADNA片段片段真真核核生生物物基基因因组组中中通通常常存存在在大大量量的的重重复复序序列列,可占整个基因组可占整个基因组DNADNA的的90%90%以上。以上。按按复复性性动动力力学学方方法法可可
9、将将这这些些重重复复序序列列分分为为高高度度重重复复序序列列,中中度度重重复复序序列列和和低低度度重重复复序序列列(单拷贝序列)(单拷贝序列)三大类。三大类。第十八页,本课件共有56页(一)高度重复序列(一)高度重复序列高高度度重重复复序序列列在在基基因因组组中中重重复复频频率率高高,可可达达10106 6次次,因因此此复复性性速速度度很很快快。高高度度重重复复序序列列在在基基因因组组中中所所占占比比例例随随种种属属而而异异,一般在一般在101060%60%范围内。范围内。人人的的高高度度重重复复序序列列约约占占整整个个基基因因组组的的20%20%左右。左右。第十九页,本课件共有56页是是由由
10、两两个个相相同同顺顺序序的的互互补补拷拷贝贝在在同同一一DNADNA双双链上反向排列而成。链上反向排列而成。高度重复序列按其结构特点可分为两种:高度重复序列按其结构特点可分为两种:1.1.反向重复序列(反向重复序列(inverted repeatsinverted repeats)第二十页,本课件共有56页反向重复序列的两种形式反向重复序列的两种形式发卡结构发卡结构第二十一页,本课件共有56页回回 文文 结结 构构第二十二页,本课件共有56页2.2.卫星卫星DNADNA(satellite DNAsatellite DNA)卫卫星星DNADNA的的重重复复单单位位一一般般由由2 270 70
11、bpbp组组成成,成串排列。成串排列。卫卫星星DNADNA占占基基因因组组的的比比例例随随种种属属而而异异,在在0.50.531%31%范围内。范围内。第二十三页,本课件共有56页人类基因组中可分离出三类卫星:人类基因组中可分离出三类卫星:大卫星大卫星DNADNA(macrosatellite DNAmacrosatellite DNA):):其重复单位为其重复单位为5 5 171 bp171 bp,主要分布于染色体的,主要分布于染色体的着丝粒区。着丝粒区。小卫星小卫星DNADNA(minisatellite DNAminisatellite DNA):):其重复单位为其重复单位为1515 7
12、0 bp70 bp,存在于常染色体。,存在于常染色体。微卫星微卫星DNA/DNA/短串联重复序列(短串联重复序列(microsatellite microsatellite DNA/short tandem repeat,STRDNA/short tandem repeat,STR):):其重复单位为其重复单位为2 2 5 bp5 bp,存在于常染色体,常见,存在于常染色体,常见于内含子中。于内含子中。第二十四页,本课件共有56页 人人类类基基因因组组DNADNA中中平平均均每每6 610kb10kb就就有有一一个个STRSTR位位点点 。不不同同个个体体之之间间在在一一个个同同源源STRST
13、R位位点点的的重重复复次次数数不不同同。由由于于重重复复单单位位及及重重复复次次数数不不同同,使使其其在在不不同同种种族族,不不同同人人群群之之间间的的分分布布具具有有很很大大差差异异性性,构构成成了了STRSTR遗传多态性。遗传多态性。DNA指纹指纹第二十五页,本课件共有56页高度重复序列的功能高度重复序列的功能参与复制水平的调节参与复制水平的调节参与基因表达的调控参与基因表达的调控参与转位参与转位与进化有关与进化有关与个体特征有关与个体特征有关与染色体减数分裂时染色体配对有关与染色体减数分裂时染色体配对有关第二十六页,本课件共有56页基因组中重复次数基因组中重复次数101000bp1000
14、bp,如,如KpnKpn家族家族第二十八页,本课件共有56页 AluAlu家族家族是是哺哺乳乳动动物物和和人人类类基基因因组组中中含含量量最最丰丰富富的的一一种中度重复序列家族种中度重复序列家族AluAlu家家族族每每个个成成员员长长度度约约为为300bp300bp,典典型型的的特特征征是是内内部部有有一一个个限限制制性性内内切切酶酶AluAlu位位点点(AG/CTAG/CT),序序列列被被分分割割成成170bp170bp和和130bp130bp的的两两个个片片段段,因因而而称称其为其为AluAlu序列或序列或AluAlu家族。家族。具有种特异性具有种特异性第二十九页,本课件共有56页正向重复
15、序列正向重复序列170bp130bp+31bp130bp正向重复序列正向重复序列正向重复序列正向重复序列正向重复序列正向重复序列6-20 bp6-20 bp 130bp由两个约由两个约130bp130bp的正向重复构成的二聚体的正向重复构成的二聚体;第二个单体中有一个第二个单体中有一个31bp31bp的插入序列的插入序列,不同成员之,不同成员之间核苷酸顺序相似但不相同;间核苷酸顺序相似但不相同;两侧为两侧为6-20bp6-20bp的正向重复顺序的正向重复顺序,不同成员的侧翼重复,不同成员的侧翼重复顺序各不相同;顺序各不相同;人类人类AluAlu序列特征:序列特征:AluI第三十页,本课件共有5
16、6页Alu家家族族的的功功能能是是多多方方面面的的,可可能能参参与与hnRNA的的加加工工与与成成熟熟,也也与与遗遗传传重重组组及及染染色色体体不不稳稳定定性性有有关关。最最近近研研究究表表明明,Alu顺顺序序可可能能具具有有转转录录调节作用。调节作用。第三十一页,本课件共有56页典型的典型的长散在核元件长散在核元件(LINEs)是是Kpn重复序列重复序列家族,因在其序列中存在限制酶家族,因在其序列中存在限制酶Kpn的切点而得名。的切点而得名。Kpn家族的重复单位一般为家族的重复单位一般为6 6 7 kb7 kb或或更长,其两侧也各有一段正向重复序列,功更长,其两侧也各有一段正向重复序列,功能
17、上与能上与Alu家族相似。家族相似。第三十二页,本课件共有56页(三)低度重复序列(单拷贝序列)(三)低度重复序列(单拷贝序列)单单拷拷贝贝序序列列在在基基因因组组中中只只出出现现一一次次或或少少数几次,因此复性速度很慢。数几次,因此复性速度很慢。单单拷拷贝贝序序列列属属于于结结构构基基因因,它它储储存存了了巨巨大大的的遗遗传传信信息息,编编码码各各种种功功能能不不同同的的蛋蛋白质。白质。第三十三页,本课件共有56页真核生物基因组中的重复序列真核生物基因组中的重复序列第三十四页,本课件共有56页多基因家族多基因家族(multigene family)(multigene family):指由某
18、一:指由某一祖先基因经过重复和变异所产生的一组基因。祖先基因经过重复和变异所产生的一组基因。DNADNA序列具有较高的同源性(通常大于序列具有较高的同源性(通常大于50%50%),),并且其编码产物具有相同或相似生理功能并且其编码产物具有相同或相似生理功能的一组结构基因。的一组结构基因。多基因家族和假基因多基因家族和假基因第三十五页,本课件共有56页可分为可分为二类二类:一类一类是是基因簇基因簇,基因家族成员位置相对集中,基因家族成员位置相对集中,成簇地分布在成簇地分布在同一同一染色体上并同时进行转录。染色体上并同时进行转录。如组蛋白基因家族。如组蛋白基因家族。chromosome 7第三十六
19、页,本课件共有56页另一类另一类是基因家族成员分布在是基因家族成员分布在不同不同的染色体上,的染色体上,分别进行转录,且不同基因编码的蛋白质在功分别进行转录,且不同基因编码的蛋白质在功能上相关,如珠蛋白基因家族。能上相关,如珠蛋白基因家族。第三十七页,本课件共有56页假假基基因因(pseudo pseudo genegene):在在多多基基因因家家族族中中,某些并不产生有功能的基因产物的成员某些并不产生有功能的基因产物的成员假假基基因因是是由由于于在在进进化化过过程程中中,某某些些DNADNA片片段段发发生生了了缺缺失失、倒倒位位或或点点突突变变,导导致致调调控控基基因因丢丢失失;或或无无剪剪
20、接接加加工工信信号号;或或编编码码区区出出现现终终止止信号;或编码无功能或不完整的基因。信号;或编码无功能或不完整的基因。第三十八页,本课件共有56页根据假基因产生的机制分类:根据假基因产生的机制分类:复制假基因:复制后基因发生序列变化而失去功复制假基因:复制后基因发生序列变化而失去功能,这样产生的假基因带有内含子能,这样产生的假基因带有内含子加工假基因:基因转录后加工成熟的加工假基因:基因转录后加工成熟的RNARNA经逆经逆转录生成互补转录生成互补DNADNA,后者在整合到基因组中称为加,后者在整合到基因组中称为加工假基因工假基因第三十九页,本课件共有56页基因多态性基因多态性(polymo
21、rphismpolymorphism)指基因组中某个基因在同种指基因组中某个基因在同种生物的不同个体中,同时和经常生物的不同个体中,同时和经常存在的两种或两种以上的变异型存在的两种或两种以上的变异型或基因型的现象或基因型的现象第四十页,本课件共有56页基因多态性的类型:基因多态性的类型:限制性片段长度多态性限制性片段长度多态性(RFLP)(RFLP)(restuiction fragment lengh (restuiction fragment lengh polymorphism)polymorphism)单核苷酸多态性单核苷酸多态性(SNP)(SNP)(single nucleotide
22、 polymorphism)(single nucleotide polymorphism)第四十一页,本课件共有56页 RFLP RFLP指用某个限制性核酸内切酶来酶解基指用某个限制性核酸内切酶来酶解基因组的某段序列时,在同种的不同个体之间因组的某段序列时,在同种的不同个体之间该段序列可能被酶解成长短不等的几个该段序列可能被酶解成长短不等的几个DNADNA片段,这些序列在该种生物的群体中形成片段,这些序列在该种生物的群体中形成多态性。多态性。第四十二页,本课件共有56页 限制性核酸内切酶限制性核酸内切酶RERE是是一一类类能能识识别别和和切切割割双双链链DNADNA特特定定核苷酸序列的核酸水
23、解酶。核苷酸序列的核酸水解酶。GGATCCCCTAGGGCCTAGGATCC G+Bam Hrestriction endonuclease,RErestriction endonuclease,RE第四十三页,本课件共有56页第四十四页,本课件共有56页 RFLPRFLP的类型的类型1.1.点的多态性点的多态性表现为表现为DNADNA链中发生单个碱基的突变,且突变导致一链中发生单个碱基的突变,且突变导致一个原有酶切位点的丢失或形成一个新的酶切位点。个原有酶切位点的丢失或形成一个新的酶切位点。SouthernSouthern杂交即可诊断。杂交即可诊断。2.2.序列多态性序列多态性由于由于DNA
24、 DNA 顺序上发生突变如缺失、重复、插入所致。顺序上发生突变如缺失、重复、插入所致。由于高变区(由于高变区(highly variable region highly variable region)内串联重)内串联重复顺序的拷贝数不同所产生的,其突出特征是限复顺序的拷贝数不同所产生的,其突出特征是限制性内切酶识别位点本身的碱基没有发生改变,制性内切酶识别位点本身的碱基没有发生改变,改变的只是它在基因组中的相对位置。改变的只是它在基因组中的相对位置。第四十五页,本课件共有56页 SNP SNP是指单个核苷酸变异而形成的是指单个核苷酸变异而形成的DNADNA分分子多态性子多态性第四十六页,本课
25、件共有56页第四十七页,本课件共有56页 SNP SNP所表现的多态性只涉及到单个碱所表现的多态性只涉及到单个碱基的变异,基的变异,也就是通常说的基因的点突变,也就是通常说的基因的点突变,这种变异可由单个碱基的转换或颠换所这种变异可由单个碱基的转换或颠换所引起引起。转换是指同型碱基之间替换转换是指同型碱基之间替换颠换是指发生在嘌呤与嘧啶之间替换颠换是指发生在嘌呤与嘧啶之间替换第四十八页,本课件共有56页 组成组成DNADNA的碱基虽然有的碱基虽然有4 4种,种,SNPSNP理论上有四种等位理论上有四种等位形式,但实际上某一特定位点的形式,但实际上某一特定位点的SNPSNP通常只有一种变通常只有
26、一种变异形式,即异形式,即二等位多态二等位多态。三等位和四等位多态很少。三等位和四等位多态很少见。见。人类基因组人类基因组1SNP/kb1SNP/kb,共约,共约300300万万SNPSNP,是人群中个,是人群中个体差异最体差异最具代表性具代表性的的DNADNA多态性多态性第四十九页,本课件共有56页根据根据SNPSNP在基因组中的位置分为在基因组中的位置分为编码区编码区SNPSNP 非同义非同义SNPSNP(20-30%20-30%)同义同义SNPSNP(70-80%70-80%)基因周边区基因周边区SNPSNP基因间基因间SNPSNP大多数大多数SNPSNP位点十分稳定,被认为是一种位点十
27、分稳定,被认为是一种能稳定遗传的早期突变能稳定遗传的早期突变第五十页,本课件共有56页 SNP SNP的的研究意义研究意义 SNPSNP的的应应用用范范围围较较微微卫卫星星标标记记更更加加宽宽广广,经经常常被被用用于于基基因因组组作作图图、法法医医鉴鉴定定、亲亲子子鉴鉴定定、疾疾病病的的连连锁锁反反应应、群群体体遗遗传传学学及及生生物物学学进进化化的的研研究究,此此外外SNPSNP在在个个体体化化医医学及保健中有着广阔的应用前景。学及保健中有着广阔的应用前景。人人们们希希望望通通过过研研究究SNPSNP图图谱谱,更更深深刻刻地地认认识识癌癌症症、糖糖尿尿病病、血血管管性性疾疾病病和和某某些些精
28、精神神性性疾疾病病等等发发病病率率高高的多基因疾病的发生机制。的多基因疾病的发生机制。第五十一页,本课件共有56页 是是指指真真核核生生物物染染色色体体线线性性DNADNA分分子子末末端端的的结结构构部部分分,通通常常膨膨大大成成粒状粒状。端粒端粒(telomere)(telomere)第五十二页,本课件共有56页真核生物线粒体和叶绿体中携带遗传物质,真核生物线粒体和叶绿体中携带遗传物质,能自行复制和表达能自行复制和表达 (二)染色体外基因组(二)染色体外基因组线粒体线粒体线粒体线粒体DNADNA(mitochondrial DNA,mtDNAmitochondrial DNA,mtDNA)属
29、于真核细胞核外遗传物质,可独立编码存在属于真核细胞核外遗传物质,可独立编码存在于线粒体中的多肽链、于线粒体中的多肽链、rRNArRNA或或tRNAtRNA。mtDNAmtDNA为双链环状为双链环状DNADNA,其分子结构特点与原,其分子结构特点与原核生物核生物DNADNA相同。相同。第五十三页,本课件共有56页 人线粒体基因组共编码人线粒体基因组共编码3737个基因个基因2 2个个RNA-RNA-基因基因16S16S和和12S rRNA12S rRNA2222个个tRNAtRNA基因基因1313个蛋白质基因个蛋白质基因 1 1个个Cyt bCyt b基因基因 2 2个个ATPATP酶亚基的基因酶亚基的基因-ATPase6ATPase6和和ATPase8ATPase8 3 3个细胞色素氧化酶亚基基因个细胞色素氧化酶亚基基因-CO1CO1、CO2CO2、CO3CO3 7 7个呼吸链个呼吸链NADHNADH脱氢酶亚基的基因脱氢酶亚基的基因第五十四页,本课件共有56页高等动物线粒体基因组的特点高等动物线粒体基因组的特点:母系遗传。母系遗传。mtDNAmtDNA损伤后不易修复损伤后不易修复,突变率高。突变率高。遗传密码与通用密码有差别。遗传密码与通用密码有差别。半自主性复制与协同作用半自主性复制与协同作用第五十五页,本课件共有56页感感谢谢大大家家观观看看第五十六页,本课件共有56页
限制150内