《基因与基因组结构 (2)讲稿.ppt》由会员分享,可在线阅读,更多相关《基因与基因组结构 (2)讲稿.ppt(60页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于基因与基因组结构(2)第一页,讲稿共六十页哦内容第一节基因和基因组第二节病毒和原核生物的基因特点第三节真核基因特点和基因组结构第四节细胞器基因组第五节癌基因和药物基因组第二页,讲稿共六十页哦第一节基因和基因组一、基因1、基因的概念2、基因定义的演变3、基因的编码链4、基因的阅读框架5、基因的其他重要发现二、基因组第三页,讲稿共六十页哦一、基因1、基因的概念是DNA分子上具有特定遗传效应的一段的核苷酸序列。1)遗传效应:a 可以产生蛋白质产物或RNA产物(包括rRNA和tRNA)形成生理功能;b 或对其它基因及其形成的生理功能起调节效应。2)核苷酸序列:主要指DNA,对于RNA病毒来说则指染
2、色体RNA。朊病毒?第四页,讲稿共六十页哦2、基因定义的演变(1)第一步:一个基因控制一个性状:1909年,约翰逊首次提出了基因(gene)的名词,用来表示孟德尔在豌豆杂交试验中所证实的遗传因子遗传因子(控制生物性状(控制生物性状)。1910年,美国遗传学家摩尔根通过果蝇杂文实验证明基因在染色体上呈线性排列,“基因是染色体上的基因是染色体上的遗传遗传功能功能单单位位”。第五页,讲稿共六十页哦基因定义的演变(2)第二步:“一个基因一种酶一个基因一种酶”1902,尿黑酸症(alkaptonuria):酪氨酸苯环断裂。1941,比德尔(Beadle)和塔图姆链孢霉(Neurospora):营养缺陷型
3、菌株。单倍体,药用菌(洛氏等基金资金支持)比德尔(Beadle)第六页,讲稿共六十页哦基因定义的演变(3)第三步:“一个顺反子一条多肽链一个顺反子一条多肽链”到1957年,本泽尔(Bnezer)进一步提出的论断。这比“一个基因一种酶”的假说更为准确。1、多亚基蛋白(编码基因不连续或不在同一条链上;一个基因编码多个肽链)。2、基因可以再分(重组子,突变子)第七页,讲稿共六十页哦P P 杏红眼杏红眼X X 白眼白眼 W Wa a+W+W W Wa a+Y+Y F F1 1 杏红杏红 X X 杏红眼杏红眼 W Wa a +W Wa a +Y +W Y +W F F2 2 杏红眼杏红眼 杏红杏红 杏红
4、杏红 白眼白眼 红眼红眼 W Wa a+W Wa a+W Wa a +W W +W Wa a+W Y Y+W Y Y 基因内重组基因内重组 +W Wa a W W 配子(突变的机率大)配子(突变的机率大)+W Wa a W W W Wa a W W W Wa a+或或 Y Y 或或 W Wa a+Y Y比较:比较:F F1 1 杏红杏红 基因型基因型 红眼红眼 基因型基因型 W Wa a +反式反式 W Wa a W W 顺式顺式 +W +W +第八页,讲稿共六十页哦第九页,讲稿共六十页哦2、基因定义的演变(4)第四步:确定核酸是基因的物质基础肺炎链球菌1967年发表了全套的遗传密码表,确定,
5、确定生物的生物的遗传信息以核苷酸碱基(遗传信息以核苷酸碱基(A A,T T,G G,C C)的不同排的不同排列贮存干列贮存干DNADNA分子中分子中形成基因。形成基因。遗传信息的以遗传信息的以“DNARNADNARNA蛋白质蛋白质”这种中心法则的方式表达。这种中心法则的方式表达。第五步:第五步:朊病毒?第十页,讲稿共六十页哦3、基因的编码链一个基因的DNA双链中,只有一条链可以用做转录的模板。关于这两条链的称呼有点混乱。以以前前的的文文献献称称模模板板链链为为编编码码或或有有意意义义链链。非非模模板板链链为无意义链,为无意义链,近近年年来来则则反反过过来来称称模模板板链链为为反反意意义义链链(
6、因因其其碱碱基基序序列列与与mRNAmRNA互互补补)而而非非模模板板链链为为有有意意义义链链(因因其其碱碱基基序序列列与与mRNAmRNA相相同同,遗遗传传基基因因密密码码和和密密码码子子一一般般是是指指mRNAmRNA中中的的碱碱基基序序列列,有时也指DNA中编码链的碱基序列)。第十一页,讲稿共六十页哦4、基因的阅读框架DNA蛋白质(翻译过程的需要读码)阅读mRNA是以密码子为单位,连续阅读。即每个核苷酸三联体密码子之间没有空格。这样任何核苷酸序列都可能以三种方式分成不同的密码子,也就是说有三种读框。对于DNA两条链是六种。第十二页,讲稿共六十页哦开放阅读框一个基因组由两部分组成的:1、实
7、验证明确有蛋白质产物的真实基因2、根据起始密码和终止密码序列所确定的潜在基因。生物学家们把这两类基因都称为“开放阅读框”(openreadingframe,ORF)读通的基因组。第十三页,讲稿共六十页哦ORFORF识别识别类似于波谱解析。ORFORF识别识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的DNA序列而其内部不包含启动子或密码子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF的识别是证明一个新的DNA序列为特定的蛋白质编码基因的部分或全部的先决条件。第十四页,讲稿共六十页哦5、基因的其他重要发现1重叠基因2断裂基因3移动基因4多个基因编码一条多肽链5隐
8、蔽基因6不编码蛋白质的基因第十五页,讲稿共六十页哦1重叠基因重叠基因就是同一段DNA序列可以编码两个以上的蛋白序列。X174是一种单链DNA病毒,宿主为大肠杆菌,是噬菌体。重叠基因有以下几种情况:(1)一个基因完全在另一个基因里。如:和,和。(2)部分重叠。和及。(3)两个基因只有一个碱基重叠。的最后一个碱基是的第一个碱基。第十六页,讲稿共六十页哦2断裂基因第十七页,讲稿共六十页哦3移动基因玉米的染色体中发现玉米的染色体中发现了可以改变自身位置的基因,称之为“解离因子”。当它当它移动到新的位置以后,可以引起染色体移动到新的位置以后,可以引起染色体断裂,使玉米籽粒出现色斑断裂,使玉米籽粒出现色斑
9、。细菌转座子细菌转座子。转座子除了含有与改变自身位置有关的基因以外,还携带与插入功能无关的基因,如耐药基因、毒素基因和代谢基因等。第十八页,讲稿共六十页哦转座子转座子第十九页,讲稿共六十页哦4多个基因编码一条多肽链有些病毒可以由一段DNA序列转录出一一条条mRNA分子分子,然后翻译出一条多肽链然后翻译出一条多肽链,最后这条多肽链被切割成多个有生物功最后这条多肽链被切割成多个有生物功能的肽链能的肽链。这种多个基因编码一条多肽链的现象,不符合“一个基因决定一条多肽链”的普遍原则,使基因的定义更加复杂化。第二十页,讲稿共六十页哦5不编码蛋白质的基因一类是核糖体一类是核糖体RNARNA简称简称rRNA
10、rRNA,它是核糖体它是核糖体的组成部分。的组成部分。另一类是转运另一类是转运RNARNA简称简称tRNAtRNA其功能是把氨其功能是把氨基酸搬运到核糖体会成多肽链的位点上。基酸搬运到核糖体会成多肽链的位点上。第二十一页,讲稿共六十页哦二、基因组二、基因组:生物体中,一套完整的遗传物质的总和称为基因组(genome)。比如人类基因组包含22条常染色体和X、Y两条性染色体上的全部遗传物质以及胞浆线粒体上的遗传物质。第二十二页,讲稿共六十页哦几种生物基因组的比较 第二十三页,讲稿共六十页哦第二节第二节 病毒、原核生物病毒、原核生物基因组的结构特点基因组的结构特点一、病毒基因组的结构特点一、病毒基因
11、组的结构特点二、原核生物:细菌染色体基因组结构二、原核生物:细菌染色体基因组结构的特点的特点 第二十四页,讲稿共六十页哦一、病毒基因组的结构特点(一、病毒基因组的结构特点(1 1)1.病毒的基因组很小。2.可以由DNA组成,也可以由RNA组成。3.多数RNA病毒的基因组是由连续的核糖核酸链组成,但也有些病毒的基因组RNA由几条核酸链组成。4.噬菌体(细菌病毒)的基因是连续的;而真核细胞病毒的基因是不连续的,具有内含子。第二十五页,讲稿共六十页哦一、病毒基因组的结构特点(一、病毒基因组的结构特点(2 2)5.病毒基因组的大部分是用来编码蛋白质的,只有非常小的一份不被翻译(高效率)。6.功能上相关
12、的蛋白质的基因或rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。7.除了反转录病毒以外,一切病毒基因组都是单倍体。8.基因重叠第二十六页,讲稿共六十页哦SARS-CoV单链()RNA全长29,736bp第二十七页,讲稿共六十页哦SARS-CoV基因组结构有11个编码序列(cds,codingsequence),而其中的一个cds(putativeorf1abpolyprotein)与鼠类的肝炎病毒(murinehepatitisvirus)结构类似。第二十八页,讲稿共六十页哦二、原核生物:细菌染色体基二、原核生物:细菌染色体基因组结构的一般特点因组结构的一般特
13、点(1)1.细菌的染色体基因组通常仅由一条环状双链DNA分子组成细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核称为类核(nucleoid)。2.具有操纵子结构。3.单拷贝。4.和病毒的基因组相似,不编码的DNA部份所占比例比真核细胞基因组少得多(高效)。第二十九页,讲稿共六十页哦二、原核生物:细菌染色体基二、原核生物:细菌染色体基因组结构的一般特点因组结构的一般特点(2)5.具有编码同工酶的同基因(isogene)。6.不会出现基因重叠现象。7.在DNA分子中具有各种功能的识别区域如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。这些区域往往具有特殊的顺序,并且含有
14、反向重复顺序。第三十页,讲稿共六十页哦第三节第三节 真核生物基因特点和基因组结构真核生物基因特点和基因组结构人类基因组特点人类基因组结构第三十一页,讲稿共六十页哦真核生物基因组特点真核生物基因组特点1.基因组是双拷贝。2.真核细胞基因转录产物为单顺反子。一个结构基因生成一个mRNA分子和一条多肽链。3.含有内含子,基因是不连续的,基因组中不编码的区域多于编码区域(低效)。4.存在重复序列,重复次数可达百万次以上。5.基因组远远大于原核生物的基因组。第三十二页,讲稿共六十页哦基因组分类的依据:基因组分类的依据:DNADNA退火实验退火实验 把一种有机体的DNA打断成平均长度约1000bp的片断,
15、并变性成单股DNA,再在适当温度和离子浓度条件下使单股DNA退火形成双股DNA。单股DNA退火合成双股的速度却相差很大。影响单股DNA退火程度的参数是它的初始浓度以及反应时间。DNA的初始摩尔浓度(Co)与以秒计算的反应时间(t)的乘积称为Cot值。DNA组份复性一半时的Cot称为Cot1/2。Cot1/2越低,说明其退火速度越高。第三十三页,讲稿共六十页哦基因组的分类基因组的分类1、高度重复序列的DNA:在哺乳动物基因组中,约10%-15%的DNA的Cot1/2小于等于0.01,短的寡聚核苷酸串联重复而成的。2、中度重复序列的DNA:25-40%DNA以中等速率退火,Cot1/2在0.011
16、0范围。3、称为单拷贝DNA(低度重复顺序):5060%DNA在Cot1/210010000范围,。绝大多数编码mRNA的基因包含于此。第三十四页,讲稿共六十页哦人体基因组结构人体基因组结构高度重复序列:反向重复序列,卫星DNA,较复杂的重复单位组成的重复顺序,高度重复序列的功能。中度重复顺序:Alu家族,Kpn家族,Hinf家族,rRNA基因,多聚dd家族,组蛋白基因。单拷贝顺序(低度重复顺序):多基因家族与假基因,自私DNA(selfishDNA)。第三十五页,讲稿共六十页哦一、高度重复序列(简单重复序列)一、高度重复序列(简单重复序列)(1)反向(倒位)重复序列ATATATATCGCGC
17、GBBBBCGCGCGATATATATATATATCGCGCGBBTATATATAGCGCGCBB第三十六页,讲稿共六十页哦高度重复序列(高度重复序列(2 2)(2)卫星DNA 卫星DNA(satelliteDNA)是另一类高度重复序列,这类重复顺序的重复单位一般由2-10碱基组成,成串排列。由于这类序列的碱基组成不同于其他部份,可用等密度梯度离心法将其与主体DNA分开,因而称为卫星DNA或随体DNA。(3)较复杂的重复单位组成的重复顺序。第三十七页,讲稿共六十页哦MouseDNAisseparatedintoamainbandandasatellitebycentrifugationthro
18、ughadensitygradientofCsCl.Satellite DNAs often lie in heterochromatin第三十八页,讲稿共六十页哦CytologicalhybridizationshowsthatmousesatelliteDNAislocatedatthecentromeres.第三十九页,讲稿共六十页哦高度重复顺序的功能(高度重复顺序的功能(1 1)a.参与复制水平的调节反向序列常存在于DNA复制起点区的附近。是一些蛋白质(包括酶)和DNA的结合位点。b.可以转录到核内不均一RNA分子中,而有些反向重复顺序可以形成发夹结构,这对稳定RNA分子,免遭分解有重
19、要作用。c.参与转位作用几乎所有转座子的末端都包括反向重复顺序。由于这种顺序可以形成回文结构,因此在转位作用中即能连接非同源的基因,又可以被参与转位的特异酶所识别。第四十页,讲稿共六十页哦高度重复顺序的功能(高度重复顺序的功能(2 2)d.不同种属的高度重复顺序的核苷酸序列不同,具有种属特异性,但相近种属又有相似性(用于物种鉴别)。e.同一种属中不同个体的高度重复顺序的重复次数不一样,这可以作为每一个体的特征,即DNA指纹(分子标记)。f.可能与染色体减数分裂时染色体配对有关,即同源染色体之间的联会可能依赖于具有染色体专一性的特定卫星DNA顺序。第四十一页,讲稿共六十页哦二、中度重复顺序二、中
20、度重复顺序中度重复序列大致指在真核基因组中重复数十至数万(105)次的重复顺序。其复性速度快于单拷贝顺序,但慢于高度重复顺序。少数在基因组中成串排列在一个区域,大多数与单拷贝基因间隔排列。第四十二页,讲稿共六十页哦两种类型中度重复顺序依据重复顺序的长度,可分为两种类型:(1)短分散片段(short interspersed repeated segments,SINES):平均长度约为300bp(500bp),它们平均长度约为1000bp的单拷贝顺序间隔排列。(2)长分散片段(Long interspersed repeated segments,LINES):平均长度为3500-5000bp
21、,它们与平均长度为13000bp(个别长几万bp)的单拷贝顺序间隔排列。第四十三页,讲稿共六十页哦Alu家族 Alu家族每个成员的长度约300bp,由于由于每个单位长度中有一个限制性内切酶每个单位长度中有一个限制性内切酶Alu的切点(的切点(AGCT)从而将其切成长从而将其切成长130和和170bp的两段,因而定名为的两段,因而定名为Alu序列序列(或(或Alu家族)。家族)。Alu顺序具有种的特异性,人的顺序具有种的特异性,人的Alu顺序顺序制备的探针只能用于检测人的基因组中制备的探针只能用于检测人的基因组中的的Alu序列。序列。第四十四页,讲稿共六十页哦Kpn家族:Hinf家族:多聚dd家
22、族:第四十五页,讲稿共六十页哦rRNA基因rRNA基因通常集中成簇存在,而不是分散于基因组中,这样的区域称为rDNA,如染色体的核仁组织区即为rDNA区。第四十六页,讲稿共六十页哦 第四十七页,讲稿共六十页哦三、低度重复顺序(单拷贝顺序单拷贝顺序)单拷贝顺序在单倍体基因组中只出现一次或数次,因而复性速度很慢。单拷贝单拷贝顺序在基因组中占顺序在基因组中占50-80,如人基因组,如人基因组中,大约有中,大约有60-65的顺序属于这一类。的顺序属于这一类。第四十八页,讲稿共六十页哦多基因家族与假基因多基因家族与假基因多基因家族是指由某一祖先基因经过重复和变异所产多基因家族是指由某一祖先基因经过重复和
23、变异所产生的一组基因。生的一组基因。两类:一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。在多基因家族中,某些成员并不产生有功能的基在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(因产物,这些基因称为假基因(pseudo gene)或或歧化基因。歧化基因。第四十九页,讲稿共六十页哦Eachofthea-likeandb-likeglobingenefamiliesisorganizedintoasingleclusterthat
24、includesfunctionalgenesandpseudogenes.第五十页,讲稿共六十页哦自私DNA(selfish DNA)在哺乳动物包括人体基因组中,存在着大量的非编码顺序,这些顺序中,只有很小一部份具有重要的调节功能,绝大部部分都没有什么特殊功用,对生物并没有什么影响,它们的功能似乎只是自身复制,所以人们称这类DNA为自私DNA或寄生DNA(parasiteDNA)。自私DNA也许有重要的功能,但目前我们还不了解。第五十一页,讲稿共六十页哦四、人类基因组人类基因组结构庞大、复杂:基因组DNA总长度为3109bp,3-4万个基因分布在24条染色体上,非编码区远远多于编码区,占90
25、%以上,结构基因占3%,以单拷贝形式存在。第五十二页,讲稿共六十页哦人类基因组作图2000/6/27全世界各个国家同时宣布,人类基因组草图已经完成。意义:许多问题需要我们从整个基因组来做全面的剖析和定位探讨;还可以去发现新的基因或某种基因的新功能;对确定各种遗传疾病致病基因和定位分析是卓有成效的,对于遗传疾病的诊断和基因治疗是必不可少的依据。第五十三页,讲稿共六十页哦基因组图谱(1)种类:根据不同层次分:基因图、细胞遗传图、染色体图等;根据不同测量绘制技术分:连锁图、缺失图、限制酶图、STS(卫星)图等。第五十四页,讲稿共六十页哦(2)遗传图(genetic map)或称为遗传连锁图:是根据基
26、因或者遗传标记之间的交换(重组)值来确定基因在染色体上的相对距离、位置的图谱。其距离单位是厘摩(centimorgan,cM),以此纪念现代遗传学奠基人摩尔根,1 cM相当于1%的交换值,大约相当于1000kb。(3)物理图物理图(physicalmap):是应用物理或化学技术直接确定基因或遗传标记在染色体上或DNA上的具体位置。其距离是以具体的物理长度为单位的(核苷酸对的数目、染色体显带的标号)。第五十五页,讲稿共六十页哦第四节线粒体第四节线粒体DNADNA的结构和功的结构和功能能tRNA基因。细胞色素氧化酶基因。ATP酶基因。细胞色素还原酶(b,c复制物)基因。另外,还有一些抗药性基因也在
27、mtDNA上。第五十六页,讲稿共六十页哦线粒体的密码系统线粒体的密码系统 mtDNA的遗传密码与通用密码有以下区别:1.UGA不是终止信号,而是色氨酸的密码。因此,线粒体tRNAtrp可以识别UGG和UGA两个密码子。2.多肽内部的甲硫氨酸由AUG和AUA两个密码子编码;而起始甲硫氨酸由AUG,AUA,AUU和AUC四个密码子编码。3.AGA,AGG不是精氨酸的密码子,而是终止密码子,因而,在线粒体密码系统中的4个终止密码子(UAA,UAG,AGA,AGG)。第五十七页,讲稿共六十页哦线粒体DNA的双重遗传控制 线粒体除具有DNA外,还有自己的蛋白质合成系统,如tRNA,tRNA,核糖体等。复制和转录都是自己的聚合酶来完成的。蛋白质合成时,线粒体核糖体上的蛋白质合成也受细菌蛋白质合成抑制剂如氯氯霉素,链霉素霉素,链霉素的抑制。在许多方面与原核生物的相似。第五十八页,讲稿共六十页哦线粒体DNA缺陷导致的综合症线粒体DNA损伤常导致某些与神经系统相关的综合症。主要是线粒体脑肌病。以类似一存在不规则的红纤维为形态特征的线粒体脑肌病。第二类为无显著形态学特征的脑肌病。第五十九页,讲稿共六十页哦感感谢谢大大家家观观看看第六十页,讲稿共六十页哦
限制150内