1基因与基因组学.ppt





《1基因与基因组学.ppt》由会员分享,可在线阅读,更多相关《1基因与基因组学.ppt(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 第二讲第二讲基因与基因组学基因与基因组学Gene and Genome 主讲人:主讲人:白云飞白云飞 东南大学生物科学与医学工程学院东南大学生物科学与医学工程学院2第一节第一节 基因的概念与结构基因的概念与结构一、一、基因的概念基因的概念 (一)基因概念的发展(一)基因概念的发展随着遗传学的发展,人类对于基因的认识逐步深入,基因概念也随之发展。基因概念发展经过几个时期。(1)遗传“因子”基因的最初概念是来自孟德尔的遗传“因子”,认为生物性状的遗传是由遗传因子所控制的,性状本身是不能遗传的,控制性状的遗传因子才是遗传的。1909年,丹麦学者WLJohannsen提出了“基因”(gene)一词
2、,代替了孟德尔的遗传因子,并由此形成了“颗粒遗传”学说,认为在杂种中等位基因不融合,各自保持其独立性,这也是孟德尔遗传规律的核心。3(2)染色体是基因的载体1910年摩尔根等通过果蝇杂交实验表明,染色体在细胞分裂时的行为与基因行为一致,从而证明基因位于染色体上,并呈直线排列,提出了遗传学的连锁交换规律,证明了性别决定是受染色体支配的。基因的连锁和交换定律的实质是:在进行减数分裂形成配子时,位于同一条染色体上的不同基因,常常连在一起进入配子;在减数分裂形成四分体时,位于同源染色体上的等位基因有时会随着非姐妹染色单体的交换而发生交换,因而产生了基因的重组。4 4(3)DNA是遗传物质1944年Av
3、ery等人不仅在体外成功地重复了上述实验,而且用生物化学方法证明了转化因子(trans-formingfactor)是DNA,而不是多糖荚膜、蛋白质和RNA,而且转化频率随着DNA纯度的提高而增加。证明了DNA就是遗传物质。5(4)基因是有功能的DNA片段20世纪40年代G WBeadle和ELTatum通过对粗糙脉孢菌营养缺陷型的研究,提出了一个基因一个酶的假说。1953年Watson和Crick提出了DNA双螺旋结构模型,明确了DNA在活体内的复制方式。1957年由Crick最早提出遗传信息在细胞内的生物大分子间转移的基本法则,即中心法则,接着在1961年又提出了三联遗传密码,这样将DNA
4、分子的结构与生物学功能有机地统一起来,也为揭示基因的本质奠定了分子基础。1957年S.Benzer用大肠杆菌T4噬菌体作为材料,在DNA分子结构的水平上,分析了基因内部的精细结构,提出了顺反子(cistor)概念,证明基因是DNA分子上的一个特定的区段。6(5)操纵子模型1961法国分子生物学家F.Jacob和J.Monod通过不同的大肠杆菌乳糖代谢突变体来研究基因的作用,提出了操纵子模型学说(operontheory)。这一学说阐明了基因调控在乳糖利用中所起的作用。表明人们已认识到基因的功能并不是固定不变的,而是可以根据环境的变化进行调节。随之人们发现无论是真核还是原核生物转录调节都是涉及到
5、编码蛋白的基因和DNA上的元件。这一发现获得了1965年诺贝尔奖。7乳糖操纵子87)“跳跃基因”和“断裂基因”的发现 50年代初,美国遗传学家BMcClintock在玉米的控制因子的研究中已经指出某些遗传因子是可以转移位置的。后来的研究发现,在原核生物和真核生物中均发现有基因转移的现象,并将这些可转移位置的成分称为跳跃基因(jumping gene),亦称转座因子(transposon element)。此外,传统的观点认为,一个结构基因是一段连续的DNA序列,70年代后期发现绝大多数真核生物基因都是不连续的,其中被一些不编码序列所隔开,故称为断裂基因。1978年,在噬菌体中还发现了重叠基因,
6、一个基因序列可被包含在另一个基因中,两个基因序列可能部分重叠。9断裂基因的意义断裂基因的意义 (1 1)有利于储存较多的遗传信息量;)有利于储存较多的遗传信息量;(2 2)有利于变异与进化;)有利于变异与进化;(3 3)增加重组机率;)增加重组机率;(4 4)内含子可能是调控装置。)内含子可能是调控装置。10(二)基因的概念(二)基因的概念在初中生物学课本中,把基因定义为“染色体遗传物质中决定生物性状的小单位”。高中生物学课本则把基因定义为“有遗传效应的DNA片段”。在最具权威的2000年版中国大百科全书中,基因的定义是“含特定遗传信息的核苷酸序列,是遗传信息的最小功能单位”。在最近几年出版的
7、外文版和部分中文版的分子生物学和分子遗传学书籍中又给出了新的答案。从上述基因研究的最新进展可以看出,基因不仅在功能上多种多样,在结构上也是五花八门,因此,给它下一个非常准确和永远适用的定义是相当困难的。基因的概念随着遗传学、分子生物学、生物化学等领域的发展而不断完善。从遗传学的角度看,基因是生物的遗传物质,是遗传的基本单位突变单位、重组单位和功能单位;从分子生物学的角度看,基因是负载特定遗传信息的核酸序列核酸序列,在一定条件下能够表达某种遗传信息(其产物为有功能的多肽链或功能RNA分子分子),变成特定的生理功能。“核酸序列核酸序列”主要指DNA,对于RNA病毒来说则指染色体RNA。“RNA分子
8、分子”主要主要包括tRNA和rRNA。这个定义较确切地表述了基因的本质和功能,已经被绝大多数学者所接受。11(三)基因的分类(三)基因的分类根据基因的功能和性质,可将其分为以下几类:(一)结构基因这类基因不仅可转录(tran-scription)成mRNA,而且可翻译(translation)成多肽链,从而构成各种结构蛋白和催化各种生化反应的酶。(二)rDNA和 tDNA基因这类基因只转录产生相应的RNA,而不翻译成多肽链。12(三)启动子(promotor)与操纵基因(operator)前者是转录时RNA多聚酶起始与DNA结合的部位;后者是调节基因的产物阻遏蛋白质或激活蛋白质与DNA结合的部
9、位,它们都是不转录的DNA区段,确切说,它们不能称为基因。但关系到结构基因的活化或钝化。13以上各类基因以上各类基因(或或DNADNA区段区段)之间的相互关系如下图。通过这些基因的相之间的相互关系如下图。通过这些基因的相互作用、密切协作,调控基因有序地表达,从而使各种生命活动表现互作用、密切协作,调控基因有序地表达,从而使各种生命活动表现出规律性、和谐性。出规律性、和谐性。14151.原核生物的结构基因是连续的原核生物的结构基因是连续的(一)(一)结构基因结构基因 基因中编码基因中编码RNARNA或蛋白质的或蛋白质的核酸核酸序列序列。二、二、基因的结构基因的结构tayz opstructura
10、l genepromoteroperatorterminator162.2.真核生物结构基因真核生物结构基因DNAmRNA前体前体编码序列不连续编码序列不连续,称为断裂基因称为断裂基因(interrupted gene)RNA剪接剪接 由外显子(编码序列由外显子(编码序列)和内含和内含子(非编码序列子(非编码序列)两部分组成,两部分组成,intron exon 成熟成熟mRNA17 5 5 33exon3exon1exon2GT AG GT AG真核基因中真核基因中RNA剪接的识别信号剪接的识别信号内含子的内含子的 5端以端以GTGT开始,开始,3端以端以AGAG结束。结束。3.GT-AG3.
11、GT-AG法则法则intron2intron118 5 3exon3exon2exon1 intron1intron2(二二)转录调控序列转录调控序列 前导序列前导序列尾部序列尾部序列编码区编码区侧翼序列侧翼序列侧翼序列侧翼序列 结构基因编码区两侧的一段不被翻译结构基因编码区两侧的一段不被翻译的的DNADNA片段片段(侧翼序列侧翼序列),参与转录调控。参与转录调控。19tayz opstructural gene1.1.原核生物基因的调控序列原核生物基因的调控序列promoter启动子启动子 promoterterminator终止子终止子 terminatoroperator操纵元件操纵元件
12、 operator202.2.真核生物基因的调控序列真核生物基因的调控序列反式作用因子反式作用因子trans-acting factor能识别和结合特定的顺能识别和结合特定的顺式作用元件式作用元件,并影响基因并影响基因转录的一类转录的一类蛋白质蛋白质或或RNARNA顺式作用元件顺式作用元件cis-acting element能能影响基因表达,影响基因表达,但不编码但不编码RNARNA和蛋和蛋白质的白质的DNADNA序列序列TATAAAATATTT 533 5 顺式作用元件顺式作用元件21 TATA盒盒(TATA Box):位于位于-25-25-30-30bpbp,TATAAAA/TATATAT
13、 与与TFII(RNA聚合酶复合物)聚合酶复合物)结合,启动结合,启动基因转录。基因转录。(1)(1)启动子和上游启动子元件启动子和上游启动子元件-25-25+1+1-30-30(II类类)22-30-30-25-25+1+1-80-80-70-70 CAAT盒(盒(CAAT BoxCAAT Box)位于位于-70-80bp,GG C/T CAATCT,与与CTF结合,决定启动子转录效率。结合,决定启动子转录效率。23 GC GC盒(盒(GC BoxGC Box)位于位于-35bp,GGCGG,与转录因,与转录因子子SP1SP1结合,促进转录的过程。结合,促进转录的过程。24(2).(2).增
14、强子(增强子(enhancerenhancer)与转录因子特异性结合,增强与转录因子特异性结合,增强转录活性,在基因任意位置都有效、转录活性,在基因任意位置都有效、无方向性。无方向性。3255-AATAAA-GT-3 DNA mRNA 前体前体5-AAUAAA-GU-35-AAUAAA-AAAAAAAA 3多聚腺苷酸化多聚腺苷酸化mRNA(3).Poly(A)加尾信号加尾信号Poly(A)聚合酶聚合酶5-AAUAAA-GU-3特异因子特异因子 含有含有IIII类启动子的基因,基因末端保类启动子的基因,基因末端保守的守的AATAAA顺序及下游顺序及下游GT或或T富含区富含区,被多聚腺苷酸化特异因
15、子识别,在被多聚腺苷酸化特异因子识别,在mRNA 3端加约端加约200200个个A。26CAAT boxTATA box Enhancer promoter 调控序列调控序列调控序列调控序列真核生物基因的结构真核生物基因的结构exonexon非翻译区非翻译区:untranslated regions,UTR UTRUTRPoly(A)加尾信号加尾信号5 +1Stop 3 结构基因结构基因intronintronexonTGA ATG开放阅读框开放阅读框:open reading frame,ORFresponse element27三、中心法则三、中心法则 central dogmaRepli
16、cationReplicationReverseTranscriptionTranscriptionTranslationDNARNAProtein28(一一)原核生物的原核生物的mRNAmRNA是多顺反子是多顺反子mRNAmRNAPromoterGene 1Gene 2Gene 3TerminatorDNATranscriptionmRNA31235TranslationProteins123 多顺反子多顺反子mRNA mRNA(polycistronic mRNA):):原核生物的一个原核生物的一个mRNAmRNA分子带有几个分子带有几个 结构基因的遗传信息,利用共同的启动结构基因的遗传信
17、息,利用共同的启动 子及终止信号,组成操纵子的基因表达子及终止信号,组成操纵子的基因表达 调控单元。调控单元。29TranslationTranscriptionmRNADNAProteinPromoterGene35(二二)单顺反子单顺反子mRNAmRNA(monocistronic mRNA):):真核生物的一个编码基因转录真核生物的一个编码基因转录生成一个生成一个mRNAmRNA。30基因组基因组:一个细胞或病毒的全部:一个细胞或病毒的全部 遗传信息;遗传信息;第二节第二节 基因组基因组 一套完整的单倍体的遗传一套完整的单倍体的遗传物质的总合;物质的总合;含有一种生物的一整套遗含有一种生
18、物的一整套遗 传信息的遗传物质;传信息的遗传物质;31C值(值(C-value):):单倍体基因组中的全部单倍体基因组中的全部DNADNA量量(bpbp)32 10 106 6 10107 7 10108 8 10109 9 101010 10 10101111显花植物骨鱼类哺乳类甲壳类爬行类鸟类藻类真菌革兰氏阳性菌革兰氏阴性菌枝原体霉菌蠕虫类软体动物棘皮类昆虫类软骨鱼类两栖类C值C值悖理值悖理-C值值生物体的单倍体基因组所含DNA总量称为C值。每种生物各有其特定的C值,不同物种的c值之间有很大差别。能营独立生活的最小的生物支原体(Mycoplasma)的C值不106bp,一些植物和两栖类动物
19、的C值则可多达1011Mbp,相差10万倍。在一些低等生物中,当进化增加了生物体的复杂性时,基因组也相应地增大。如蠕虫的C值大于霉菌、藻类、真菌、细菌和支原体。可是,在其他生物中则看不到这种规律。显花植物和两栖类动物的基因组最大,软骨鱼、硬骨鱼甚至昆虫和软体动物的基因组都大于包括人类在内的哺乳动物的基因组。爬行类和棘皮动物的基因组大小同哺乳动物几乎相等。因此,从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关,这种现象称为C值悖理(CValueparadox)。C值悖理值悖理-举例说明举例说明在同一类生物中,不同种的基因组大小也有很大差别。比如,两栖类生物中最小的基因组不足109Mb
20、p,最大的则达1011Mbp,又如昆虫中的家蝇基因组比果蝇基因组大6倍左右。把每一类生物中的最小基因组作比较,可以看出,每类生物的最小基因组的大小基本上对应于生物在进化上所处地位的高低;进化地位高、形态结构复杂程度高的一类生物,其最小的基因组也较大。3334一、病毒基因组一、病毒基因组 DNA病毒病毒 RNA病毒病毒 (一)基本结构(一)基本结构多数为双链多数为双链(ds)、环状或线性环状或线性多数为单链多数为单链(ss)、线性线性35(二)(二)RNARNA病毒基因组病毒基因组 类型类型 特点特点 代表种类代表种类361.1.单股正链单股正链RNARNA病毒病毒SARSSARS冠状病毒冠状病
21、毒 SARS SARS coronaviruscoronavirus 包膜蛋白包膜蛋白膜蛋白膜蛋白核衣壳核衣壳蛋白蛋白刺突刺突蛋白蛋白 病毒病毒RNARNA聚合酶聚合酶37 单股正链单股正链RNARNA、不分节段,不分节段,5 5端有甲基化帽,端有甲基化帽,3 3端有端有poly(Apoly(A)结构。结构。脊髓灰质炎病毒、鼻病毒、脊髓灰质炎病毒、鼻病毒、多数多数RNARNA噬菌体、噬菌体、冠状病毒冠状病毒 38.禽流感病毒禽流感病毒(H5N1)avian influenza A virus2.2.单股负链单股负链RNARNA病毒病毒8 8节段节段-ssRNAssRNA血凝素(血凝素(HAHA
22、)神经氨酸酶(神经氨酸酶(N)N)39 单股负链单股负链RNARNA、8 8节段,均编码蛋白质,节段,均编码蛋白质,5 5端由相同的端由相同的1313个核苷酸组成,个核苷酸组成,3 3端有端有1212个保守的核苷酸序列。个保守的核苷酸序列。流感病毒流感病毒、滤泡性口腔炎病毒、滤泡性口腔炎病毒、狂犬病毒狂犬病毒40呼肠孤病毒呼肠孤病毒 reovirusreovirus3.3.双链双链RNARNA病毒病毒1111节段节段dsRNAdsRNA内衣内衣壳蛋壳蛋白白外衣壳外衣壳蛋白蛋白41 正负双链正负双链RNARNA,10101212节段、节段、每段编码一个蛋白质每段编码一个蛋白质 呼肠孤病毒、轮状病
23、毒、呼肠孤病毒、轮状病毒、噬菌体噬菌体6 6424.4.逆转录病毒逆转录病毒(retrovirusretrovirus)核心蛋白核心蛋白 逆转录酶逆转录酶 膜蛋白膜蛋白poly(Apoly(A)CapCap人类免疫缺陷病毒(人类免疫缺陷病毒(HIVHIV)43 单股正链单股正链RNARNA,有三个基本的结构有三个基本的结构 基因:基因:gaggag、polpol(逆转录酶逆转录酶)、)、envenv,白血病病毒、肉瘤病毒、白血病病毒、肉瘤病毒、人类免疫缺陷病毒人类免疫缺陷病毒 5 5端有甲基化帽,端有甲基化帽,33端有端有poly(Apoly(A),另有多个基因表达调控位点。另有多个基因表达调
24、控位点。44(三)(三)DNADNA病毒基因组病毒基因组 类型类型 特点特点 代表种类代表种类451.1.线性双链线性双链DNADNA病毒病毒 早期蛋白(早期蛋白(E E)晚期蛋白(晚期蛋白(L L)腺病毒腺病毒 adenovirusadenovirusE1A E1BE3E4E2BE2A0 10 20 30 40 50 60 70 80 90 100%L2L3L4L5L1ITRITRITRITR ITR:ITR:反向末端重复序列反向末端重复序列46 反向末端重复序列反向末端重复序列 (inverted terminal inverted terminal repeatrepeat,ITRITR
25、)ATAT丰富区保守序列:丰富区保守序列:ATAATATACCATAATATACCGCGC丰富区保守序列:丰富区保守序列:GGGCGG,TGACGTGGGCGG,TGACGT在病毒复制过程有重要作用在病毒复制过程有重要作用 基因组:线性双链基因组:线性双链DNADNA,编码两大类编码两大类蛋白蛋白 早期蛋白(早期蛋白(E E)、)、晚期蛋白(晚期蛋白(L L)47乳头瘤病毒乳头瘤病毒 papillomavirus URR2.双链环状双链环状DNA病毒病毒衣壳衣壳蛋白蛋白DNA复制复制膜信号蛋白膜信号蛋白组装与释放组装与释放 中断细胞生长周期中断细胞生长周期上游调节区上游调节区转录转录 与复制与
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 基因组

限制150内