协和考博分子生物学笔记(共32页).doc
《协和考博分子生物学笔记(共32页).doc》由会员分享,可在线阅读,更多相关《协和考博分子生物学笔记(共32页).doc(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上分子生物学笔记第一章基因的结构第一节基因和基因组一、 基因(gene)是合成一种功能蛋白或RNA分子所必须的全部DNA序列。一个典型的真核基因包括编码序列外显子(exon)插入外显子之间的非编码序列内合子(intron)5-端和3-端非翻译区(UTR)调控序列(可位于上述三种序列中)绝大多数真核基因是断裂基因(split gene),外显子不连续。断裂基因:在真核蛋白质编码基因中发现的一种编码序列不连续的间断基因,亦即是在其核苷酸序列中间插入有与氨基酸编码无关的DNA间隔区,使一个基因分隔成若干个不连续的区段。基因座位(gene locus):指基因在染色体上的位置。
2、经典的或说是传统的是把locus定义为基因,亦即是遗传座位(genetic locus)或染色体座位(chromosomal locus)。现在普遍接受的概念是,能够用某种特殊的方法确定的任何一个染色体位置,或者说染色体的一个区段,都可以叫做基因座位或染色体座位。重叠基因(overlapping gene):核苷酸编码序列彼此重叠的、编码不同蛋白质的两个或多个基因称为重叠基因,又叫嵌套基因(nested gene)。它最早是在大肠杆菌噬菌体中发现的,后来在真核生物中也发现有此类基因。标记基因(marker gene):指其染色体座位是已知的,并易于根据编码产物或杂交实验检测其存在的一类独特的基
3、因。标记基因可用作绘制新基因座位的参照点。二、基因组(genome):泛指一个有生命体、病毒或细胞器的全部遗传物质,在真核生物,基因组是指一套染色体(单倍体)DNA。或对真核生物而言,基因组就是指一个生物体的染色体所包含的全部DNA,通常又称为染色体基因组。一特定生物体的整套(单倍体)遗传物质的总和。基因组的大小用全部DNA的碱基对总数表示。人基因组3X109(30亿bp),共编码约2万个基因。每种真核生物的单倍体基因组中的全部DNA量称为C值,与进化的复杂性并不一致(C-valueParadox)。人类基因组计划(humangenomeproject,HGP)基因组学(genomics),结
4、构基因组学(structuralgenomics)和功能基因组学(functionalgenomics)。蛋白质组(proteome)和蛋白质组学(proteomics)第二节真核生物基因组一、真核生物基因组的特点:真核基因组DNA在细胞核内处于以核小体为基本单位的染色体结构中。真核基因组中,编码序列只占整个基因组的很小部分(23)。二、真核基因组中DNA序列的分类(一)、高度重复序列(重复次数105)卫星DNA(Satellite DNA)(二)、中度重复序列1中度重复序列的特点重复单位序列相似,但不完全一样,散在分布于基因组中,序列的长度和拷贝数非常不均一,中度重复序列一般具有种属特异性,
5、可作为DNA标记,中度重复序列可能是转座元件(返座子)。2中度重复序列的分类长散在重复序列(long interspersed repeated segments)LINES短散在重复序列(Short interspersed repeated segments)SINESSINES:长度105,如人Alu序列。LINEs:长度1000bp(可达7Kb),拷贝数104105,如人LINEl。(三)、单拷贝序列(Unique Sequence)包括大多数编码蛋白质的结构基因和基因间间隔序列。三、基因家族(gene family)一组功能相似且核苷酸序列具有同源性的基因。可能由某一共同祖先基因(a
6、ncestral gene)经重复(duplication)和突变产生。基因家族的特点: 基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly repeated genes),如rRNA、tRNA和组蛋白的基因;基因簇:基因家族中各成员紧密成簇排列成大串的重复单位,定位于染色体的特定区域。它们属于同一个祖先的基因扩增产物。也有一些基因家族成员在染色体上排列并不紧密,中间还含有一些无关序列,但总体是分布在染色体上相对集中的区域。基因簇中也常常包括一些没有生物功能的假基因。同源基因(homologous genes):来自不同生物,但编码着同样蛋
7、白质产物的基因称同源基因。它们的核苷酸序列往往相类似,因此可作为DNA杂交探针使用。有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;有些成员不产生有功能的基因产物,这种基因称为假基因(Pseudogene),a1表示与a1相似的假基因。假基因分类。加工过的假基因(processed pseudogene)。典型的基因家族1tRNA基因单倍体人基因组中1300个tRNA基因,tRNA基因簇。2rRNA基因l00copy。rRNA基因簇(重复单元28S、18S、5.8s-rRNA)3组蛋白基因3040copy。定位:7q32q36组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)特
8、点:无intron,Poly(A)-RNA。4珠蛋白基因类:16p13,基因簇(24Kb):51213类:11p15,基因簇(60Kb):5GrAr3四、超基因家族(Super gene family,Super family)由基因家族和单基因组成的大基因家族,结构上有程度不等的同源性,但功能不同。五、人类基因组中的重复序列标记1A1u序列单倍体人基因组50万100万拷贝,平均每隔36Kb就有一个Alu序列,人A1u序列长300bp:2X130bp重复序列;+31bp间隔序列(中间);两侧721bp正向重复(direct repeats),返座子?Alu序列广泛散布于人基因组,约90%已克隆
9、的人基因含有Alu序列,Alu序列标志。2可变数串联重复(Variable number tamdem repeat,VNTR),又称小卫星DNA(minisatellite DNA)。由短重复单位(640bp)串联重复(6100次以上)而成,多位于基因的非编码区,广泛分布。VNTR多态性分子标记DNA指纹图(fingerprint)。因为小卫星DNA长度上的变化,容易落入方便的Southern blotting方法所能检测的范围内,不同个体的小卫星DNA的细微差别可被检测,从而形象地提供了每个人的DNA指纹(fingerprint)。小卫星DNA突变与肿瘤,H-Ras。3短串联重复(shor
10、t tandem repeat,STR),又称微卫星DNA(microstallite DNA)26个核苷酸组成的重复单位串联重复(1060次),两侧为特异的单拷贝序列,人基因组中每l0kbDNA序列至少一个STR序列。(CA)n,50,000100,000拷贝。新一代遗传标记,人类基因组研究,肿瘤,遗传病。第三节线粒体基因组人线粒体基因组的特点:1人线粒体基因组为16,569bp的双链闭环分子,一条链为重链(H链),一条链为轻链(L链),两条链均有编码功能,每个mtDNA分于编码13种蛋白质和24种结构RNA(22rRNA,2tRNA)。2线粒体DNA为母系遗传。3结构基因不含内含子,部分区
11、域有基因重叠,因此病理性mtDNA突变更易发生。4mtDNA突变频率更高。5线粒体DNA突变的表型表达与核DNA不同。第四节细菌和病毒基因组一、细菌基因组的特点。1功能相关的几个结构基因往往串联在起,受它们上游的共同调控区控制,形成操纵子结构,2结构基因中没有内含子,也无重叠现象。3细菌DNA大部分为编码序列。二、病毒基因组的特点1每种病毒只有一种核酸,或者DNA,或者RNA;2病毒核酸大小差别很大,3X1033X106bp;3除逆病毒外,所有病毒基因都是单拷贝的。4大部份病毒核酸是由一条双链或单链分子(RNA或DNA),仅少数RNA病毒由几个核酸片段组成。5真核病毒基因有内含子,而噬菌体(感
12、染细菌的病毒)基因中无内含子。6有重叠基因。第五节染色质和染色体细胞分裂间期染色质(chromatin),分裂期染色体(chromosome)一、染色质的基本单位核小体(一)、核小体(nucleosome)结构DNA绕在组蛋白八聚体(H2A、H2B、H3、H4各一对)核心外1.8周(146bp),形成核小体核心颗粒。两个核小体核心颗粒之间有Linker DNA(080bp),核小体核心颗粒+Linker=核小体(长180210bp),核小体DNALadder。(二)、组蛋白(histone):一类小的带有丰富正电荷(富含Lys,Arg)的核蛋白,与DNA有高亲和力。组蛋白分类:1核小体核心组蛋
13、白,H2A,H2B,H3,H4。分子量较小(102135aa)作用:盘绕DNA形成核小体。2H1组蛋白:较大(220aa),作用:与LinkerDNA结合后利于核小体稳定和更高级结构的形成。二、染色质的高级结构130nm染色质纤丝,2袢环结构(looped domain)。3细胞分裂期染色体分裂期染色体=一对姐妹染色单体(Chromatid)有丝分裂中期46条染色体按大小和形状排列的的光学显微镜图像称为人的染色体核型(Karyotype)。三、染色体的结构要素。(一)、着丝粒(centromere):细胞分裂时染色体与仿锤丝相连结的部位,为染色体的正常分离所必需。(二)、端粒(telomere
14、):真核生物线状染色体分子末端的DNA区域。端粒DNA的特点:1由富含G的简单串联重复序列组成(长达数kb)。人的端粒DNA重复序列:TTAGGC。2端粒的末端都有一条1216碱基的单链3端突出。端粒的作用:防止DNA末端降解,保证染色体的稳定性和功能第二章DNA的复制、修复和重组第一节DNA的复制(DNA Replication)一、DNA复制的基本特性1半保留性(Semi-Conservative)Meselson-Stahl实验2双向复制(一般)复制起始点(origin)+两侧复制叉=复制单位(复制子,Replicon)3半不连续性(Semi-discontinuous)前导链(lead
15、ing strand)-连续合成随从链(Lagging Strand)-不连续,由岗崎片段(okazaki fragment)连接而成。二、DNA复制必需的成份(真核生物)1染色体DNA复制必需三种核苷酸序列复制起点着丝粒端粒。2RNA引物(RNA Primer),一般814nt,带游离3-OH形成磷酸二酯键。3DNA解链酶(DNA Helicase),打开DNA双链。4增殖细胞核抗原(Proliferating cell nuclear antigen,PCNA),辅助催化前导链合成。5端粒酶(Telomerase),末端复制问题。端粒酶负责染色体末端(端粒)复制,是由RNA和蛋白质组成的核
16、糖核蛋白,其中的RNA成分是端粒复制的模板(因此端粒是逆转录酶)。作用:维持端粒长度。端粒酶活性可用基于PCR的“TRAP”(Telomerase repeat amplification protocol)法测定(Kim,Netal.,science,266,20112014(1994) )。端粒与细胞寿命。端粒、端粒酶与肿瘤的关系:绝大多数恶性肿瘤具有端粒酶活性但端粒缩短,但也有约5%的肿瘤无端粒酶活性且端粒较长。端粒酶作为新的肿瘤标志和肿瘤治疗靶点。第二节DNA修复(DNA repair)DNA修复是维持基因组完整性的重要机制,在保护基因组避免发生可能导致肿瘤或遗传疾病的突变中起关键的作
17、用。引起DNA损伤的因素:1细胞内源性损伤因素:DNA复制错误;自发损伤包括碱基互变异构、碱基脱氨(CU、AI)和碱基丢失等;氧化代谢副产物如活性氧物质(Reactive oxygen species,ROS)的攻击等。2环境中的损伤因素:辐射(含紫外线、X射线)产生胸腺嘧啶二聚体;化学致癌物(氧化脱氨,烷化剂或代谢活化物如苯并芘、黄曲霉素等产生碱基加合物)一、碱基切除修复(Base excision repair、BER)该途径中最关键的是必须通过一种糖苷酶(glycosylase)先除去变异碱基(如被氧化、烷基化或脱氨的碱基),该糖苷酶催化连接损伤碱基与脱氧核糖之间的糖苷键水解,释放游离碱
18、基并在DNA中产生一个去碱基位点,然后由去嘌呤去嘧啶(AP)核酸内切酶、DNA聚合酶和DNA连接酶等利用相对的一条正常链为模板进行修补合成。(T等于5-甲基U,C脱氨基生产U,5-甲基胞嘧啶脱氨基生成T。)BER途径中的重要糖苷酶:(1)尿嘧啶DNA糖苷酶(UDG),从DNA中除去尿嘧啶碱基;(2)3-甲基腺嘌吟(3MeA)DNA糖苷酶,可修复烷化剂产生的损伤;(3)负责修复DNA氧化损伤的糖苷酶(如FpgMutMDNA糖苷酶)BER是修复内源性DNA损伤(自发水解、烷基化和活性氧攻击)的主要途径,因此对于降低自发突变的频率、防止肿瘤发生有重要作用。二、核苷酸切除修复(Nucleotide e
19、xcision repair,NER)首先由多聚体复合物识别损伤,再在损伤的两侧进行切除。随着DNA链被解开,包含损伤的单链片段释放出来,留下的缺口由DNA聚合酶填补,DNA连接酶封闭。该途径包括20种以上蛋白,可以修复紫外辐射诱导的环丁烷嘧啶二聚体(CPD)和(6-4)光产物(6-4)PPs),以及一些化学物质产生的大加合物。人的NER系统有关基因及其蛋白质产物功能。NER系统缺陷与着色性干皮病(Xeroderma pigmentosum,XP)NER可再分为二条子途径:(1)全基因组修复(Global Genomic repair,GGR)途径:修复整个基因组内的损伤,其效率取决于损伤的化
20、学特性、损伤部位的DNA序列和染色质结构。(2)转录藕联修复(Trancsription-coupled repair,TCR,):特异地修复基因组中具有转录活性(即表达)的基因的被转录DNA链上的损伤,该途径的特点是依赖RNA聚合酶II催化的转录,其中的一些蛋白是普通转录因子TFIIH的亚基。三、错配修复(Mismatch repair)DNA在复制过程中发生错配,如果新合成链被校正,基因编码信息可得到恢复,如模板链被校正,突变就被固定。而细胞错配修复系统能够区分“旧”链和“新”链。Dam甲基化酶可使DNA的GATC中腺嘌呤N6位甲基化。复制后短时间(数分钟)内DNA为半甲基化的GATC序列
21、,一旦发现错配碱基,即将未甲基化的链切除,并以甲基化的链为模板进行修复合成。 负责修复DNA复制过程中由于错误掺入而产生的错配。STR序列复制-模板链的滑动产生小的环状突出(loop)。重复序列扩张(expansion)或丢失:微卫星不稳定性(microsatellite instability)。E.coli中的MMR途径需要mutS,mutH,mutL和uvrD基因产物和特异性核酸外切酶、DNA聚合酶和DNA连接酶等。在酵母和人类已鉴定了mutS,mutH的多种同源物。遗传性非息肉性结肠癌(HNPCC)基因缺陷。微卫星不稳定与肿瘤。新的肿瘤基因诊断标志。四、重组修复(Recombinant
22、 repair)修复DNA的两条链均受损伤的部位的双链断裂或链间交连。第三节重组(recombination)重组的本质是基因的重排或交换,即2个DNA分子间或一个DNA分子的不同部位间,通过断裂和重接,交换DNA片段从而改变基因的组合和序列。一、同源重组(Homologous recombination)指DNA同源序列间的重组,常发生于两个较长的同源DNA片段或同源染色体之间。可通过同源重组将外源基因定位整合到细胞基因组中。二、转座(transposition)可移动的DNA元件(mobile DNA elements)转座元件(Transposable element),它是指那些可在D
23、NA分子内或DNA分子间转移的DNA片段。转座元件的转移过程转座。转座的特点:1转座后原来位置的转座元件序列仍然保留,但同时又把新合成的DNA复本插入到另外一个位点。2转座过程需要转座酶(transposase),它催化断裂和重接两步连续的过程(需要M2+)3转座元件插入位置的两端有312bp的正向重复序列(靶序列),它是由于转座酶错位切割DNA造成的,这种短正向重复序列是存在转座元件的特征。转座元件的分类转座子(transposon),通过DNA复制而转移的转座元件。逆转座子(retroposon)或返座子,通过RNA阶段实现转移的转座元件(DNARNADNA插入新位点)逆转座子例:Alu,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 协和 分子生物学 笔记 32
限制150内