《基因工程》----考试重点总结.doc
Four short words sum up what has lifted most successful individuals above the crowd: a little bit more.-author-date基因工程-考试重点总结西南大学第一章 基因工程概述 第一节 基因操作与基因工程基因操作(gene manipulation):指对基因进行分离、分析、改造、检测、表达、重组和转移等操作的总称。基因工程(gene engineering):通过工具酶,在体外将目的基因、基因片段或其它DNA元件进行切割,与适当的载体进行连接和重组,导入相应受体细胞,并使外源基因进行复制和表达,定向改造受体生物性状或获得表达产物。基因操作与基因工程的关系:基因操作的核心是基因重组(gene recombination)技术,基因工程是基因操作、基因重组的核心内容和主要目的。基因工程的遗传学效果:受体生物发生遗传信息或遗传性状的变化并能稳定遗传给下一代。 第二节 基因工程是生物科学发展的必然产物一、 基因是基因重组的物质基础遗传因子、基因:是遗传信息的基本单位。从物质结构上看,基因是染色体组核酸分子。基因(gene)是作为遗传物质的核酸分子上的一段片段并具有遗传学功能,可以是连续的,也可以是不连续的,可以是DNA也可以是RNA,可以存在于染色体上,也可存在于染色体之外(如质粒、噬菌体等)。基因工程的理论基础:. 明确了遗传信息的携带者基因的载体是DNA,明确了遗传的物质基础。. DNA分子的双螺旋结构和半保留复制模型得以阐明,解决了基因的自我复制和传递问题。. 中心法则、操纵子学说的提出以及遗传密码子的破译,解决了遗传信息的流向和表达问题。(4). 遗传物质基础和中心法则的通用性决定了基因工程原理和技术在生物界普遍适用,尤其是可以实现跨越任何物种界限的遗传成分转移。自此,从理论上讲,基因工程已有可能成为现实基因工程的技术基础:. DNA体外切割和连接技术(限制性内切核酸酶和DNA连接酶的发现与应用,标志着DNA重组时代的开始)。 . 克隆载体的发展与应用。. 大肠杆菌转化体系的建立。. 琼脂糖电泳技术的应用。. DNA测序技术的应用。. 核酸杂交技术的应用。 从技术上为基因工程的诞生奠定了基础。四、基因工程的内容1、基因操作原理:(1)DNA和RNA的操作。(2)基因克隆与功能研究。(3)基因组学与生物信息学的应用。2、基因工程的应用:(1)生物反应器(bioreactor):大规模生产生物活性分子如生长激素、胰岛素等。(2)遗传改良(genetic improvement)、分子育种(molecular breeding)、设计构建新物种。(3)基因治疗(gene therapy):人体转基因或基因组编辑。 第三节 基因的结构基因操作的理论基础一、基因的结构组成对基因操作的影响1、基因及其产物的共线性:一个基因的核苷酸序列与其产物的氨基酸序列一一对应。 N个氨基酸=3N个编码碱基。2、基因及其产物的非共线性。间断基因。 内含子(intron)是指真核基因在RNA加工过程中从原初转录本中剪去而不进入成熟RNA结构、不具有氨基酸编码能力的一段序列。 外显子(exon):是真核基因转录本中剪去内含子后所保留的RNA片段,它们拼接并进行适当修饰后成为成熟RNA并执行相应功能。3、基因的重叠性与可变性:基因的重叠性:单个DNA序列可编码一个以上的蛋白质,它们在结构上可以具有序列重复性,也可以是相互完全不同的全新蛋白质。原因:可变性转录起始位点、可变性起始位密码子、可变性编码终止位点、可变性剪接。开放读码框(open reading frame,ORF):成熟mRNA中从起始密码子ATG至终止密码子(TAA、TAG或TGA之一)之间形成的一个连续的氨基酸编码区间。以起始密码子的第1个碱基作为+1,其5方向的第1个碱基为-1。4、启动子和终止子启动子(promoter):基因转录过程中控制起始的部位,通常是位于转录起始位点5上游的一段DNA区间,其上有许多顺式元件。转录起始位点(transcription start site):起始转录的第一个碱基,也是掺入到RNA中的第1个碱基。在转录研究中记为+1,其5方向的第1个碱基(已属于启动子而非转录区)为-1。侧翼序列(flanking sequence):一条核酸单链上位于某一特定位置的5或3方向的序列。上游(upstream):一条核酸单链上位于某一碱基的5方向。下游(downstream):一条核酸单链上位于某一碱基的3方向。终止子(terminator):位于基因的3部位、终止基因转录过程的一段DNA区间。有依赖不依赖因子两种。核糖体结合位点(ribosomal binding site, RBS):位于mRNA起始密码子及其正上游的一段区间,是核糖体结合并起始翻译过程的位点。原核和真核的RBS显著不同。转录单位(transcription unit)/转录本(transcript):从转录起始位点直至转录的最后一个碱基之间被转录的RNA序列,可以包含一或多个蛋白编码框。亚克隆(subcloning):1、将大片段克隆子的DNA重新打断成小片段,然后分别克隆到新的载体中,供进一步研究。初步克隆中的外源片段往往较长,含有许多目的基因片段以外的DNA片段,在诸如表达序列分析和突变等操作中不便进行,因此必须将目的基因所对应的一小段DNA找出来,这个过程叫“亚克隆”。2、通指将DNA片段从一个载体穿梭克隆到另一个载体的过程。亚克隆技术:泛指实验室中以DNA在大肠杆菌中经典克隆操作为核心的基本技术体系。第二章 分子克隆工具酶 第一节 限制性内切酶一、限制与修饰1、限制与修饰现象:限制(restriction):指一定类型的细菌可以通过限制性内切酶(restriction ednonuclease)的作用,破坏入侵的噬菌体DNA,导致噬菌体的寄主范围受到限制。 限制作用实际就是限制性内切酶降解外源DNA,维护宿主遗传稳定的保护机制。修饰(modification):指寄主本身的DNA,由于在合成后通过甲基化酶(methylase)的作用得以甲基化,使DNA得以修饰,从而免遭自身限制性酶的破坏。 修饰作用宿主细胞通过甲基化作用达到识别自身遗传物质和外来遗传物质的目的。甲基化作用:最主要的碱基修饰,使腺嘌呤A成为N6-甲基腺嘌呤,胞嘧啶成为5-甲基胞嘧啶。限制酶是一类能够识别双链DNA分子中的某种特定核苷酸序列,并由此切割DNA双链结构的核酸水解酶。 限制酶存在于细菌中,也存在于一些病毒中,真核生物中没有限制酶。3.限制性核酸内切酶的种类据限制性核酸内切酶的识别切割特性、催化条件及是否具有修饰酶活性,可分为、型三大类。型限制酶用途大,多为同源二聚体,其中切口酶只在单链上产生切口,s型识别序列和切割位置特殊。二、限制酶识别的序列1、限制酶识别序列的长度(n):一般为4-8个碱基对,最常见为6bp。识别位点出现频率:4n2、限制酶识别序列的结构:多数为回文结构(palindrome)即镜像对称结构。一些酶可识别多种结构尤其是允许一些碱基是简并的,还有一些酶识别序列呈间断对称,即回文对称序列之间可以间隔一定长度的任意碱基。3、限制酶的切割位置:多数在识别序列内部,也有在外部、两端、两侧或单侧的。三、限制酶的功能和产生的末端类型限制性核酸内切酶有严格的识别、切割顺序,它以核酸内切方式水解DNA链中的磷酸二酯键,产生的DNA片段5端为P,3端为OH,识别序列一般为46个碱基对,通常是反向重复顺序,具有180°的旋转对称性,即回文结构。限制性核酸内切酶切割双链DNA产生3种不同的末端类型。 1、对称型突出末端:回文结构决定对称,分为5突出和3突出的粘性末端(cohesive/sticky end)两种。2、平末端(blunt end):任何平末端酶的酶切产物可以互连,但连接效率比粘性末端低100倍左右。3、非对称的突出末端:因为识别序列是非回文的、简并的或存在间隔序列,故产生的粘性末端也为非对称的。即使是单酶切限制片段在连接时也具有方向性。4、同裂酶(isoschizomer):不同的酶识别序列相同,切割位点可以相同也可以不同,又分为同序同切酶、同序异切酶、同功多位酶和其它类型。 例:Sma(CCCGGG)和Xma(CCCGGG)5、同尾酶(isocaudarner):不同限制酶识别序可以相同,也可以不同,但它们产生的末端是一样的,末端间可以相互连接。同尾酶在基因工程尤其是载体构建中有较大用途。 例:Xho(CTCGAG)与Sal(GTCGAC)、 BamHI(GGATCC)和Bgl(AGATCT)6、归位内切酶(homing endonuclease):一些线粒体、叶绿体、核DNA和T偶数噬菌体的内含子编码内切酶(称为I-prefix)或内含肽(intein)具有内切酶活性(称为PI-prefix)。它们识别序列很长,核心识别序列一般为10-12bp,识别位点极少。四、DNA末端长度对限制酶切割效率的影响限制性核酸内切酶识别和切割靶序列时需要识别序列两侧具有一定长度的DNA,否则会降低切割效率。对侧翼长度敏感性较低的酶有EcoR等,只要一个侧翼碱基即保证90%的效率。 对侧翼长度敏感性高的酶有Acc、Hind、Pst等,侧翼3个碱基以上也未必理想。设计引物、接头等时要考虑适当长度的保护碱基,载体构建时多克隆位点中的相临位置的酶的切割序列的选择也很重要。限制酶的活性单位(unit):1个单位的酶是指在建议的缓冲液及温度下,在20l反应液中反应1h,使1g DNA(多用)完全消化所需要的酶的量。五、位点偏爱某些限制酶对同一底物中的不同位置的识别位点的切割效率不同,表现出偏爱性,这种现象称作位点偏爱。某些噬菌体DNA中的某些相同的酶切位点对酶的敏感性不同。噬菌体DNA为48502bp,两端为12bp粘性末端。EcoR酶切割噬菌体中的5个位点时并不是随机的,靠近右端的位点比分子中间的位点切割快10倍;EcoR对腺病毒2DNA不同位置切点的切割速率也不同。由于位点偏爱性, DNA用Hind消化而制备的 Hind DNA marker中4.3kb条带甚至比2.0kb条带还弱。原因:切割时需要同时与2个识别位点作用(如Nar等),或识别和切割时要求在DNA上有2个明显不同的结合位点,其中1个是另1个的被切割时起激活作用的变构位点。应对办法:超量用酶、延长切割时间。七、限制酶的星活性(star activity)在极端非标准反应条件下,限制性核酸内切酶能切割与特异识别序列不同但相似的序列,降低酶切反应的特异性,这种改变的特殊性称为限制性核酸内切酶的星活性。产生原因: 反应体系中甘油的浓度大于5%。 酶用量过大,大于100 U/g DNA。 低离子强度,小于25 mmol/L。 高pH,大于8.0。 含有机剂如乙醇、二甲基亚砜、二甲基乙酰胺等。 Mn2+、Cu2+、Co2+、Zn2+等非Mg2+的二价离子的存在。易发生星活性的内切酶有:EcoRI、Hind、KpnI、PstI、SalI、HinfI等。 办法:对因改进。八、单链DNA的切割多数限制酶很难切割单DNA模板。部分限制酶除切割双链DNA外,还可切割单DNA,但活性一般都不高。切口酶虽然识别双链,但只在单链上切口,名称前要加一个N。九、酶切位点的引入现代基因工程中通过引物化学合成等方式可以很方便进向目标位置引入设计的酶切位点。通过不同酶切末端的连接重组也可产生新的酶切位点,对具体情况的分析在设计中有价值: 5突出末端补平后重连; 同尾末端连接; 平末端连接。十、影响限制性核酸内切酶活性的因素DNA样品的纯度 DNA样中混有蛋白质、苯酚、氯仿、乙醇、EDTA、SDS、NaCl等都有可能抑制酶活性。 可采用以下方法,提高酶活性:加大酶的用量,1g DNA用10U酶加大反应总体积延长反应时间DNA样品的甲基化程度大肠杆菌中的dam甲基化酶在5GATC3序列中的腺嘌呤N6位引入甲基,受其影响的酶有BclI、Mbol等,但BamHI、BglII、Sau3AI不受影响。大肠杆菌中的dcm甲基化酶在5CCAGG3或5CCTGG3序列中的胞嘧啶C5位上引入甲基,受其影响的酶有EcoRII等,但BglI、KpnI不受影响。采用去甲基化酶的大肠杆菌菌株来制备质粒DNA,可防止DNA的甲基化。十一、基因组中酶切位点分布的不均一性在基因组中酶切位点的分布并不是均一的。大肠杆菌中六碱基识别的酶Spe平均60kb才出现1次。酵母中重复序列以外富含GC的识别序列较少。哺乳动物基因组中CG序列只有随机概率值的1/5,且多数发生胞嘧啶甲基化,Sma位平均约65kb才出现1次。果蝇和线虫中CG基序虽然少,但不发生甲基化。限制性核酸内切酶操作的注意事项商品化的限制性核酸内切酶均为浓缩液,每次操作时应使用新的吸头去取酶,加入酶的体积应不超过总体积的10%,否则酶液中的甘油浓度超过5%时将会抑制酶的活性。整个操作应在0进行,即在冰浴中进行,而且是在加入其它试剂之后,最后加入酶。当切割大量DNA时,通常采用延长反应时间,减少酶的用量。当DNA需2种或以上酶切时,应用通用缓冲液,若没有通用缓冲液时,只有用1种酶切完后,纯化酶切产物,再进行下一个酶切反应。正确保存、分装和取用限制酶,抽提高质量的DNA。限制性核酸内切酶的主要用途在特异位点上切割DNA,产生特异的限制性酶片段。建立DNA分子的限制酶图谱。构建基因文库。用限制酶切出的相同粘性末端,以便重组。改建质粒。 第二节 甲基化酶一、甲基化酶的种类原核生物和真核生物中存在大量的甲基化酶(methylase),又称甲基转移酶(methyltransferase),大肠杆菌中有3种。三、甲基化对限制酶切的影响1、修饰酶切位点:敏感的酶不能切开。2、产生新的酶切位点:为依赖于甲基化的限制酶创造切点。3、对基因组作图的影响:哺乳动物具有较多的m5CG序列具有组织细胞特异性,而且一个细胞内的m5CG甲基化不彻底,所以用m5CG甲基化敏感的限制酶作图时具有可变性,对图的稳定性带来影响。植物的基因组DNA的甲基化程度高,作图时也要求选用对m5CG甲基化不敏感的限制酶。 第三节 DNA聚合酶DNA聚合酶(DNA polymerase)的主要活性是催化DNA的合成(在具备模板、引物、dNTPs等情况下)及其相辅的活性。真核生物有4种DNA聚合酶:、线粒体型。原核生物有3种DNA聚合酶:、型。二、大肠杆菌DNA聚合酶I大片段(Klenow fragment)(1)Klenow酶的基本性质:大肠杆菌DNA聚合酶I经枯草杆菌蛋白酶处理,获得N端三分之二的大肽段,即Klenow酶。Klenow酶仍拥有53的DNA聚合酶活性和35的核酸外切酶活性,但失去了5 3核酸外切酶活性。(2)Klenow酶的基本用途(可被T4 DNA聚合酶代替):补平由核酸内切酶产生的3粘性凹陷末端抹平DNA的3粘性凸出末端DNA片段的同位素末端标记cDNA第二链的合成双脱氧末端终止法测定DNA序列三、T4 DNA聚合酶(T4 phage DNA polymerase)(1)T4 DNA酶的基本特性:有35的核酸外切酶活性和53的DNA聚合酶活性。在无dNTP时,可以从任何3-OH端外切在只有一种dNTP时,外切至互补核苷酸。在四种dNTPs均存在时,聚合活性占主导地位。四、T7噬菌体DNA聚合酶(T7 phage DNA polymerase)持续合成能力最强有35 外切酶活性是Klenow酶的1000。可代替T7噬菌体DNA聚合酶的用途。五、耐热性的DNA聚合酶(第八章详讲)来自噬高温细菌,如Taq、Pfu等。高温下具有53 DNA聚合酶活性,一般在72最理想。有53 外切酶活性。具35 外切酶活性者具校正(proofreading)功能,如Pfu。否则无校正功能,如Taq。用于PCR扩增。反转录酶:是依赖于RNA的DNA聚合酶,以RNA为模板聚合cDNA链,具有53的DNA聚合酶活性、53的RNA外切核酸酶活性和RNase H活性,但缺乏35RNA外切核酸酶活性,所以反转录过程中无校正功能。 末端转移酶:是不依赖于模板的DNA聚合酶,催化dNTP加于DNA分子的3羟基端。可产生同源多聚尾用于连接、引物退火,也可用于末端标记。 第四节 其它分子克隆工具酶一、依赖于DNA的RNA聚合酶依赖于DNA的RNA聚合酶ATP(DNA dependent RNA polymerase)包括SP6噬菌体和T4噬菌体RNA聚合酶。活性:转录活性,无需引物,但识别特异启动子序列。用途:体外合成RNA分子作探针等。用于表达外源基因的mRNA,然后用于翻译蛋白。二、DNA连接酶(DNA ligase)DNA连接酶能催化双链DNA切口处的5-磷酸根和3-羟基生成磷酸二酯键。这种反应需要供给能量,大肠杆菌和其他细菌的DNA连接酶以NAD+作为能量来源,动物细胞和噬菌体的连接酶则以ATP作为能量来源。1、T4 DNA连接酶的作用机制:ATP + DNA ligase (E) E-AMP + PPi。E-AMP上的AMP转移到DNA的5磷酸根上,使其活化,释放出酶。活化的5磷酸根与相邻的3羟基形成3,5-磷酸二酯键,并释放出AMP。3、平头双链DNA片段的连接操作 从分子动力学的角度讲,由限制性核酸内切酶创造的粘性末端的连接属于分子内部的连接,而平头末端的连接则属于分子间的连接,因此后者反应速度要慢的多。提高平头末端连接效率的方法包括:加大连接酶用量(10倍大于粘性末端的连接)。加大平头末端底物的浓度,增加分子间碰撞机会。加入10% PEG8000,促进大分子之间的有效作用。加入单价阳离子(NaCl),最终浓度150-200 mmol/L。第三章 基因工程载体一、基本概念 利用重组DNA技术分离目的基因,称之为基因克隆(gene cloning)。克隆(clone):作物动词时是指从单一祖先产生同一的DNA分子群体或细胞群体的过程,作名词时指从一个共同祖先无性繁殖下来的一群遗传上同一的DNA分子、细胞或个体所组成的特殊群体。基因文库(gene library):由大量的含有基因组DNA的不同DNA片段的克隆所构成的群体。载体(vector):在基因工程中,携带着目的基因或DNA片段进入宿主细胞进行扩增或表达的工具DNA分子。二、 分类按载体功能分:克隆载体、表达载体按载体性质分:质粒载体、噬菌体载体、人工染色体表达体系 载体 宿主原核生物表达体系质粒、噬菌体 细菌酵母表达体系大肠杆菌-酵母菌穿梭质粒 酵母转基因植物体系大肠杆菌-农杆菌穿梭载体(Ti质粒)、病毒等 植株哺乳细胞表达体系大肠杆菌-病毒穿梭载体、脂质体等 培养动物细胞基因直接导入DNA本身(基因枪微粒轰击法、注射法等) 生殖细胞、体细胞、个体三、基因工程载体必须具备的条件: (1)有复制起点 (2)具有若干个限制性内切酶的单一识别位点 (3)具备合适的筛选标记 (4)具备合适的拷贝数目 (5)分子量要相对较小 (6)在细胞内稳定性要高 (7)易分离纯化表示载体必须具备的条件第一节 质粒载体一、质粒(plasmid)的基本特性Plasmid 独立于细菌染色体外的双链环DNA分子。质粒是细菌染色体外能自主复制的环形双链DNA分子。质粒DNA多呈超螺旋的共价闭合环状DNA (covalently closed circular, cccDNA),大小为1-200kb,可以持续稳定地处于游离状态,但一定条件下又会可逆地整合到寄主染色体上,随染色体复制而复制。编码抗菌素抗性基因的质粒叫R质粒。质粒DNA在添加真核复制信号和启动子后,可以构建出能在原核和真核细胞中均可复制的穿梭质粒,并在真核细胞中表达,因此应用广泛。1、质粒的复制:由复制子(ori,复制起始区及与此相关的顺式作用元件)决定。质粒复制的机理请见教材。2、质粒的拷贝数:根据每个寄主细胞中质粒拷贝数的多少,把质粒分为严紧型复制质粒(拷贝数少,为1-5个)与松弛型复制质粒(拷贝数多,可达10-200个拷贝)。作为载体的质粒一般应该是松弛型的。拷贝数是由复制起始点的类型决定的,如pMB1或ColE1。 pUC系列载体中的突变型pMB1复制子可达500-700个拷贝。3、质粒的不亲和性(incompatibility):两种亲缘关系密切的不同质粒,不能够在同一个寄主细胞系中稳定地共存的现象。涉及细胞分裂过程中的竞争性选择。不相容群。4、质粒的转移性:自然条件下质粒可通过细菌的接合(conjugation)的作用而转移到新的宿主细胞中。三亲杂交法。质粒载体应具备的条件:1 有特定的复制起始子。2 有多种限制性内切酶切点,但每种切口最好只有 1个;2 有选择标记,例如抗药性标记,蓝白斑试验;3 有一定容量;4 有相当的拷贝数, 即每个宿主菌可能容纳的最多数。二、标记基因1、转化子标记基因:用于鉴别目的DNA的存在,将成功转化了载体的宿主挑选出来。Ampr(氨苄青霉素抗性基因):水解-内酰胺环。Tetr(四环素抗性基因):阻止四环素进入细胞。Cmr(氯霉素抗性基因):编码氯霉素乙酰转移酶。Kanr(卡那霉素抗性基因):编码氨基糖苷磷酸转移酶。supF(琥珀突变抑制基因):编码细菌抑制性tRNA,可翻译UAG为酪氨酸。赭石突变(UAA),乳白突变(UGA)。正向选择标记:蔗糖致死基因sacB。2、重组子标记基因:用于将重组子与非重子区别开来。-互补 ( complementation):人工突变使大肠杆菌的-半乳糖苷酶基因(lacZ)缺失N-端的第11-41位氨基酸,而载体则携带有LacZ基因的N-端140个氨基酸和编码区段(lacZ),二者单独存在时均无功能,但共存于一个大肠杆菌细胞时则发生功能互补,形成具有完全活性的LacZ酶。多克隆位点(multiple cloning site,MCS):载体上的一段人工设计和人工合成的DNA序列,含有多个在该载体唯一的限制性内切酶的切点,以方便载体与外源片段的重组。插入失活(insretional inactivation):当一段足够长的外源DNA片段插入到一个功能基因的编码区后,导致ORF移码或提前终止,严重破坏原基因的编码能力而使该基因失活。蓝白斑筛选(white-blue screening):空载体转化子经IPTG诱导表达后,由于-互补而形成的功能性的LacZ蛋白,能够转化无色底物X-gal而形成深蓝色的产物,使菌落或噬菌斑显蓝色(蓝斑);重组载体的转化子中,由于lacZ基因的插入失活而不能形成-互补,在IPTG+X-gal条件下菌落或噬菌斑不显蓝色(白斑) ;通过菌落或噬菌斑的蓝/白色差异而达到筛选鉴定出重组子与非重组子的目的。三、质粒载体的种类质粒的发展阶段第一阶段(1977年前):天然质粒和重组质粒的利用,如pSC101、ColE1、pCR、pBR313和pBR322。第二阶段:增大载体容量(降低载体长度),建立多克隆位点区和新的遗传标记基因。如pUC系 列载体。 第三阶段:完善载体功能以满足基因工程克隆中的不同要求,如M13mp系列载体,含T3、T7、SP6启动子载体,表达型载体及各种探针型载体。许多实用的质粒载体都是在pBR322的基础上改建而成含LacZ基因及其启动子的操纵基因、M13的多聚接头polylinker。pUC18与pUC19只是多克隆位点的排列方向相反,其余一致。表达载体:一般是在克隆的载体上添加和完善了用于外源基因表达的一些基本元件,如强启动子、蛋白纯化标签、信号肽、诱导表达元件等。如Novagen的pET系列、Qiagen的pQE系列。第二节 噬菌体载体一、噬菌体的分子生物学噬菌体的组成结构和用途 噬菌体是比细菌还小得多的微生物,和病毒侵犯真核细胞一样,噬菌体侵犯细菌,也可以认为它是细菌里的“寄生虫”。它本身是一种核蛋白,核心是一段DNA,结构上有一个蛋白质外壳和尾巴,尾巴上的微丝可以把噬菌体的DNA注入细菌内。噬菌体为线性双链DNA的细菌病毒,具有互补的12bp粘性末端,感染细菌后粘端互补成双链环状。全长48531bp,含50多个基因。噬菌体基因大致分为4个区:结构区:AJ 19个基因,编码头、尾部蛋白质为结构区。组区att(attachment)、int(intagrate)及xis(excission)。调控区启动子、终止子和N、CI基因。裂解区:Q-R。噬菌体可以容纳较大的目的基因。例如用置换法可去掉长达20kb的DNA,换入相应长度的目的基因。 基因文库构建常使用载体。 不少先进的质粒应用组件进行构建。四、载体的克隆原理和步骤1、通过裂解过程增殖载体。2、载体与外源DNA的酶切。载体一般要纯化左路、右臂,并进行去磷酸化处理。3、外源DNA与载体的连接,形成的是多联体。4、重组噬菌体的体外包装,需要单独制备衣壳蛋白,包装过程对DNA大小有选择性。5、包装后的噬菌体颗粒感染大肠杆菌,经过的复制、包装和裂解过程,重组载体得到扩增,一个的感染和扩增会导致它周围一圈范围内的大肠杆菌被溶解,形成透明的溶菌圈/噬菌斑(plaque)。6、筛选。每个噬菌斑代表了一个重组,所有噬菌斑的集合就为一个文库。pfu: plaque forming unit,噬菌斑形成单位,指每微克包装DNA感染大肠杆菌后形成的噬菌斑数,要求100万以上。第四章 人工染色体载体 第一节 粘粒载体一、粘粒的结构特征和用途 粘粒实际是质粒的衍生物,是带有cos序列的质粒。cos序列是l噬菌体DNA中将DNA包装到噬菌体颗粒中所需的DNA序列。粘粒的组成包括质粒复制起点、抗性标记、cos位点,因而能像质粒一样转化和增殖。 它的大小一般5-7kb左右,用来克隆大片段DNA,克隆的最大DNA片段可达45kb。有的粘粒载体含有两个cos位点,在某种程度上可提高使用效率。二、粘粒载体的工作原理 粘粒载体的主要工作原理类似l噬菌体载体。在外源片段与载体连接时,粘粒载体相当于l噬菌体载体的左右臂, cos位点通过粘段退火后,再于外源片段相间连接成多联体。当多联体与l噬菌体包装的蛋白质混合时l噬菌体A基因蛋白的末端酶功能将切割成两个cos位点,并将两个同方cos位点之间的片段包装到l噬菌体颗粒中去。 允许插入片段为30-45kb。三、粘粒克隆载体粘粒pJB8、含双cos位点的粘粒载体、pcos1 EMBL等。四、粘粒载体文库的扩增和贮存噬菌体颗粒状的粘粒文库在含有几滴氯仿的SM溶液中可以保存几周。可以采用影印到硝酸纤维素膜上保存、挑取所有菌落混合培养后深冷保存,等。第二节 酵母人工染色体载体酵母人工染色体载体(yeast artificial chromosome,YAC):就是模拟酵母菌染色体的复制而构建的载体。一、YAC载体的复制元件 YAC载体的复制元件是其核心组成成分,骑在酵母中复制的必须元件包括复制起点序列即自主复制序列、用于有丝分裂和减数分裂功能的着丝粒和两个端粒。这些元件能够满足自主复制、染色体在子代细胞间的分离及保持染色体稳定的需要。端粒重复序列:是定位于染色体末端的一段序列,用于保护线状DNA不被胞内的核酸酶降解,已形成稳定的结构。着丝粒:是有丝分裂过程中纺锤丝的结合位点,使染色体在分裂过程中能正确分配到子细胞中。在YAC中起到保证一个细胞内只有一个人工染色体的作用。二、YAC载体的工作原理 YAC载体主要是用来构建大片段DNA文库,特别是用来构建高等真核生物的基因组文库,并不用作常规的基因克隆。图示是pYAC4载体的遗传结构图,当用BamH切割成现状后,就形成了一个微型酵母染色体,包含染色体复制的必要順式元件。这些元件在酵母菌中可以驱动染色体的复制和分配,从而决定着个微型染色体可以携带酵母染色体大小的DNA片段。允许插入片段大小:没有限制,一般为250-1500kb。YAC的缺点:插入片段容易出现缺失和重排现象,YAC与酵母染色体大小相似不容易分离和纯化。YAC的优点:酵母细胞比大肠杆菌对不稳定的、重复的和极端的DNA片段有更强的容忍性,文库的代表性强,适合作真核染色体片段功能研究。 第三节 细菌人工染色体载体细菌人工染色体载体(bacterial artificial chromosome,BAC):就是基于大肠杆菌的F质粒构建的高容量低拷贝质粒载体。F质粒:是一个约100kb的质粒,编码60多种参与复制、分配和结合过程的蛋白质。一、 BAC载体及其结构组成BAC载体大小约7.5kb,其本质是一个质粒克隆载体。BAC载体与常见克隆载体的核心区别在于其复制单元的特殊性。复制单元来自F质粒二、BAC载体工作原理BAC载体的工作原理与常规的质粒克隆载体相似。不同的是,BAC载体装载的是大片段DNA,一般在100300kb。对如此大的DNA片段一般要通过脉冲场凝胶电泳来分离。另外,由于BAC载体的拷贝数小,制备难度大。为解决这个问题,有的学者将BAC载体作为外源片段克隆到常规高拷贝质粒载体上,从而在大肠杆菌中以多拷贝的形式复制,便于载体的制备,使用时将高拷贝质粒去掉。第四节 P1噬菌体载体和P1人工染色体载体一、P1噬菌体的分子特征:双链线状DNA,110kb,末端具有10kb左右冗余序列,感染进入大肠杆菌后冗余序列发生重组,形成环状分子,c决定进入溶原或裂解状态。包装方式与不同。二、P1噬菌体载体元件:复制元件、环化和包装信号、标记基因、克隆位点、填充片段。 P1噬菌体载体工作原理:与粘粒相似。三、P1人工染色体载体:结合了P1噬菌体载体和BAC载体的最佳特性,如pCYPAC1,允许外源片段为130-150kb,采用电转化,外源片段的嵌合和重组现象较低,对重组序列的回文结构的忍受性强。第五章 表达载体第一节 大肠杆菌表达载体一、大肠杆菌表达载体的结构原核表达载体:适用于在原核细胞中表达外源基因的载体。均是质粒载体,首先必然满足克隆载体的基本要求,然后增加表达元件。1、表达元件(expression elements): 1)启动子(promoter):三类,即lac启动子、trp启动子和它们的杂合启动子tac或trc,都受IPTG诱导。T7噬菌体启动子噬菌体的PL启动子。2)终止子:依赖于因子或不依赖于因子(遇茎环结构而终止)。3)核糖体结合位点(ribosome binding side, RBS):Shine-Dalgarno (SD)序列,ATG与RBS之间的距离很重要,一般3-11bp。2、表达形式完整单一蛋白:单一基因的编码区表达。融合蛋白(fusion protein):多个基因的编码区的串联体,但构成一个整体的单一ORF,如果融合标签蛋白有利于蛋白的定向、纯化,如果融合多个目标蛋白,则类似于直接表达了一个多酶复合体一样,可减少载体构建难度,而且可以偶连两个或多个相关基因的表达。3、表达的控制诱导表达系统:IPTG防渗漏表达系统:lacIqPL启动子受c的调控,低温(30)下阻抑转录,高温(40-45)下解除抑制。4、分泌表达载体:产物可跨膜分泌至胞周间隙,可避免受细胞内蛋白酶的降解,或使其正确折叠,或去除N-端甲硫氨酸,以维护活性。信号肽(signal peptide)有碱性磷酸酶信号肽、蛋白质A信号肽(如Amersham公司的pEZZ18系统)。四、表达产物的纯化1、包涵体(inclusion body)的纯化:许多情况下表达产物在细胞内形成不溶的颗粒状包涵体,可通过机械法、冻融法、超声波处理等破碎细胞,离心收集包涵体,洗涤去除杂蛋白,用盐酸胍、尿素和SDS溶解包涵体,再通过一定的法使蛋白质折叠。有的经上法得到后仍然有活性,有的蛋白一旦形成包涵体后就没有活性了,但可作为抗原。2、可溶性蛋白的纯化:表达的蛋白可以细胞内呈可溶状态,也有少量进入细胞周质区。将细胞裂解物的上清部分用于纯化目标蛋白,甚至可直接作为粗酶液进行生化反应。第二节 穿梭载体*穿梭载体(shuttle vector):能够在两类不同的宿主中复制、增殖和选择的载体,主要是质粒,它们至少有两套复制单元和两套选择标记,相当于两个载体的联合。只要涉及大肠杆菌以外的细胞,绝大多数载体都装有大肠杆菌质粒载体的基本元件,都可看作穿梭载体。一、大肠杆菌/革兰氏阳性菌穿梭载体:如向枯草芽孢杆菌的穿梭。二、大肠杆菌/酵母菌穿梭载体:主要用于遗传学和真核表达研究,尤其是当蛋白需要进行真核修饰时,如磷酸化、糖基化等。三、其它穿梭载体:如动物病毒载体、植物转化的Ti质粒、昆虫杆状病毒等,更