医学分子生物学-整理笔记(29页).doc
-医学分子生物学-整理笔记-第 28 页第2章 基因、基因组和基因组学基因 (gene):携带有遗传信息的 DNA或 RNA序列,也称为遗传因子。基因是合成有功能的蛋白质或 RNA所必需的全部 DNA,包括编码蛋白质或 RNA的核酸序列,也包括为保证转录所必需的调控序列。基因的功能:传递遗传信息,控制个体性状表现。 结构基因 (structural genes):可被转录形成 mRNA,并转译成多肽链,构成各种结构蛋白质,催化各种生化反应的酶和激素等。调节基因 (regulatory genes) :某些可调节控制结构基因表达的基因。其突变可影响一个或多个结构基因的功能,或导致一个或多个蛋白质(或酶)量的改变。 eg. miRNA, siRNA, piRNA种类IIIIII分布核仁核基质核基质产物rRNAmRNA, microRNA5S rRNA, tRNA, siRNA 核糖体 RNA 基因 (ribosomal RNA genes) 与转运 RNA 基因 (transfer RNA genes):只转录产生相应的RNA而不翻译成多肽链。 真核生物的RNA聚合酶 ( 3种):RNA 聚合酶 I, II, III. 开放阅读框架 (open reading frame,ORF):在DNA链上,由蛋白质合成的起始密码开始,到终止密码为止的一个连续编码序列。断裂基(split gene):真核生物结构基因,由若干个编码区和非编码区互相间隔开但又连续镶嵌而成,去除非编码区再连接后,可翻译出由连续氨基酸组成的完整蛋白质。基因组 (genome):一个细胞内的全部遗传信息,包括染色体基因组和染色体外基因组。 基因组中的 DNA包括编码序列和非编码序列。 部分病毒基因组-RNA。 C值 (C-value):一种生物体单倍体基因组DNA的总量,用以衡量基因组的大小。通常,进化程度越高的生物其基因组越大,但从总体上说,生物基因组的大小同生物在进化上所处地位的高低无关。存在 C-value paradox (C值悖理)。生物复杂性越高,其基因的密度越低。 病毒基因组的大小: 与细菌或真核细胞相比,病毒的基因组很小。不同的病毒之间基因组大小相差很大。乙肝病毒DNA:3kb,编码4种蛋白质;痘病毒的基因组:300kb,编码几百种蛋白质。病毒基因组的大小通常与其对宿主的依赖程度有关,基因组越大,依赖性越小。 RNA 病毒基因组编码序列具有节段性 :有些病毒的基因组 RNA由不连续的几条核酸链组成(如流感病毒,轮状病毒等)。 分段基因组的病毒一般感染效率较低 ;分段基因组容易发生重组,故病毒容易变异 。 目前未发现DNA病毒有此状况。病毒基因存在基因重叠 :基因重叠:同一段DNA片段能够参与编码两种甚至两种以上的蛋白质分子。这种现象在其它的生物细胞中仅见于线粒体和质粒DNA。此结构意义在于使较小的基因组能够携带较多的遗传信息。 基因重叠的方式 :1)一个基因完全在另一个基因里面。2)几个基因部分重叠。3)两个基因之间只有一个碱基重叠。 重叠基因的DNA序列可能大部分相同,但由于翻译时的读码框架不同、或起始部位不同而产生不同的蛋白质。 有些真核病毒的部分序列,对某一个基因来说是内含子,而对另一个基因而言却是外显子。 病毒基因组的大部分序列具有编码功能:病毒基因组的大部分是用来编码蛋白质的,只有非常小的一部份没有编码翻译功能。 X174基因组中不编码的序列只占217/5375。乳头瘤病毒基因组约,其中不编码的部分约为。 少数真核生物病毒的基因组也存在内含子结构。病毒基因组的转录单元是多顺反子 :多顺反子 mRNA (polycistronie mRNA) :病毒基因组DNA序列中功能上相关的蛋白质的基因或 rRNA的基因往往丛集在基因组的一个或几个特定的部位,形成一个功能单位或转录单元。它们可被一起转录成含有多个 mRNA 的分子。病毒基因组都是单倍体:除了逆转录病毒以外,一切病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。 逆转录病毒带有逆转录酶,能使RNA反向转录生成DNA,因此其基因组可拥有两个拷贝。 噬菌体基因具有连续性:噬菌体的基因是连续的,而真核细胞病毒的基因是不连续的,具有内含子。 原核生物基因组通常比较简单,其基因组大小在106bp107bp之间,所包含的基因数目几百个到数千个之间。 原核生物基因组通常由一条环状的双链DNA分子组成,在细胞中与蛋白质结合成染色体的形式,在细胞内形成一个致密的区域,称为类核(nucleoid). 大肠杆菌染色体基因组的结构和功能 :大肠杆菌基因组序列中的基因密度非常高,编码区所占的比例较大。大肠杆菌中总共有4288个基因,平均编码长度为 950bp,基因之间的间隔区长度为 118bp,而且这些结构基因没有内含子。大肠杆菌DNA分子中的重复序列很少,但在大肠杆菌基因组中不同部位可以有称为 转座子 的50kb的重复片段。 转座因子:原核生物转座因子主要有二类:插入序列 (insertion sequence,IS) : IS:2000bp以内,两端都有正向重复序列(direct repeats,DR)和反向重复序列(inverted repeats,IR),中间1kb左右的编码序列,仅编码和转座有关的转座酶。 只有当 IS 转座到某一基因中使该基因失活或插入位点旁边的染色体发生畸变等效应时才会被发现。 复合型转座子 ( composite transposon, Tn) : Tn :200020000bp之间,两端由一对 IS 元件组成,带有与转座作用有关的基因以及其他基因。 根据转座的的机制和结果,可将转座分为:复制型转座,保守型转座大肠杆菌染色体外基因组的结构和功能:质粒(plasmid):一类染色体外具有自主复制能力的环状双链DNA分子,属染色体外基因组。 大肠杆菌质粒是双链环状结构的 DNA 分子。可以有共价闭合环状 DNA(covalently closed circular DNA,cccDNA)、缺口的环状 DNA、线性DNA 三种结构状态。质粒对宿主细胞的生存一般不是必需的,但质粒带有某些特殊的不同于宿主细胞的遗传信息,其存在赋予宿主细胞一些遗传性状。质粒能自主复制,是能独立复制的复制子(autonomous replicon)。严紧控制(stringent control)型质粒:其复制常与宿主的繁殖偶联,拷贝数较少,每个细胞中只有1个到十几个拷贝。松弛控制(relaxed control)型质粒:其复制与宿主不偶联,每个细胞中有几十到几百个拷贝。 质粒的稳定性与不相容性: 质粒的不相容性(incompatibility):两种不同质粒因利用同一复制和维持机制,在复制和随后向子代细胞分配的过程中会发生竞争,从而不能在同一宿主细胞内稳定存在,其中一种质粒将被丢失。 携带不同复制和维持机制的质粒属于不同的不相容群,它们可以共存于同一细胞中。 影响质粒稳定性的因素:1.主细胞分裂时质粒能否均衡地分配到子代细胞。2.质粒分子自身结构的稳定性。 真核生物的遗传物质绝大部分存在于细胞核染色体,少部分存在于线粒体或叶绿体中-细胞核基因组和细胞器基因组。 真核生物染色体基因组特点 : 人类基因组中仅含有2500030000个基因,远低于预期。在人类基因组中只有很少一部份(约2-3)DNA序列用以编码蛋白质和结构RNA。人类基因组中存在大量基因间隔区序列,主要由重复DNA构成。 在基因内部含大量内含子。 单拷贝序列:占 40%-80%,结构基因基本上属于单拷贝序列。中度重复序列:重复次数10105,占 10-40%。如rRNA、tRNA、组蛋白以及免疫球蛋白的基因等,另有部分可能与基因的调控有关。高度重复序列:拷贝数大于106 ,占 10-60%。如反向重复序列 (inverted repeats) 和卫星DNA (satellite DNA)。 反向重复序列常见于基因的调控区,可能与复制、转录的调控有关。 重复序列的多态性:DNA多态性:DNA 序列发生变异从而导致的个体间核苷酸序列的差异。主要包括 单核苷酸多态性(single nucleotide polymorphism,SNP)和 串联重复序列多态性(tandem repeats polymorphism)。 SNP-由基因组DNA上的单个碱基的变异引起的DNA序列多态性。 据估计,人类基因组中每1kp就存在一个SNP位点,共有约300万个之多,是人群中个体差异最具代表性的DNA多态性。 相当一部分SNP还直接或间接与个体的表型差异、对疾病的易感性或抵抗能力、对药物的反应性等相关。 大多数SNP位点十分稳定,人类85%的SNP是共有的。 高度重复序列中的无间隔反向重复序列很容易形成限制性内切酶识别位点,也很容易因为突变产生或是失去一个酶切位点,可以造成 限制性片段长度多态性 (restriction fragment length polymorphism, RFLP).真核基因组存在多基因家族与假基因 :多基因家族 (multi gene family):由某一祖先基因经过重复和变异所产生的一组基因。 假基因 (pseudo gene):与某些有功能的基因结构相似,但不能表达有功能的基因产物的某些基因。 多基因家族大致可分为两类: 一个基因家族的不同成员成簇地分布在不同染色体上,但核酸序列高度同源,编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。 基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内,这种分布方式与DNA复制时需要大量的组蛋白有关。 假基因的产生有两种方式:由突变引起的基因序列变化而失去功能,这样产生的假基因带有内含子,称为常规假基因(conventional pseudogene)。mRNA经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,称为已加工的假基因(processed pseudogenes)。真核生物细胞器基因组:真核生物有两类细胞器能携带遗传物质:线粒体和叶绿体。这些遗传物质独立于细胞核基因组外,能够自行复制和表达,又称为染色体外基因组。 线粒体基因组编码其自身蛋白质合成体系的某些成员,如rRNA和tRNA等,以及呼吸链中的某些成员,如ATP酶、NADH还原酶、细胞色素氧化酶复合体中的某些组分。其它成员由细胞核基因组编码。 高等动物线粒体基因组具有独特的特点:母系遗传。子代线粒体基因组来自母亲,父系的线粒体基因组在精卵结合时一般不能进入卵细胞。 线粒体DNA损伤后不易修复,突变率较高,可能与衰老及某些疾病有关。遗传密码与通用遗传密码存在差别,如UGA(终止密码子)编码Trp,AGA/AGG(Arg)为终止密码子等。 基因组学(Genomics):对生命有机体全基因组进行序列分析和功能研究的学科。 结构基因组学:目的是在生物体的整体水平上测定出全部蛋白质分子、蛋白质蛋白质、蛋白质与其他生物分子复合体的三维结构。 基因定位克隆:利用微卫星和SNP全基因组扫描来搜索与疾病性状紧密相关的位点,从而确定疾病相关基因的位置并进一步获得克隆。 功能基因组学:根据已有基因的功能推测基因组中具有相似结构的基因的功能,通过实验手段验证。有效的方法有定点突变、基因敲除(knock-out)和RNA干扰及过量表达技术等。 第3章 蛋白质组学蛋白质是一种复杂的有机生物大分子,它们是生命活动的实际执行者。几乎所有的生物催化剂-酶,都是蛋白质。构成细胞骨架和动物大部分结构的纤维物质也是蛋白质;胶原蛋白和角蛋白组成了皮肤,毛发和软骨;肌肉大部分也是由蛋白质组成。蛋白质由一个一个的氨基酸首尾相接形成肽链,肽链再折叠形成一定空间结构。蛋白质组(proteome):指由一个基因组,或一个细胞、组织表达的所有蛋白质。蛋白质组学(proteomics):以蛋白质组为研究对象,分析细胞内动态变化的蛋白质组成成分、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,在整体水平上研究蛋白质的组成与调控的活动规律。 功能蛋白质组:细胞在某一阶段或与某一生理现象相关的所有蛋白质。差异蛋白质组:不同种类或状态下各种样本之间蛋白质组的区别与变化。多样-蛋白质数目大大超过基因数目。可变-蛋白质随时间与空间变化。基于凝胶的工作流程是目前使用的较为广泛的、发展最为成熟的工作流程。样品制备:样品来源:细胞、组织、体液等。可采用全蛋白;或进行预分级(线粒体、高尔基体、叶绿体、膜蛋白、核蛋白等)-提高低丰度蛋白质的上样量及检测灵敏度。尽可能扩大蛋白质的溶解度和解聚,以提高分辨率。样品分离:双向凝胶电泳(two-dimensional electrophoresis,2-DE):利用蛋白质的等电点与分子量差异分离之。2-DE 的缺点:难以有效分离极酸、极碱性蛋白质,极大、极小蛋白质,及低丰度蛋白质。胶内酶解过程费时、费力,难以与质谱实现自动化联用。第一向:等电聚焦 IEF;第二向:SDS-PAGE。染色方法:考马斯亮蓝染色;银染(不含戊二醛);荧光染色(Cy3,Cy5),放射性同位素标记等。新型非凝胶技术:液相色谱法(liquid chromatography, LC)对在双向电泳中难以分离鉴定的高分子量、低分子量、极酸性、极碱性和疏水性强的蛋白进行有效的分离鉴定。LC-MS/MS:液质联用技术。微量测序(microsequencing):N-末端Edman降解:经凝胶分离的蛋白质直接印迹在PVDF膜或玻璃纤维膜上N末端氨基酸残基经苯异硫氰酸酯修饰从多肽链上切下修饰的残基再经层析鉴定余下的多肽链被回收再进行下一轮降解循环。 缺点:过程缓慢,消耗大,试剂昂贵。质谱分析(Mass spectrometry):基本原理:样品分子离子化后,根据离子间质荷比(m/z)差异来分离并确定样品分子量。主要质谱类型:MALDI-TOF MS: 基质辅助激光解吸/电离飞行时间质谱 (Matrix-assisted laser desorption/ionization time of flight mass spectrometry)利用固体基质分子均匀包埋样品分子,在激光照射下,基质分子吸收激光能量而蒸发,携带样品分子进入气相,进一步将能量传递给样品分子,从而实现样品分子离子化。MALDI 最大的特点是离子电荷通常为1-2个,而不象ESI中为多电荷离子,对分子质量较大的样品而言,不会形成复杂的多电荷图谱,因而对图谱的解析比较清楚。 ;ESI MS: 电喷雾质谱( electrospray ionisation mass spectrometry )待测分子溶解在溶剂中,以液相方式通过毛细管到达喷口。在高电压作用下形成带电荷的雾滴,随着雾滴中溶剂的蒸发,其表面电场随半径减少而增加,电荷密度不断变大,到达某一临界点时,样品以离子方式蒸发进入气相,从而实现离子化。ESI特点:没有直接的外界能量作用于分子,因此对分子结构破坏较少,是一种典型的“软电离”方式。可形成多电荷离子,因此在较小的m/z范围内可以检测到大分子质量的分子。采用电喷雾质谱目前可测定分子质量100kDa以下的蛋白质,最高可达150kDa。由于采用液相方式进样,可与蛋白质化学中常用的液相色谱联用,即液相色谱-电喷雾质谱 (LC-ESI MS)。在常规电喷雾质谱中,喷雾的过程易形成较大液滴,液滴中的样品分子在离子源就不能完全离子化从而降低了样品的利用率和灵敏度。鉴定与注释蛋白质的路线:通过肽指纹图谱(peptide mass fingerprint, PMF)和数据库搜寻匹配通过检测样品中部分肽段的二级质谱信息或氨基酸序列标签和数据库搜寻匹配蛋白质数据库:目前应用最普遍的数据库是NRDB和dbEST 数据库。NRDB 由SWISS-PROT 和GENPETP等几个数据库组成;dbEST是由美国国家生物技术信息中心(NCBI)和欧洲生物信息学研究所(EBI)共同编辑,包括大量肽序列标签(PST)。SWISS-PROT(http:/www.expasy.org)拥有目前世界上最大的蛋白质组学数据库。PMF或二级质谱匹配检索常用搜索引擎-MASCOT()抗体芯片:可用于研究在不同生理状态或病理状态下蛋白水平的量变。优点:微型化,集成化,高通量化。如肿瘤标志物抗体芯片等。常用荧光标记:Cy5和Cy3等。酵母双杂交系统(Yeast two-hybrid system):典型的真核转录因子都含有二个结构域: DNA结合结构域(DNA binding domain,DNA-BD)和转录激活结构域(activation domain,AD)。二个结构域功能上相互独立又互相依赖,只有结合才具完整活性。酵母双杂交系统利用杂交基因通过激活报道基因的表达探测蛋白蛋白的相互作用。 利用酵母双杂交技术筛选新的相互作用蛋白:1)DNA-BD + Bait protein;2)AD + cDNA文库的基因。将阳性反应的酵母菌株中的 AD-LIBRARY载体提取分离出来,从而对载体中插入的文库基因进行测序和分析,研究与已知基因在生物学功能上的联系。第4章 基因工程基因工程(gene engineering):又称为重组DNA技术,是指将外源基因通过体外重组后导入受体细胞,并使其能在受体细胞内复制和表达的技术。分子克隆(molecular cloning):是指在体外将制备的DNA片段与载体重组,然后导入受体细胞,并在受体细胞中复制、扩增,以获得该DNA分子的大量拷贝的技术。第一节 工具酶一、限制性核酸内切酶(restriction endonuclease, RE)是一类能识别和切割双链DNA特定核苷酸序列的核酸水解酶。主要用途:1)在分子克隆过程中切割DNA以获取目的基因片段、切割载体形成切口,使目的基因能插入载体。2)分析限制性片段长度多态性(RFLP),用于遗传病的诊断,法医DNA指纹分析等。3)用于构建DNA的物理图谱、基因定位及DNA同源性分析等。类酶识别序列特点回文结构(palindrome),切口 :平端切口、粘端切口二、DNA聚合酶 1、DNA聚合酶和Klenow片段 DNA-pol是单一肽链的多功能酶,分子量为103kd,它具有3种酶活性:1)53聚合酶活性;2)35核酸外切酶活性;3)53核酸外切酶活性。 Klenow片段的主要功能有:1)补齐双链DNA的3末端,同时可使3末端DNA标记同位素;2)在cDNA克隆中,合成cDNA第二链;3)DNA序列分析。 2、Taq DNA聚合酶:一种耐热的DNA聚合酶,分子量为65 kd,最佳作用温度是7080,Taq酶具有5?3? 聚合酶活性和依赖于聚合作用的5?3?外切酶活性。Taq DNA聚合酶可用于DNA测序及通过PCR对DNA分子的特定序列进行体外扩增。3、逆转录酶 依赖RNA的DNA聚合酶,它以RNA为模板、4种dNTP为底物,催化合成DNA,其功能主要有:1)逆转录作用;2)核酸酶H的水解作用;3)依赖DNA的DNA聚合酶作用。4、末端脱氧核糖核苷酰转移酶 分子量为60 kd,在二价阳离子存在下,催化脱氧核糖核苷酸转移到单链或双链DNA分子的3末端-OH上。功能主要有:1)在载体或目的基因3末端加上互补的同质多聚尾,形成人工粘性末端,便于DNA重组连接。2)用于DNA3末端的同位素探针标记。1)底物是单链DNA或有3?突出末端的双链DNA,需要Mg2+。2)底物是平端或3?凹端的双链DNA,需要Co2+。 三、 DNA连接酶 大肠杆菌DNA连接酶和T4 DNA连接酶两种类型,分子量分别为7500和6000,两者的辅基不同,前者需NAD+,后者需ATP。它们催化的反应也不尽相同,大肠杆菌DNA连接酶只能连接粘性末端,而T4DNA连接酶既能连接粘性末端,又能连接平末端。 四、 碱性磷酸酶 催化去除DNA、RNA或dNTP上的5?-磷酸基团,其主要用途有:1)除去DNA片段上的5?磷酸,以防自身连接。2)在使用T4多核苷酸激酶和32P同位素标记前,除去RNA或DNA上5?端的磷酸。五、 核酸酶S1 核酸酶S1可水解双链DNA、RNA或DNA-RNA杂交分子中的单链部分。其主要作用有:除去粘性末端以产生平末端;除去cDNA合成时形成的发夹结构;分析RNA的茎环结构和DNA-RNA分子的杂交情况。功能:水解双链DNA、RNA或DNA-RNA杂交体中的单链部分。载体(vector):指能携带外源DNA片段导入宿主细胞进行扩增或表达的工具。载体的本质为DNA。制备的目的基因或外源性DNA片段必须与合适的载体连接形成重组体,才能进入受体细胞并进行复制和表达。载体包括克隆载体和表达载体。常用的载体有:质粒、噬菌体、粘粒、酵母质粒和病毒等。载体大都经过改造,如质粒改造后携带某些选择性标记和克隆位点的遗传信息;噬菌体改造后只保留同一种限制酶的单个或两个切点。在常用的克隆载体中加入一些与表达调控有关的元件(DNA序列)即为表达载体,它不仅可携带外源基因片段进入宿主细胞,而且可在宿主细胞中表达外源基因。载体应具备的特征:能自我复制并具较高的拷贝数。分子量一般<10Kb。带有遗传筛选标记。有适当的限制酶切位点,便于外源基因的插入和筛选。载体上具有多个限制酶的单一位点(即在载体其他部位无这些酶的相同位点)称为多克隆位点。一、克隆载体 能将载体外源基因在受体细胞中复制扩增并产生足够量目的基因的载体称为克隆载体。(一)质粒载体 质粒(plasmid)是指细菌染色体以外的小分子环状双链DNA,能自我复制和表达其携带的遗传信息。主要用途:用于保存和扩增<2Kb目的DNA。构建cDNA文库。目的DNA的测序。作为核酸杂交时的探针来源。pBR322质粒是由一系列大肠杆菌质粒DNA通过DNA重组技术构建而成的双链克隆载体,长为。它含有一个能保证高拷贝自我复制的复制起始点(Ori),并装有四环素抗性(Tetr)基因和氨苄青霉素抗性(Ampr)基因供菌落筛选。在这两个抗性基因中分别含有BamHI和PstI等限制酶的单一酶切位点,用于插入外源DNA片段。如有外源基因的插入,会导致这些标志性基因的失活。pUC系列载体是由pBR322质粒和M13噬菌体重组构建而成的双链DNA质粒载体。pUC18和pUC19质粒长约,除多克隆位点互为相反方向排列外,其它序列均相同。PUC质粒系列还包括pUC8、pUC9和pUC118、pUC119,它们的区别在于MCS的限制酶识别位点数目不同,而每一对pUC质粒的MCS中限制酶识别位点数目相同、顺序相反。pUC质粒含Ampr,可供菌落筛选。载体中装入一个来自大肠杆菌乳糖操纵子的DNA片段(lacZ基因),该基因编码-半乳糖苷酶氨基端的一个片段,IPTG可诱导此片段合成,而此片段能与宿主细胞所编码的缺陷型-半乳糖苷酶实现基因内互补(-互补),形成完整的-半乳糖苷酶。-半乳糖苷酶能催化指示剂底物5-溴-4-氯-3-吲哚-D-半乳糖苷(X-gal)形成蓝色菌落。pUC载体的lacZ基因中含有MCS,当外源基因插入MCS,lac-肽基因阅读框架被破坏,细菌内将无-半乳糖苷酶活性,菌落呈白色(即半乳糖苷酶的蓝白斑筛选实验)。(二)噬菌体载体 噬菌体(bacteriophage,phage):指感染细菌的病毒。按其生活周期分为两种类型:溶菌性噬菌体:指噬菌体感染细胞后,连续增殖,直到细菌裂解,释放的噬菌体又可感染其它细菌。溶原性噬菌体:指噬菌体感染细胞后,可将自身的DNA整合到细菌的染色体中去,和细菌染色体一起复制。噬菌体 野生型的噬菌体是线性双链DNA,全长,其中60%(约30Kb)是溶菌生长所必需,中间40%的区域为非必需,可被外源DNA片段代替而不影响噬菌体的生存。噬菌体5末端含12核苷酸的互补单链顺序,是天然的粘性末端,称为cos位点,噬菌体感染宿主菌后,其粘端通过碱基配对而结合,形成环状DNA分子。重组噬菌体的分子量必须在野生型噬菌体的75%105%之间。重组噬菌体筛选标记:外源基因插入型:蓝白斑(LacZ)筛选外源基因置换型:噬菌斑数目(red和gam基因,转染率高1001000倍)。用途:用作一般的克隆载体。用于构建基因组或cDNA文库(<22Kb)。用于抗体库或随机肽库的构建。核酸的序列分析。M13噬菌体 含一约的单链(正链)闭环DNA分子。M13噬菌体在细菌内呈溶源状态生长,成熟的子代噬菌体中只有一条含外源DNA的链(负链)。改造过的M13噬菌体引入了带有大肠杆菌LacZ的调控序列和N端部分氨基酸的编码信息以及多克隆位点序列,因此也可用蓝白斑筛选重组体。M13噬菌体载体主要用于目的DNA的测序和单链放射性探针的制备,克隆的外源DNA一般<1Kb。 M13噬菌体特点:野生型M13噬菌体为左右的闭环正链DNA分子。克隆的外源基因片段<1kb。M13噬菌体能以单链和双链两种方式存在,可用于感染(经包装的单链DNA)和转化(双链DNA)。M13中引入的多克隆位点,正好插入LacZ基因内,可利用蓝白色噬菌斑筛选重组体。M13噬菌体只降低宿主细胞的生长速度,而不溶解宿主细胞(呈溶源状态生长,故可从细菌培养液中获得噬菌体,制备单链DNA)。(三)粘性质粒(cosmid) 组成:质粒复制的起始位点(ORI)。携带抗药基因。用于插入目的基因的单一酶切位点。噬菌体的cos位点。特点:粘粒(粘性质粒)载体大小为46Kb,而插入外源基因长达4050kb。加入噬菌体头部和尾部蛋白,可将粘粒包装成类似于?噬菌体的具感染能力的颗粒,容易进入大肠杆菌。粘粒进入细菌后则完全失去噬菌体的功能,而表现质粒的特性。用途:克隆大片段DNA;构建基因组文库。(四)酵母细胞中克隆基因常用载体 酵母人工染色体(yeast artificial chromosome,YAC)是利用酵母染色体DNA和大肠杆菌pBR322改造而成,可以插入长达1000Kb的外源DNA片断。根据其复制方式不同分为三型:整合型(YIP)、复制型(YRP)和附加体型(YEP)载体,YRP中插入酵母着丝粒区,构成酵母着丝粒质粒(YCP)载体。三类载体的共同特点:能在大肠杆菌中复制,并具有较高的拷贝数;含有在酵母细胞中便于选择的遗传标记;含有合适的限制酶切位点,以便插入外源基因。YIP和YCP载体能稳定遗传但都是单拷贝、转化率低,多用于遗传分析;而YRP和YEP载体对酵母具有很高的转化活性、拷贝数较高但稳定性差,后者较前者稳定,是基因克隆中常用的载体。 (五)动物细胞基因克隆的载体 已构建并经常使用的动物病毒克隆载体有:猿猴空泡病毒40(simian vacuolating virus 40,SV40)载体;腺病毒(adenovirus)载体;逆转录病毒(retrovirus)载体。二、表达载体 表达载体是指能将外源基因在受体细胞中有效转录和正确翻译的载体。外源目的基因在新宿主细胞中是否克隆成功,是通过鉴定克隆是否表达的方法来证实,即产生克隆基因所编码的蛋白质,其每个环节都至关重要。真核基因在原核细胞中表达需要有效转录及一系列调控元件,必须保证外源基因插入方向的正确性;受原核启动子的控制;必须能在大肠杆菌中有效转录和有效翻译。基因表达、合成有功能的蛋白质依赖于基因的有效转录、mRNA正确的翻译和翻译后加工。为了判断某一待测DNA序列的生物活性,常采用报告基因(reporter gene)方法。报告基因(reporter gene):是指处于待测基因下游并通过转录和表达水平来反映上游待测基因功能的基因,又称报道基因。(一)原核细胞表达载体 原核细胞的表达载体主要是大肠杆菌表达载体。外源基因在原核细胞中表达需要重要调控元件。大肠杆菌表达载体是在克隆载体的基础上导入表达系统调控元件:启动子核糖体结合位点克隆位点转录终止信号。1.启动子(promoter):如乳糖启动子(Lac)、色氨酸启动子(Trp)、Tac启动子(Trp-Lac)以及PL和PR启动子等。序列 终止子(terminator):一个基因的3末端有一特定的DNA序列,它具有被RNA聚合酶识别并停止转录的功能。该序列含有一段富含A/T和富含G/C的回文对称结构,终止子转录后形成的RNA具有茎环状局部二级结构。1)非融合型表达载体pKK223-3。2)分泌型克隆表达载体PINlll系统。3)融合型表达载体pGEX系统(二)哺乳动物细胞表达载体真核表达载体的真核表达元件有:启动子/增强子克隆位点终止位点和加polyA信号。1原核DNA序列:包括能在大肠杆菌中自身复制的复制子和抗药基因的筛选标记。2启动子:转录起始位点上游2530bp有富含AT的TATA框,TATA框的上游约100200bp处为上游启动子元件。3增强子(enhancer):是一类显著提高基因转录效率的顺式作用元件。4终止子和加polyA信号。三、穿梭载体 既能在原核细胞中复制、又能在真核细胞中复制,在原核和真核细胞分子克隆中均能应用的载体称为穿梭载体(shuttle vector)。(一)穿梭粘粒载体:穿梭粘粒载体能携带真核DNA片段在细菌内扩增,并通过转染进入哺乳动物细胞进行转录和表达。这类载体常用于研究目的基因表达调控的组织细胞特性以及它所编码蛋白质的功能,也可从粘粒基因组文库中筛选出特殊功能基因。(二)酵母穿梭质粒载体:酵母复制型载体是穿梭质粒载体,它由酵母DNA片段插入到大肠杆菌质粒中构建而成,除有细菌质粒复制子和抗药性标记外,还有酵母DNA片段提供的选择标记,同时又携带了自主复制顺序,由于该载体同时含有大肠杆菌和酵母的自主复制基因,故能在两种细胞中存在和复制。另外,由噬菌体、质粒与SV40病毒DNA元件也可构建成穿梭载体,Pac10重组病毒-质粒载体也是穿梭载体。 分子克隆的基本步骤 一、 目的基因的获取 (一)从基因文库中获取 目的基因:指被研究的某一基因或DNA序列,即需要克隆或表达的基因。基因组文库(genomic library,G-文库)是指含有某种生物全部基因随机片段的重组DNA克隆群。构建基因组文库时,先将原核或真核细胞染色体DNA提纯,通过机械或酶切使之成为一定大小的片段,将其与适当的载体相连接,经体外包装、转染细菌,得到一组含不同DNA片段的重组噬菌体颗粒。这个文库中含有基因组内全部基因片段,是一个贮存基因组全部序列的信息库,故称为G-文库。转染(transfection)是指以噬菌体、病毒或以它为载体构建的重组子导入细胞的过程。如以细胞全部mRNA经逆转录,制备出全套cDNA建库,则称为C-文库。(二)逆转录法 是应用得最多的获取目的基因的方法。但前提是目的基因的序列已知,至少部分已知。选用富含目的基因mRNA的细胞作为实验材料,有利于分离到目的基因。如胰岛素基因的mRNA主要存在于胰腺组织,血红蛋白基因的mRNA占网质红细胞总mRNA的50%90%。用此法得到的目的基因进行克隆可获得较完整的连续编码顺序,易在宿主细胞中表达及筛选。 (三)人工合成DNA片段 根据已知某种基因的核苷酸序列或某种基因产物的氨基酸序列,可推导出为该多肽编码的核苷酸短序列,再用DNA合成仪人工合成目的基因。此法适用于合成分子量较小的目的基因(100bp以内),如:人生长激素释放因子、血管加压素、干扰素、胸腺素及胰岛素原的基因等。(四)直接从染色体DNA中分离目基因 根据染色体DNA的限制性内切酶图谱,用适当的限制性内切酶切割染色体DNA、分离目的基因。本方法较适用于制备原核生物目的基因,其原因为:(1)真核细胞染色体DNA有丰富的内含子,它们在原核细胞中转录后不能被剪接。(2)真核细胞的基因多数为单拷贝,难以分离到足够量的目的基因。 二、 载体的选择 噬菌体和粘性质粒载体常用来构建基因组文库;构建cDNA文库和克隆较小DNA片段常用pUC系列等质粒;M13噬菌体则用于克隆一些待测的DNA序列。三、 目的基因和载体酶切与连接四、重组DNA导入受体细胞 细胞膜结构改变、通透性增加并具有摄取外源DNA能力的细胞称谓感受态细胞(competent cell)。以质粒DNA或以它为载体构建的重组子导入细菌的过程称为转化(transformation)。五、重组体的筛选和鉴定(一)遗传标记表型特征筛选 1.抗生素抗性标记筛选 因大多数质粒载体带有抗生素抗性标记的特征(如Ampr、Tetr等),当带有完整抗性基因的载体转化无抗性细菌后,被转化的阳性菌获得抗生素抗性基因而存活并形成噬菌斑,未转化菌不能存活,但应排除未重组的空载体。某些质粒载体如pBR322质粒中装有Ampr和Tetr抗性基因,在含四环素和氨苄青霉素的平皿上都能够生长的细菌只含有空载体,此筛选方法称为双抗生素对照筛选。2.-半乳糖苷酶基因失活筛选(蓝白斑筛选)3.营养标记选择: 当细胞生物合成途径中某个酶的编码基因失活后,该细胞成为营养缺陷型,如导入细胞的重组DNA能弥补缺陷的基因,那么,培养基中就不需补充有关的营养成分,由此可挑选出含重组DNA的阳性细菌。 (二)重组子结构特征的筛选1重组子大小鉴别筛选:从挑选的菌落中分别提取重组载体DNA和原载体DNA,用一种限制酶切消化后直接进行电泳,重组载体DNA因分子量较大而迁移率较小。2酶切鉴定:根据已知外源基因两端的酶切位点,分别用相应的两种内切酶进行切割,经琼脂糖凝胶电泳后,可根据DNA mark来分析插入DNA片段的分子量。3PCR筛选法。4核酸杂交技术筛选:将DNA的克隆片段或转化细菌平板转移至硝酸纤维素薄膜上,应用特异性的核酸探针对其进行原位杂交,可筛选出阳性克隆。另外,还可通过斑点杂交和Southern blot杂交技术筛选 。在分子生物学领域,利用基因工程技术,大肠杆菌体内的基因50%以上已被定位,其DNA序列已被测出,基因表达调控关系也基本搞清。在真核生物中,利用基因工程的理论和技术已发现上百种癌基因和209余种抗癌基因,它们分别是细胞增殖调控的正负信号。在发育生物学中精细胞的分化及受精过程所发生的变化,基因表达的发育调控的研究与基因工程技术的应用是密不可分的 基因工程的理论和技术对人类基因组计划的实现具有重大作用,将对人类基因组作图和测序,对于了解人类的全部基因构成,提供可资查的一个完美的基因信息库,也为认识人类遗传疾病和癌发病机理提供有价值的信息。 动植物基因工程 1.转基因动物与蛋白制药的生产 转基因动物可以用来代替发酵罐生产一些珍贵的蛋白质。它的原理是使外来基因在动物乳腺中表达,从乳液中提取所要的蛋白质。英国的药用蛋白公司用这种方法将转基因绵羊来试行生产人类抗胰蛋白酶因子,在每升羊奶中可取得35克这种蛋白质。 2.转基因动物与动物改良。 3.转基因动物与人类疾病治疗 。 4.转基因动物与基础生物学研究。5.转基因植物微生物基因工程和发酵工业 我国已有人干扰素、人白介素2、人集落刺激因子、重组人乙型肝炎疫苗、基因工程幼畜腹泻疫苗等多种基因工程药物和疫苗进入生产或临床试用。世