基因图位克隆的策略与途径21768.docx
拟南芥基因克隆的策略与途径拟南芥(Arabidopsis thaliana)是一种模式植物,具有基因组小(125 Mbp)、生长周期短等特点,而且基因组测序已经完成(The Arabidopsis Genomic Initiative, 2000)。同时,拟南芥属十字花科(Cruciferae),具有高等植物的一般特点,拟南芥研究中所取得成果很容易用于其它高等植物包括农作物的研究,产生重大的经济效益,特别是十字花科中还有许多重要的经济作物,与人类的生产生活密切相关,因此目前拟南芥的研究越来越多地受到国际植物学及各国政府的重视。基因(gene)是遗传物质的最基本单位,也是所有生命活动的基础。不论要揭示某个基因的功能,还是要改变某个基因的功能,都必须首先将所要研究的基因克隆出来。特定基因的克隆是整个基因工程或分子生物学的起点。本文就基因克隆的几种常用方法介绍如下。1、图位克克隆Map-bbaseed cclonningg, aalsoo knnownn ass poosittionnal clooninng, firrst proopossed by Alaan CCoullsonn off thhe Uniiverrsitty oof CCambbriddge in 19886, Genne isoolatted by thiis mmethhod is bassed on funnctiionaal ggenees in thee geenomme hass a rellatiivelly staablee locci, in thee usse oof gennetiic llinkkagee anaalyssis or chrromoosommal abnnormmaliitiees oof ssepaaratte grooupss willl queeue intto tthe chrromoosomme of a speeciffic loccatiion, By connstrructtingg higgh-ddenssityy mollecuularr linnkagge mmap, too fiind mollecuularr maarkeers tigghtlly llinkked witth tthe aimmed genne, conntinnuedd too naarroow tthe canndiddatee reegioon andd thhen cloone thee geene andd too cllariify itss fuuncttionn andd bioocheemiccal mecchannismms.图位克隆(mmap-bassed cloonigg)又称称定位克隆隆(poosittoinnal clooninng),119866年首先先由剑桥桥大学的的Alaan CCoullsonn提出。用用该方法法分离基基因是根根据功能能基因在在基因组组中都有有相对较较稳定的的基因座座,在利利用分离离群体的的遗传连连锁分析析或染色色体异常常将基因因伫到染染色体的的1个具具体位置置的基础础上,通通过构建建高密度度的分子子连锁图图,找到到与目的的基因紧紧密连锁锁的分子子标记,不不断缩小小候选区区域进而而克隆该该基因,并并阐明其功功能和生生化机制制。用该方法分分离基因因是根据据目的基基因在染染色体上上的位置置进行的的,无需需预先知知道基因因的DNNA序列列,也无无需预先先知道其其表达产产物的有有关信息息。它是是通过分分析突变变位点与与已知分分子标记记的连锁锁关系来来确定突突变表型型的遗传传基础。近近几年来来随着拟拟南芥基基因组测测序工作作的完成成,各种种分子标标记的日日趋丰富富和各种种数据库库的完善善,在拟拟南芥中中克隆一一个基因因所需要要的努力力已经大大大减少少了(图图1)。 目目前完成成整个拟拟南芥的的图位克克隆过程程大约需需要一年年时间。在在这个过过程中,我我们从筛筛选突变变体开始始,逐渐渐找到和和表型相相关的基基因。这这和反向向遗传学学(revversse ggeneeticcs)的方法法正好相相反。图图位克隆隆能实现现,关键键在于全全基因组组测序计计划的完完成和各各种分子子标记的的发现。这这些数据据被储存存在专门门的数据据库中(表表1)(Luukowwitzz等, 220000)。表1 拟南南芥网络络资源网站网址Suppllemeentaal mmateeriaal ffor thiis ppapeerhttp:/ccarnnegiiedppb.sstannforrd.eedu/metthodds/pppsuuppll.httmlNottiinghham Stoock Cenntree(U.KK.)http:/nnascc.noott.ac.uk/Recommbinnantt Innbreed mmap http:/nnascc.noott.ac.uk/neww_rii_maap.hhtmllOhio Stoock Cennterr(U.SS.A.) http:/aaimss.cpps.mmsu.eduu/aiims/TAIR dattabaase*, hoomeppagee http:/wwww.araabiddopssis.orggRecommbinnantt Innbreed mmap(mirrrorr siite) http:/wwww.araabiddopssis.orgg/cggi-bbin/mapps/RRiinntroomappCAPS marrkerrs http:/wwww.araabiddopssis.orgg/abbouttcapps.hhtmllSequeencee taablee http:/wwww.araabiddopssis.orgg/cggi-bbin/mapps/SSeqttablle.pplSNP ccolllecttionn http:/wwww.araabiddopssis.orgg/SNNPs.htmmlCEREOON ccolllecttionn off poolymmorpphissms http:/wwww.araabiddopssis.orgg/ceereoonSSLP marrkerrshttp:/ggenoome.bioo.uppennn.eddu/SSSLPP_innfo/SSLLP.hhtmllTIGR, geenomme aannootattionns http:/wwww.tiggr.oorg/tdbb/atthl/htmmls/inddex.htmmlDatabbasee off Leer ssequuencces http:/wwww.tiggr.oorg/tdbb/attgennomee/Leer.hhtmllKasuzza DDNA Ressearrch Insstittutee, geenomme aannootattionns http:/wwww.kazzusaa.orr.jpp/kaaos/MIPS gennomee annnottatiionss http:/wwebssvr.mipps.bbiocchemm.mppg.dde/pprojj/thhal/SINS dattabaase of traanspposoon iinseertiionss http:/wwww.jicc.bbbsrcc.acc.ukk/saainssburry-llab/jonnathhan-jonnes/jjhhomee.httm*注:Thhe AArabbidoopsiis IInfoormaatioon RResoourcce (TAIIR)在拟南芥中中的图位位克隆,在在很大程程度上得得益于对对Coll-0生生态型测测序的完完成,因因为它是是在研究究拟南芥芥时最常常用的生生态型。实现基因图位克隆的关键是筛选与目标基因连锁的分子标记。实质上,分子标记是一个特异的DNA片段或能够检出的等位基因,对其有效地利用即可达到图位克隆基因之目的。迄今为止,已有几十种技术可用于分子标记的筛选(Wang等,2000)。其中最为常用的是简单序列长度多态性(SSLPs)和单核苷酸多态性(SNPs)。SSLP是是基于PPCR的的分子标标记,在在拟南芥芥基因组组中有较较多分布布,而且且是共显显性的,它它的检测测非常直直接,但但是我们们需要设设计引物物来检测测假定的的SSLLP标记记;对SSNPss标记的的检测也也比较直直接,它它是拟南南芥不同同生态型型之间基基因组中中的单个个核苷酸酸的差别别,这些些差别的的核苷酸酸通常位位于非编码区区域(PPeteers等等, 220033)。最最常见的的用于检检测SNNPs标标记的方方法主要要是剪切切扩增多多态性序序列(CCAPSS),它它也是基基于PCCR的。另另外,一一种更为为有效的的方法衍衍生的CCAPSS(dCAAPS)(Naam等, 119899; Miichaaelss 和 Ammasiino, 19998)可可把任何何已知的的点突变变作为分分子标记记,只要要在PCCR是引引入不配配对的引引物,使使扩增的的序列在在一个生生态型中中具有限限制性酶酶切位点点,而在在另一生生态型中中没有,以以形成多多态性。图位克隆法法随着相相关配套套技术(序序列数据据库、分分子标记记等)的的日渐成成熟,许许多拟南南芥及一一些农作作物的基基因已被被成功的的克隆(表表2)。表2 用图图位克隆隆方法得得到的拟拟南芥及及一些农农作物的的基因基因突变表型基因同源序序列AB13脱落酸不敏敏感玉米转录子子FID3降低亚油酸酸饱和度度细菌去饱和和酸酶AXR1生长素抗性性泛素N 端端活性酶酶ETR1乙烯抗性双因子调节节子ABI1脱落酸不敏敏感钙调蛋白磷磷酸化酶酶DET1黄化损伤反反应新核蛋白RPS2抗病新型富含亮亮氨酸的的蛋白酶酶RPM1抗病激酶RSW1纤维素合成成酶细胞色素PP4500 家系系ZLL调节中茎分分生细胞胚胎发发育蛋白白PRT1抑制胞间蛋蛋白降解解控制植物NN 端代代谢Tornaadoll植株短化IFL1正常的维管管束间纤纤维分化化受阻亮氨酸拉链链蛋白ARA1树胶醛糖激激酶活性性丧失半乳糖激酶酶基因家家族VTC2维生素C合合成不足足果蝇蛋白CCG35552,线线虫蛋白白C100F3.4(功功能未知知)AST种皮花青苷苷斑点花青苷生物物合成途途径中的的二氢黄黄酮醇-4-还还原酶本文拟对图图位克隆隆的研究究进展做做一介绍绍,以期期对植物物遗传育育种和分分子生物物学研究究有所帮帮助。2 图位克克隆的一一般过程程因为有了拟拟南芥的的基因组组序列和和高密度度的遗传传标记,图图位克隆隆过程就就变得相相对直接接。图22例举了了一种高高效的拟拟南芥图图位克隆隆方法。从从基于CCol-0和Ler遗传传背景的的突变体体出发,我我们有可可能在大大约一年年时间内内找出与与这个突突变相关关的基因因,这其其中主要要耗时间间的是五五个植物物(拟南南芥)的的生长周周期(我我们假定定每个周周期为两两个月)。作为作图过过程的第第一步,突突变体植植株将和和另外一一个生态态型(CCol-0或者者Ler)的的植株杂杂交。在在大多数数情况下下,用于于杂交的的突变体体植株是是作为父父本还是是母本是是没有关关系的。然然后播种种F1代种种子。在在F1代植植物的生生长过程程中,我我们就有有可能来来对其表表现型和和基因型型进行分分析。FF1代植植物的表表型的出出现或者者消失将将显示着着我们所所研究的的突变是是显性的的还是隐隐性的。最最好通过过对一些些标记的的分析来来确认FF1代植植物是杂杂合体,而而且在杂杂交过程程中我们们没有犯犯错误。当当然也有有必要确确认原来来的生态态型背景景。图2 图位位克隆过过程示意意图(JJandder等等, 220022)F1代植物物自交得得到F22代种子子,大约约播种6600个个个体以以进行突突变基因因的粗定定位(ffirsst-ppasss maappiing,图图2)。在在其生长长过程中中,我们们可确定定其表型型,大约约有1550个个个体被认认为是纯纯合体(在在隐性突突变的情情况下是是纯合突突变体,在在显性突突变的情情况下是是纯合野野生型)。然然后从这这1500个个体体的叶子子或者其其它组织织中制备备DNAA用于基基因型分分析。起起先用分分布于拟拟南芥五五条染色色体上的的25个标标记(相相邻的两两个标记记之间大大约相距距20 cM)进进行分析析,确定定突变基基因是和和哪个或或者哪几几个标记记是连锁锁的,然然后用三三点测交交的方法法来定义义一个包包含突变变基因的的大约220 ccM的遗遗传间隔隔。一旦旦这样的的一个遗遗传间隔隔被定义义之后,接接下来的的工作就就是引入入新的标标记把这这个间隔隔缩小到到大约44 cMM。一般般来说,利利用1550个F2代个个体是在在很大程程度上能能找到这这样一个个遗传间间隔的,距距离突变变基因最最近的两两个分子子标记将将作为侧侧面标记记而用于于下面的的进一步步分析。下一步我们们将播种种一个更更大的FF2代群群体用于于突变基基因的精精细定位位(fiine-ressoluutioon mmapppingg,图2)。最最终目标标是将包包含突变变基因的的遗传间间隔缩小小到400 Kbb甚至更更小(这这在拟南南芥中大大约是00.166 cMM)。显显然用于于作图的的F2代植植物越多多,就越越能精确确地定位位突变基基因。一一般需要要30000440000个F2代植植物个体体(包括括粗定位位时的6600个个F2代植植物个体体)来精精确地定定位突变变基因。但但是也有有很多图图位克隆隆过程用用了少于于30000个F2代植植物个体体就成功功地定位位了突变变基因(Lukowitz等, 2000)。但是这往往要冒因为作图群体不够大再一次种植F2代植物而延长整个作图过程的时间的风险。在这个大约约4 ccM的遗遗传间隔隔内找到到与突变变更紧密密连锁的的分子标标记,一一般情况况下能在在突变两两侧找到到相距小小于400 Kbb的两个个分子标标记。一一旦这样样的两个个分子标标记被找找到之后后,就可可以通过过测序来来找到突突变基因因。一种种有效的的方法是是设计PPCR引引物来扩扩增覆盖盖这400 Kbb的多个个重叠的的5000 bpp的片段段。将这这些片段段测序后后拼接起起来以得得到整个个40 Kb的的序列,然然后将它它与野生生型植物物(Cool-00或者Ler)的的序列进进行比对对,这就就可以找找到这个个区域中中的多个个基因。从从一系列列侯选基基因中鉴鉴定基因因是定位位克隆技技术的最最后一个个关键环环节。现现在最常常用的方方法是用用含有目目标基因因的大片片段克隆隆如BAAC克隆隆或YAAC克隆隆去筛选选cDNNA文库库,并查查询生物物数据信信息库,待待找出侯侯选基因因后,把把这些侯侯选基因因进行下下列分析析以确定定目标基基因:(1)精确确定位法法检查ccDNAA是否与与目标基基因共分分离;(2)检查cDNA时空表达特点是否与表型一致;(3)测定cDNA序列,查询数据库,以了解该基因的功能;(4)筛选突变体文库,找出DNA序列上的变化及与功能的关系;(5)进行功能互补实验,通过转化突变体观察突变体表型是否恢复正常或发生预期的表型变化。功能互补实验是最直接、最终鉴定基因的方法。利用新兴的RNA干扰(RNAi)也可有效地确定目的基因。同源克隆:生物的的种、属属之间编编码基因因序列的的同源性性高于非非编码区区的序列列,基于于此原理理,在其其他种属属同源基基因被克克隆的前前提下,构构建cDDNA文文库或基基因组文文库,然然后用已已知分子子高保守守序列制制备同源源探针,经经标记后后从相应应的文库库中筛选选阳性克克隆,并并经核酸酸序列分分析鉴定定所克隆隆的基因因,当然然在没有有全同源源探针的的情况下下,可以以使用部部分同源源探针来来筛选与与探针序序列相关关但不完完全相同同的基因因。图位克隆同源克隆转座子标签签 表达序列列标签(exppresssedd seequeencee taags, ESST)是是从一个个随机选选择的ccDNAA克隆进进行5端和3端单一一次测序序获得的的短的ccDNAA部分序序列, 代表一一个完整整基因的的一部分分。DbESTT,daatabbasee ESST 表表达序列列标签数数据库。1951年年Barrbarra MMcliintoock首首先在玉玉米中发发现了控控制元件件,后来来命名为为转座元元件或转转座子(traanspposoon)。转转座子是是基因组组中一段段可移动动的DNNA序列列,可以以通过切切割、重重新整合合等一系系列过程程从基因因组的一一个位置置“跳跃跃”到另另一个位位置。这这一元件件不仅可可用于分分析生物物遗传进进化上分分子作用用引起的的一些现现象,还还为基因因工程和和分子生生物学研研究提供供了强有有力的工工具,可可以在不不了解基基因产物物的生化化性质和和表达模模式的情情况下,分分离克隆隆植物基基因,即即转座子子标签(traanspposoon ttagggingg),又又称为转转座子示示踪法。其其原理是是利用转转座子的的插入造造成基因因突变,以以转座子子序列为为基础,从从突变株株的基因因文库中中筛选出出带有此此转座子子的克隆隆,它必必定含有有与转座座子序列列相邻的的突变基基因的部部分序列列,再利利用这部部分序列列从野生生型基因因文库中中获得完完整的基基因11。119844年,用用转座子子标签法法首先在在玉米中中分离了了broonzee基因,该该基因编编码了玉玉米花色色素合成成途径的的关键酶酶UUDP-葡萄糖糖类黄33-O-葡萄糖糖基转移移酶22。此此后还利利用转座座子标签签技术分分离了许许多植物物基因。 转座子可以以分为两两大类:以DNNA-DDNA方方式转座座的转座座子和反反转录转转座子(rettrottrannspoosonn)。第第一类转转座子可可以通过过DNAA复制或或直接切切除两种种方式获获得可移移片段,重重新插入入基因组组DNAA中。根根据转座座的自主主性,这这类元件件又可以以分为自自主转座座元件和和非自主主转座元元件,前前者本身身能够编编码转座座酶而进进行转座座,后者者则需在在自主元元件存在在时方可可转座,以以玉米的的Ac/Ds体体系为例例,Acc(Acctivvatoor)属属于自主主元件,DDs(DDisssociiatiion)则是非非自主元元件,必必需在AAc元件件存在下下才能转转座11。第第二类转转座子又又称为返返座元(rettropposoon)33,是是近年新新发现的的由RNNA介导导转座的的转座元元件,在在结构和和复制上上与反转转录病毒毒(reetroovirrus)类似,只只是没有有病毒感感染必须须的ennv基因因,它通通过转录录合成mmRNAA,再逆逆转录合合成新的的元件整整合到基基因组中中完成转转座,每每转座11次拷贝贝数就会会增加11份,因因此它是是目前所所知高等等植物中中数量最最大的一一类可活活动遗传传成分。目目前共发发现了33种类型型反转录录转座子子:Tyyl-ccopiia类,TTy3-gyppsy类类和LIINE(lonng iinteerspperssed nuccleaar CClemmentts)类类转座子子,前两两类是具具有长末末端重复复的转座座子,LLINEE类转座座子没有有长末端端重复。高高等植物物中的反反转录转转座子主主要属于于Tyll-coopiaa类,分分布十分分广泛,几几乎覆盖盖了所有有高等植植物种类类4。 克隆转座子子主要有有两条途途径:其其一,利利用抗体体识别或或cDNNA探针针从野生生型植株株中获得得表达量量降低或或不稳定定基因座座的序列列,再从从突变体体中分离离得到相相应的转转座子:其二是是根据序序列同源源性,在在基因组组的不同同位置分分离同一一家族的的转座子子成员。目目前已经经克隆的的植物转转座子约约1566种(来来自Geenbaank的的报告