【精品】基因的定位与克隆(可编辑.ppt
基因的定位与克隆GenomicsEra一段一段DNADNA序列序列怎样研究基因的功能?怎样研究基因的功能?突变体Reveres geneticsIn human cell,the immunophilin protein(亲免蛋白)family,which play a role in immunoregulation and basic cellular processes involving protein folding and trafficking.Arabidopsis genome:52 genes have been found to encode putative immunophilins。To identify their functions,we can use reverse genetics-knock down/out,or over express the genes.Forward genetics正向遗传学有目的的寻找或创造突变体有目的的寻找或创造突变体 突变体遗传背景分析突变体遗传背景分析 基因定位克隆基因定位克隆What is a mutation?n突变突变(Mutation)是指DNA水平的可遗传的变异,不管这种DNA变异能不能导致可检测的表型或生化改变。突变产生的变异是自然选择的基础。可遗传的突变在群体中扩散从而产生多态性。n多态性多态性(Polymorphism)群体内同一DNA序列的两种或多种变异形式,统计表明:群体内任何两个生物个体平均每100010000个碱基对有一对有差别,这种差别就是多态性。获得突变体的方法获得突变体的方法:1.1 自发突变(少,尤其是有重要功能的基因)1.2 物理、化学诱变 1.3 插入突变法:T-DNA 插入法;转座子法 突变体AlistofsomesequencedeukaryoticgenomesOrganismTypeGenome sizeNumber of genes predictedOrganizationYear of completionArabidopsis thaliana拟南芥拟南芥119 Mb31,670(UniProt)31,670(UniProt)Arabidopsis Genome Initiative2000Oryza sativa水稻水稻420 Mb32-50,00032-50,000Beijing Genomics Institute,Zhejiang University and the Chinese Academy of Sciences2002Ostreococcus tauri绿藻绿藻12.6 Mb7,969(UniProt)7,969(UniProt)Laboratoire Arago2006Drosophila melanogaster果蝇果蝇165 Mb13,60013,600Celera,UC Berkeley,Baylor College of Medicine,European DGP2000Homo sapiens人人3.2 Gb20,251(UniProt)20,251(UniProt)Human Genome Project Consortium and Celera GenomicsComplete 2006到底是哪个基因突变而引起对应性状的改变呢到底是哪个基因突变而引起对应性状的改变呢?就需要进行图位克隆(?就需要进行图位克隆(map based cloning)西北大学(北校区)地址:中国西安太白北路229号基因图位克隆(map based cloning)基因定位基因定位基因精细定位基因精细定位测序基因克隆基因克隆基因确认基因确认互补实验Gene Mapping(基因定位)基因定位是指利用遗传标记,通过遗传作图的方法,基因定位是指利用遗传标记,通过遗传作图的方法,确定目的基因在染色体上的位置。确定目的基因在染色体上的位置。基因定位的前期条件突变的遗传背景清楚(单基因,显隐性等)突变物种有高密度遗传图谱(染色体连锁图谱),如需克隆基因还需物理图谱 遗传图谱遗传图谱(genetic map)(genetic map),即确定基因(或遗传标记)之间的遗传,即确定基因(或遗传标记)之间的遗传学距离,用学距离,用cM(centimorgen)cM(centimorgen)表示表示 物理图谱物理图谱(physical map)(physical map),即确定基因(或遗传标记)之间的绝对,即确定基因(或遗传标记)之间的绝对物理学距离,通常用物理学距离,通常用Mb(Mb(百万碱基对百万碱基对)或或Kb(Kb(千碱基对千碱基对)来表示来表示作图群体(F2,RI等)遗传背景分析:圆粒遗传背景分析:圆粒vs.vs.皱粒皱粒F0XF1XF2547418502.96:1X X2 2(3 3:1 1)=0.26 P =P =0.61 遗传图谱某一物种的遗传图谱(染色体连锁图谱),显示所知的基因和遗传标记的相对位置。基因或标记间的距离单位是cM,其遗传图的距离为1厘摩。(centimorgan,cM)交换值交换值(RF)(%)=重组型的配子数重组型的配子数/总配子数总配子数100%1cM=1重组值越大,两基因间的距离越远。重组值越大,两基因间的距离越远。一个基本的染色体连锁框架图要求一条染色体上的遗传标记平均不超过20cM。玉米高分辨率遗传图谱玉米高分辨率遗传图谱大豆大豆A2分子连锁群分子连锁群(molecular linkage group)遗传标记遗传标记(genetic markergenetic marker)性状标记性状标记 色泽,色泽,形态形态 细胞学标记细胞学标记 倒位,易位,倒位,易位,G/N/CG/N/C带带 生化标记生化标记 同功酶同功酶 分子标记分子标记 RFLPRFLP、RAPDRAPD、SSRSSR、AFLPAFLP、SNP SNP 基础基础基础基础-基因表达基因表达基因表达基因表达结果结果结果结果表现型表现型表现型表现型DNADNA碱基碱基碱基碱基序列变异序列变异序列变异序列变异形态标记n遗传学上稳定、可见的外部特征遗传学上稳定、可见的外部特征-遗传与环境、结构基因与调控基因综合作用的结果。遗传与环境、结构基因与调控基因综合作用的结果。l如穗形、芒长、穗长、粒色、穗形、矮秆、卷叶等。如穗形、芒长、穗长、粒色、穗形、矮秆、卷叶等。v特点:直观简单特点:直观简单l从基因型到表现型存在基因表达、调控、个体发育等从基因型到表现型存在基因表达、调控、个体发育等环节,表型差异有时难以反映基因型差异。环节,表型差异有时难以反映基因型差异。细胞学标记l染色体数目变异及结构变异,表现在染色体核型(数目、大小、随体、着丝点位置等)和带型(C带、N带、G带等)。l随着分带、细胞原位杂交等研究技术的发展,可在染色体水平揭示更多遗传变异。l特点:直观、快速而经济,但变异十分有限,当染色体数目形态相似时难以分辨。人类染色体核型图生化标记贮藏蛋白和同工酶n贮藏蛋白贮藏蛋白同工酶同工酶v特点:经济、方便、成本较低特点:经济、方便、成本较低v结构基因表达产物,对非结构基因无能结构基因表达产物,对非结构基因无能为力;所检测位点只是基因组一部分;为力;所检测位点只是基因组一部分;数量有限,有时受发育时期和环境影响。数量有限,有时受发育时期和环境影响。铁角蕨属植物铁角蕨属植物的同工酶分析的同工酶分析 分子标记分子标记本质是以核苷酸序列作为标记,来源于DNA水平的突变。能反映生物个体或种群间基因组中某种差异特征的DNA片段,它直接反映不同个体的基因组DNA间的差异。分子标记的特点分子标记的特点(1)直接以DNA的形式表现,在生物体的各个组织、各个发育阶段均可检测到,不受季节、环境限制,不存在表达与否等问题;(2)数量极多,遍布整个基因组,可检测座位几乎无限;(3)多态性高,自然界存在许多等位变异,无须人为创造;(4)表现为中性,不影响目标性状的表达;(5)许多标记表现为共显性的特点,能区别纯合体和杂合体。大豆大豆A2分子连锁群分子连锁群(molecular linkage group)分子标记的类型与发展分子标记的类型与发展 1.分子标记的类型分子标记的类型 基于杂交的分子标记基于杂交的分子标记,如RFLP(Restriction fragment length polymorphism,即限制性长度片段多态性)。基于基于 PCR的分子标记的分子标记,它又分为两类:RAPD(Random amplified polymorphic DNA)DAF(DNA amplification fingerprinting)SSCP(Single strand confirmational polymorphism)小卫星小卫星DNA(Minisatellite DNA)微卫星微卫星DNA(Microsatellite DNA),又称SSR(Simple sequence repeat)ISSR(Inter simple sequence repeat)AP-PCR(Arbitrary primer PCR)它主要有SCAR(Sequence characterized amplified region)STS(Sequence tagged site)基基于于PCR技技术术的的DNA扩扩增增方方法法 AFLP(Amplified fragment length polymorphism)AFLP是先酶切,再用特殊设计的引物进行扩增 CAPS(Cleaved amplified polymorphic sequence)CAPS是先扩增,再酶切扩增片段PCR与与酶酶切切相相结结合合的的方方法法基于 DNA序列和芯片的分子标记,如SNP(Single nucleotide polymorphism)。几种分子标记介绍几种分子标记介绍1.RFLP(Restriction Fragment Length Polymorphism):限制性片段长度多态性,为第一代多态性记。原理:原理:RFLPRFLP是由于染色体上单核甘酸突变或插入及缺失突变导是由于染色体上单核甘酸突变或插入及缺失突变导致限制性酶切位点的增加或减少,从而导致致限制性酶切位点的增加或减少,从而导致DNADNA酶切片酶切片段长度的变化,这种变化的检测通常是应用同位素或段长度的变化,这种变化的检测通常是应用同位素或酶联免疫标记探针进行检测。酶联免疫标记探针进行检测。RFLP原理示意图GTAGTCGATTGTCGAGAATTCGTCGGTGGTAAGCATCAGCTAACAGCTCTTAAGCAGCCACCATTC EcoRIEcoRI酶切位点单碱基突变导致RFLP多态性2 kb3 kb2 kb3 kb RFLPRFLP是由是由DNADNA一级水平的变异造成的。然而,如果一级水平的变异造成的。然而,如果DNADNA变异的位点不变异的位点不在内切酶位点,变异则很难被检测到,这个缺陷可以用增加内切酶的种类来在内切酶位点,变异则很难被检测到,这个缺陷可以用增加内切酶的种类来弥补。弥补。这在实际工作中,单一酶切产生的多态性极其有限,主要取决于亲这在实际工作中,单一酶切产生的多态性极其有限,主要取决于亲本材料的来源。正常情况下用到本材料的来源。正常情况下用到6 6到到8 8种酶来筛选多态性。不同的酶产生的多种酶来筛选多态性。不同的酶产生的多态性大不相同。态性大不相同。技术路线:不同个体不同个体DNA的提取的提取酶切酶切凝胶电泳分开凝胶电泳分开DNA片段片段转膜转膜 Southern杂交杂交 数据分析数据分析RFLP的特点A 不受环境条件和发育阶段的影响B 是共显性共显性的C 需要对探针进行标记,还要Southern 杂 交,耗时费力耗时费力D DNA需要量大,难以用于大规模的育种2.2.随意扩增多态性随意扩增多态性DNADNA标记标记RAPDRAPDRandom Amplified Polymorphismic DNA由单个短的随机序列引物(9nt)对基因组进行PCR扩增,当两个反向互补引物结合位点间距离满足PCR扩增条件,就可以产生扩增片段。RAPD扩增产物的多态性是由于引物结合位点或结合位点间发生了重排、缺失或突变导致扩增产物的缺失。原理原理基因组中存在或长或短的被间隔开的颠倒重复序列WMWMRAPD原理示意图电泳图3、简单重复序列标记、简单重复序列标记SSR(simple sequence Repeats)或者称为微卫星或者称为微卫星DNA(microsatellite DNA)n原理:原理:微卫星微卫星DNA是一种广泛分布于真核生物基因组中的串状是一种广泛分布于真核生物基因组中的串状简单重复序列,每个重复单元的长度在简单重复序列,每个重复单元的长度在15bp之间,常之间,常见的微卫星如见的微卫星如(TG)n、(GA)n、(AAT)n或或(GACA)n等,等,不同数目的核心序列呈串联重复排列,而呈现出长度多态不同数目的核心序列呈串联重复排列,而呈现出长度多态性。性。SSR座位两侧一般是相对保守的单拷贝序列,据此可设计座位两侧一般是相对保守的单拷贝序列,据此可设计引物,其关键是首先要了解引物,其关键是首先要了解SSR座位的侧翼序列座位的侧翼序列(Flanking Region),寻找其中的特异保守区。,寻找其中的特异保守区。GAGAGAGAGAGAGAGAGAGA GAGAGAGAGAGAGAGAGAGAABCABCSSR原理示意图技术路线技术路线:n建立DNA文库 n筛选鉴定微卫星DNA克隆 n测定这些克隆的侧翼序列 n设计特异性引物来扩增SSR序列 n经聚丙烯酰胺凝胶电泳、染色 n比较谱带的相对迁移距离,便可知不同个体在某个SSR座位上的多态性。SSR电泳图微卫星标记的优缺点:微卫星标记的优缺点:(1)微卫星DNA数量多且均匀分布在基因组中。(2)微卫星DNA具有丰富的多态性,并且微卫星位点检测可以显示纯合子和杂合子。(3)微卫星检测容易、重复性较好、省时,适合于进行自动化分析。优点优点n缺点:SSR标记的建立首先要对为微卫星侧翼序列进行克隆、测序 、人工合成设计引物以及标记的定位、作图等基础性究,因而其开发有一定的困难,费用也很高。SSR标记技术的应用n构建连锁遗传图谱n遗传多样性的研究n种质资源鉴定n分子标记辅助育种单核苷酸多态(SNP-single nucleotide polymophism)nSNP是由于单个核苷酸改变而导致的核酸序列是由于单个核苷酸改变而导致的核酸序列多态,即基因中的点突变。特点:多态,即基因中的点突变。特点:共显性共显性在基因组中的发生频率比较高在基因组中的发生频率比较高有些有些SNP位点还影响基因的功能位点还影响基因的功能nSNPs可大大丰富既有的连锁图可大大丰富既有的连锁图n成熟自动化技术,有望分析成千上万的成熟自动化技术,有望分析成千上万的SNPs常用基因组网址:常用基因组网址:拟南芥拟南芥:TheArabidopsisInformationResource(TAIR)http:/www.arabidopsis.org/水稻:水稻:RiceGenehttp:/www.gramene.org/大豆:大豆:SoyBasehttp:/129.186.26.94/玉米:玉米:MaizeDB,MaizeGDBhttp:/www.maizegdb.org/小麦:小麦:GrainGenehttp:/wheat.pw.usda.gov/棉花棉花:CottonDBhttp:/algodon.tamu.edu/htdocs-cotton/cottondb.htmln苜菽:Alfagenes http:/naaic.org/n大麦:大麦:BarleyDB-http:/ Http:/ http:/algodon.tamu.edu/sorghumdb.html通通过过遗遗传传图图谱谱的的构构建建,很很多多分分子子标标记记在在染染色色体体上上的的位位置置已已经经确确定定,因因此此只只要要确确定定基基因因与与分分子子标标记记之之间间的的连连锁锁关关系系,就就可可以确定基因在染色体上的位置。以确定基因在染色体上的位置。连锁分析(连锁分析(Linkage analysisLinkage analysis)方法方法 两点测交法(two-point testcross)是基因定位时两个基因间(或标记间)的遗传重组率或遗传距离。三点测交(three-point testcross)F0灰身长翅灰身长翅黑身残翅黑身残翅(BBVV)(bbvv)灰身长翅灰身长翅(BbVv)雌雌F1黑身残翅黑身残翅(bbvv)雄雄测交测交后代后代灰身长翅灰身长翅黑身残翅黑身残翅 灰身残翅灰身残翅黑身长翅黑身长翅(BbVv)(bbvv)(Bbvv)(bbVv)测交测交基因的连锁和互换现象基因的连锁和互换现象42%42%8%8%三点测交三点测交b,v,c/+,+,+x b,v,c/b,v,cb-v:16%b-c:9%b 9%c 8%v 17%重组率最大不超过50%1%重组率 =1cMc-v:8%作图群体的发展:作图群体的发展:作作图图群群体体是是基基因因定定位位中中不不可可缺缺少少的的试试验验材材料料。作作图图群体的基本要求是:群体的基本要求是:(1)双亲具有相对性状的差异;)双亲具有相对性状的差异;(2)双双亲亲应应具具有有较较高高程程度度的的多多态态性性,以以便便找找到到紧紧密密连锁的分子标记;连锁的分子标记;(3)作图群体的大小应符合要求;)作图群体的大小应符合要求;(4)作图群体中相对性状的分离应符合孟德尔规律。)作图群体中相对性状的分离应符合孟德尔规律。筛选可利用的标记筛选可利用的标记 通通过过现现有有的的遗遗传传图图谱谱的的,按按一一定定距距离离均均匀匀选选取取分分子子标标记记这这类类标标记记有有RFLP标标记记和和SSR标标记等。记等。1)亲亲本本多多态态性性的的分分析析,筛筛选选出出具具有有多多态态性的分子标记;性的分子标记;2)作图群体的标记基因型分析,找到与)作图群体的标记基因型分析,找到与目的基因连锁的分子标记。目的基因连锁的分子标记。AAaaAaP1 F1 P2基因初步定位基因初步定位 利用近等基因系(利用近等基因系(NIL):):由由于于近近等等基基因因系系除除目目的的基基因因外外,其其遗遗传传背背景景与与轮轮回回亲亲本本相相似似,利利用用近近等等基基因因系系作作基基因因定定位位确确实实是是理理想想的的材材料料。近等基因系通常用作亲本之一,用于发展作图群体。近等基因系通常用作亲本之一,用于发展作图群体。1)近近等等基基因因系系的的表表现现型型不不受受复复杂杂的的遗遗传传背背景景的的干干扰扰,其表现比较真实,能较真实地反映基因效应的大小。其表现比较真实,能较真实地反映基因效应的大小。2)利用近等基因系和轮回亲本一起做分子标记分析,)利用近等基因系和轮回亲本一起做分子标记分析,一旦筛选出多态性的分子标记,该标记就很可能与目的基一旦筛选出多态性的分子标记,该标记就很可能与目的基因连锁,从而减少连锁标记筛选的工作量。因连锁,从而减少连锁标记筛选的工作量。近等基因系的利用:近等基因系的利用:近近等等基基因因系系的的建建立立:近近等等基基因因系系的的建建立立通通常常采采用用连连续续回回交交的的方方法法进进行行。选选择择具具有有相相对对性性状状差差异异的的两两个个亲亲本本杂杂交交,然然后后用用带带有有隐隐性性性性状状的的亲亲本本作作轮轮回回亲亲本本回回交交。在在每每一一分分离离世世代代对对目目的的基基因因加加以以选选择择,经经过过回回交交7-8代代以以上上,才才能能选选育育成成近近等等基基因因系系。近近等等基基因因系系除除目目的的性性状状外外,其它性状应与轮回亲本相似。其它性状应与轮回亲本相似。混合池分析混合池分析(Bulk segregant analysis):混合池(混合池(bulk)分析是快速筛选出与目的基因连锁)分析是快速筛选出与目的基因连锁的分子标记的一种方法。这是的分子标记的一种方法。这是Michelmore RW,etal.(1991)首创的。)首创的。直接用直接用F2F2作图群体,创立类似近等基因系的基因组混合作图群体,创立类似近等基因系的基因组混合池,快速筛选出与目的基因连锁的分子标记。池,快速筛选出与目的基因连锁的分子标记。混合池的组成:混合池的组成:“混合池混合池”由作图群体中具有相同相对性状个体的由作图群体中具有相同相对性状个体的DNA组成。组成。在在F2F2代作图群体中,通常选择具有同一相对性状的代作图群体中,通常选择具有同一相对性状的10-20个个体的体的DNA组成一个混合池。组成一个混合池。这样,在一个作图群体中,两个相对性状各自组成一个混这样,在一个作图群体中,两个相对性状各自组成一个混合池。合池。理论上,两个不同相对性状的混合池除了目的基因的基因理论上,两个不同相对性状的混合池除了目的基因的基因型不同外,其余基因型是相同的。因此有些人把相对性状型不同外,其余基因型是相同的。因此有些人把相对性状的两个混合池称为的两个混合池称为“近等基因池近等基因池”。组成混合池的个体,。组成混合池的个体,应具有典型的表型。应具有典型的表型。BSABSA的作图群体:的作图群体:F2F2XXAAAaaaAAAAaaAaAaAaAaaaF1F2Bulk Segregant Analysis(cont.)Bulk AABulkAABulkaaBulk aaF2AaXAAaa混合池的利用:混合池的利用:在在实实际际利利用用中中,两两个个混混合合池池通通常常与与两两个个亲亲本本一一起起做做分分子子标标记记的的分分析析。当当两两个个亲亲本本的的带带型型有有差差异异,而而两两个个混混合合池池的的带带型型无无差差异异时时,表表明明该该标标记记与与目目的的基基因因不不连连锁锁;当当两两个个亲亲本本的的带带型型有有差差异异,而而两两个个混混合合池池的的带带型型也也有有相相应的差异时,表明该标记与目的基因可能存在连锁关系。应的差异时,表明该标记与目的基因可能存在连锁关系。AAaa P1 P2 AA aa分子标记与分子标记与A基无紧密连锁基无紧密连锁分子标记与分子标记与A基因紧密连锁基因紧密连锁or P1 P2 AA aa标记标记1标记标记2通过混合池的利用筛选出可能与目的基因存在连锁关通过混合池的利用筛选出可能与目的基因存在连锁关系的标记后,还要利用整个系的标记后,还要利用整个F2F2作图群体做连锁分析,才作图群体做连锁分析,才能确定它们之间的连锁关系。能确定它们之间的连锁关系。如目的基因与该标记连锁,因为标记位置已知,所以如目的基因与该标记连锁,因为标记位置已知,所以目的基因所在的位置也知道了。目的基因所在的位置也知道了。再利用更多的分子标记将目的基因锁定在尽可能小的再利用更多的分子标记将目的基因锁定在尽可能小的染色体区间。染色体区间。RM1RM2drawf1RM3RM43.8cM2.4cM2.4cM2.0cMCHR.6MarkerDist.(cM)目标基因所在区域的分子标记连锁图目标基因所在区域的分子标记连锁图精细定位扩大定位群体设计离目标基因更近的分子标记,并筛选在两亲本之间存在多态性的分子标记用筛选出的多态性标记引物检测定位群体,最终将目标基因锁定在一个较小的物理区间内目标基因所在染色体上相应区段的跨叠BAC克隆群候选基因的确定 方法(1)查阅相关资料,比较分析定位区间内基因的同源基因的功能,在其它物种是否引起相同或相似的表型,找到最有可能的候选基因;(2)进行mRNA水平的分析,看其表达在正常植株与突变体中是否发生了改变,如长度变化,表达量变化等;(3)进行序列测定,比较该基因在正常植株内与突变体内核酸序列和氨基酸序列是否发生了改变;(4)进行互补实验验证候选基因是否为目标基因。PWTPrnBWTBrnPWTPrnBWTBrnPWTPrnBWTBrn大豆根腐基因(大豆根腐基因(rn 1)的定位)的定位PWTPrnBWTBrnPWTPrnBWTBrnPWTPrnBWTBrn大豆根腐基因(大豆根腐基因(rn 1)的定位)的定位Gm18:52,486,656.52,486,889Gm18:52,465,638.52,465,835Gm18:55,407,008.55,407,229Gm18:56,453,661.56,453,904下一步,根据基因组序列设下一步,根据基因组序列设计更多的分子标记,把计更多的分子标记,把rn1缩小到缩小到150 Kb的区间,测的区间,测序,选出候选基因,通过互序,选出候选基因,通过互补实验等确定。补实验等确定。