遗传图绘制学习.pptx
结构基因组的研究策略结构基因组的研究策略第1页/共113页为何要绘制遗传图与物理图为何要绘制遗传图与物理图1)1)基因组太大,必需分散测序,然后将分散的顺 序按原来位置组装,需要图谱进行指导。2)2)基因组存在大量重复顺序,会干扰排序,因此 要高密度基因组图。3)3)遗传图和物理图各有优缺点,必须相互整合校正 第2页/共113页DNA测序有一个极大的局限性:即使是最精确的技术,在一个反应中也很难测出大于750bp的序列。这就需要将大分子分解为片段。第3页/共113页问题:分析基因组的重复区域时会发生错误。第4页/共113页 因此,必须首先建立一个基因组的图谱,通过因此,必须首先建立一个基因组的图谱,通过标明基因和其他显著特征的位置,为测序提供指导。标明基因和其他显著特征的位置,为测序提供指导。一旦得到了基因组的图谱,测序阶段可以采用以下一旦得到了基因组的图谱,测序阶段可以采用以下方法进行:方法进行:1.全基因组鸟枪法全基因组鸟枪法(whole-genome shotgun method)全基因组鸟枪法是一种快速获得真核基因组的方法全基因组鸟枪法是一种快速获得真核基因组的方法。2.克隆重叠群法克隆重叠群法(clone contig method):():(作图法测作图法测序,限制测序)。序,限制测序)。这种逐步测序的方法花时间多,但精确。这种逐步测序的方法花时间多,但精确。第5页/共113页克隆重叠群法:contig,指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。由上至下。直接鸟枪法:首先进行全基因组鸟枪法测序,再以基因组图的分子标记为起点,将鸟枪法DNA片段进行组装。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生的序列误排。由下至上第6页/共113页第7页/共113页全基因组鸟枪法测序和克隆重叠群法测序最后都必须将DNA序列回归到基因组图上,因此基因组图的绘制是基因组测序和组装的核心内容之一,是基因组全面测序的必要前提。传统上将基因组作图方法分为两类。1.遗传作图 2.物理作图第8页/共113页2.1 遗传图谱与物理图谱1)遗传作图(Genetic mapping):采用遗传学分析方法将基因或其它DNA序列标定在染色体上构建连锁图。这一方法包括杂交实验,家系分析。遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。2)物理作图(Physical mapping):采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。物理图的距离依作图方法而异,如辐射杂种作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对(bp,kb)。第9页/共113页2.1 基因组作图的方法通过通过遗传图谱遗传图谱,我们可以大致了解各个基因或,我们可以大致了解各个基因或DNADNA片片断之间的断之间的相对距离与方向相对距离与方向,如哪个基因更靠近着丝粒,如哪个基因更靠近着丝粒,那个更靠近端粒等那个更靠近端粒等遗传距离是通过遗传连锁分析获得的,使用的遗传距离是通过遗传连锁分析获得的,使用的DNADNA厘厘摩标志越多,越密集,所得到的遗传连锁图的分辨率就摩标志越多,越密集,所得到的遗传连锁图的分辨率就越高越高遗传图谱不仅是现阶段定位基因的重要手段,即使在人遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类类基因组全物理图谱建立起来之后,它依然是研究人类基因组遗传与变异的重要手段基因组遗传与变异的重要手段第10页/共113页2.2 遗传作图标记任何一类图谱都有可识别的标记。遗传图谱的标记是什么呢?标记1标记2标记3染色体上的基因和基因和DNADNA序列序列均可作为路标,路标具有物理属性,他们由特定的DNA顺序组成.路标位于染色体上的位置是固定的,不会更改的,因而提供了作图的依据第11页/共113页2.2.1 基因标记在经典遗传学中,研究一种性状的遗传必须要求同一性状至少2种不同的存在形式或称表型。起初只有那些能通过视觉区分的基因表型用于研究。最初的遗传图谱是在20世纪初针对果蝇等生物使用基因作为标记构建的。第12页/共113页2.2.1 基因标记表型(表型(phenotype)phenotype):一个遗传性状必须以两种替换形一个遗传性状必须以两种替换形式或表型存在才能用于遗传学分析式或表型存在才能用于遗传学分析等位基因(等位基因(alleleallele):):每种表型是由不同的等位基因控每种表型是由不同的等位基因控制制肉眼分辨的表型:肉眼分辨的表型:颜色、形状等。如用于果蝇遗传图颜色、形状等。如用于果蝇遗传图的构建的构建生化表型:生化表型:微生物遗传学研究微生物遗传学研究第13页/共113页2.2.1 基因标记人类的生化性状人类的生化性状ABOABO血型血型HLAHLA(人类白细胞抗原)(人类白细胞抗原)复等位基因(复等位基因(multiple allelesmultiple alleles):):人类白细胞抗原(人类白细胞抗原(HLAHLA)是最复杂最具多态)是最复杂最具多态性的体系,位于性的体系,位于6 6 号染色体号染色体HLA-DRBIHLA-DRBI(human leukocyte antigens-DRBIhuman leukocyte antigens-DRBI)基因位点至少有)基因位点至少有5959个等个等位基因位基因HLA-BHLA-B抗原编码位点有抗原编码位点有6060多个等位基因多个等位基因第14页/共113页ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因其特异性决定了血型的差别第15页/共113页基因是非常有用的标记,但并不是理想的。原因基因是非常有用的标记,但并不是理想的。原因:1.可用作标记的可用作标记的基因十分有限基因十分有限,许多性状都涉及,许多性状都涉及 多基因。多基因。2.高等生物基因组中存在高等生物基因组中存在大量的基因间隔区,大量的基因间隔区,遗遗 传图中留下大片的无标记区段。传图中留下大片的无标记区段。3.只有部分基因其等位基因成员可以通过常规实只有部分基因其等位基因成员可以通过常规实 验予以区分,因而产生的遗传图是不完整的。验予以区分,因而产生的遗传图是不完整的。2.2.1 基因标记第16页/共113页 基因之外的作图工具统称为基因之外的作图工具统称为DNA标记。与基标记。与基因标记一样,因标记一样,DNA标记必须有至少两个等位标记必须有至少两个等位基因才是有用的基因才是有用的。有三种类型的。有三种类型的DNA序列特序列特征可以满足这一要求:征可以满足这一要求:1.限制性片段长度多态性限制性片段长度多态性(restriction fragment length polymorphisms,RFLP)2.简单序列长度多态性简单序列长度多态性(simple sequence length polymorphisms,SSLP)3.单核苷酸多态性单核苷酸多态性(single nucleotide polymorphisms,SNP)2.2.2 DNA标记第17页/共113页遗传标记的发展:遗传标记的发展:第一代标记第一代标记 经典的遗传标记(蛋白质和免疫学的标记)经典的遗传标记(蛋白质和免疫学的标记)7070年代中后期,限制酶片段长度多态性(年代中后期,限制酶片段长度多态性(RFLPRFLP)第二代标记第二代标记 8585年,年,“小卫星序列小卫星序列(minisatelliteminisatellite)8989年,年,“微卫星序列微卫星序列(microsatellitemicrosatellite)第三代标记第三代标记 单核苷酸多态性标记(单核苷酸多态性标记(single nucleotidesingle nucleotide polymorphism polymorphism,SNPSNP)第18页/共113页7070年代发展起来的年代发展起来的DNADNA重组技术、重组技术、DNADNA克隆技术和克隆技术和DNADNA探针技术探针技术为拓展遗传图谱的构建途径创造了技术条件为拓展遗传图谱的构建途径创造了技术条件使人类基因定位的方法从使人类基因定位的方法从细胞及染色体细胞及染色体水平过渡到水平过渡到分子水分子水平平DNADNA水平的多态性标记位点作为绘制现代遗传图谱的主要水平的多态性标记位点作为绘制现代遗传图谱的主要界标,提高图谱的界标,提高图谱的 精确度、准确性。遗传图谱的绘制进入精确度、准确性。遗传图谱的绘制进入了一个崭新的时代了一个崭新的时代 现代遗传图谱的概念现代遗传图谱的概念由由Botstein DBotstein D等等(1980)(1980)首先提首先提出,在此基础上,限制性片段长度多态性(出,在此基础上,限制性片段长度多态性(RFLPRFLP)作为遗传图谱的第一代崭新标记得以问世作为遗传图谱的第一代崭新标记得以问世 。限制性位点限制性位点能够用作基因标记。广泛应用到基因组研能够用作基因标记。广泛应用到基因组研究中。基因或基因组可以用究中。基因或基因组可以用重叠的限制性片段重叠的限制性片段来作图。来作图。最终扩展到整个序列,构建连锁图谱最终扩展到整个序列,构建连锁图谱第19页/共113页同一物种的亚种、品系或个体间基因组DNA 受到同一种限制性内切酶作用而形成不同的酶切图谱的现象,称为限制性片段长度多态性(RFLP)。这是由于基因组DNA某一位点上的变异有可能引起该位点特异性的限制性内切酶识别位点的改变,包括原有位点的消失或出现新的酶切位点,致使酶切片段长度随之发生变化而产生。第20页/共113页最早发现的DNADNA分子标记RFLP:由于同源染色体同一区段DNADNA序列的差异,当用限制酶处理时,可产生长度不同的限制性片段RFLP:restriction fragment length polymorphism,限制性片段长度多态性第21页/共113页对RFLP的检测主要是用Southern杂交的方法进行基本流程:组织或细胞基因组DNA限制性内切酶消化琼脂糖凝胶电泳印迹转移至滤膜加入探针杂交洗膜放射自显影获得反映个体特异性的RFLP图谱。第25页/共113页RFLP标记的主要特点是:(1)遍布于整个基因组;(2)无表型效应,不受发育阶段及器官特异性限制(3)共显性,可区分纯合子和杂合子;(4)结果稳定、可靠;用途:RFLP主要用于群体水平和系统发育研究上.进行个体识别;绘制遗传图谱;目的基因定位;检测群体内或群体间序列差异程度;辅助育种等。自RFLP问世以来,已经在基因定位及分型、遗传连锁图谱的构建、疾病的基因诊断等研究中得到了广泛的应用。第28页/共113页共显性:(两个亲本的性状在一个个体中同时出现,没有显隐关系)第29页/共113页问题:1.克隆可表现基因组DNA多态性的探针较为困难2.DNA需要量大,实验操作较繁锁,检测周期长成本费用也很高。3.RFLP分子标记分布密度过于稀疏。现已逐步被其他类型分子标记所取代。RFLP是最早发现的分子标记,也被称为第一代分子标记。第30页/共113页2.简单序列长度多态性(SSLP)1)可变排列的简单重复序列,即重复次数不一,在染色体的同一座位重复序列拷贝数不同;2)SSLP的类型:小卫星序列(minisatellite),有时又称可变串联 重复(VNTR),重复单位较长。重复序列为16-100个核苷酸,主要分布在染色体端粒及着丝粒 微卫星序列(micrisatellite),或称简单串联重 复(STR),重复单位较短。重复序列只有2-6个核苷酸,分布在整个基因组。第31页/共113页microsatellite markermicrosatellite marker又称简单串连重复(又称简单串连重复(short short tandem repeattandem repeat,STRSTR),),最重要的优点是高度最重要的优点是高度多态性,提供的信息量相对很大;另外可用多态性,提供的信息量相对很大;另外可用PCRPCR技术使操作实现自动化,遗传图与物理图技术使操作实现自动化,遗传图与物理图研究中非常有用的工具研究中非常有用的工具2020世纪世纪8080年代后期年代后期,人们开始应用人们开始应用微卫星序列微卫星序列(microsatellite,MS)(microsatellite,MS)绘制图谱。绘制图谱。19941994年底,美、年底,美、法完成了以法完成了以RFLPRFLP及微卫星为标志的遗传及微卫星为标志的遗传图谱图谱.图谱包含了图谱包含了58265826位点,覆盖位点,覆盖4000cM4000cM,分辨,分辨率高达率高达0.7cM0.7cM19961996年法国报道了完全以微卫星年法国报道了完全以微卫星DNADNA标志构建的遗传连锁图,包含标志构建的遗传连锁图,包含23352335位点,位点,分辩率为分辩率为1.6cM1.6cM第32页/共113页微卫星序列(微卫星序列(SSR)第33页/共113页第34页/共113页共显性第35页/共113页如何检测SSR根据简单重复顺序两侧的序列设计引物,PCR,经聚丙烯胺凝胶电泳分辨.第36页/共113页SSR技术的优点是:(1)在基因组中随机分布,检测的多态性频率高;(2)PCR特异引物,重复性好;(3)共显性,操作相对简单。问题是:(1)SSR需要测序和设计引物,因而需要大量 的人力、物力和时间;(2)另外其种属特异性强,开发所需的费用高 昂,因此一些实验室进行了合作,共同开 发微卫星引物。第37页/共113页 利用SSR标记的关键是引物的设计对于已经进行基因组全序列测定的生物或遗传学研究比较经典的生物,可以直接从其基因组进行查找和利用有关程序进行引物的设计或利用别人已经发表的引物来进行实验;而对于没有基因组序列信息的生物,就需要进行有关引物的设计工作。第38页/共113页3.SNP(单核苷酸多态性单核苷酸多态性)SNP是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。第41页/共113页SNPSNP只涉及单个碱基的变异,这种变异可以由单个碱基的转换(包括C C与T T互换,G G与A A互换),或颠换(包括C C与A A、G G与T T、C C与G G、A A与T T互换)引起。点突变,位于密码子的摇摆位置,表现为沉默突变而被大量保留下来。大多数不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测在人类基因组中可达到300300万个,平均每10001000个碱基对就有一个数目多,覆盖密度大,被称为第三代分子标记第42页/共113页根据SNP在基因中的位置,SNP可分为:基因编码区SNP(coding SNP,cSNP)基因周边SNP(peripheral SNP,pSNP)基因间SNP(intronicSNP,iSNP)第43页/共113页从对生物的遗传性状的影响,基因编码区SNP cSNP又可分为两种:1.同义cSNP(synonymous cSNP):SNP引起的编码序列的改变并不影响其翻译的蛋白质的氨基酸序列;2.非同义cSNP(non-synonymous cSNP):指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能,这种改变常是导致生物性状改变的直接原因。第44页/共113页SNP标记可用DNA芯片技术检测:将不同的寡核苷酸固定在芯片上,标记待测DNA,一次就可检测很多SNP标记。尽管单一的SNP所提供的信息量远小于现在常用的分子标记,但SNP的数量极其丰富,并且可以自动化检验,因此其具有广泛的应用前景。SNP数量比微卫星标记数要高出几个数量级。第45页/共113页例如:34个SNP这种相邻的界标构成的单倍型(haplotype)就可以有816种:Haplotype:一条同源染色体上的等位基因或遗传标记所构成的组合。第46页/共113页大多数大多数SNPSNP位于位于非编码序列,不非编码序列,不影响基因功能。影响基因功能。有些有些SNPSNP位置靠位置靠近特定的基因,近特定的基因,可作为基因的标可作为基因的标志志。其它的其它的SNPSNP位于位于编码序列内,编码序列内,可可改变基因表达的改变基因表达的蛋白质蛋白质,从而影,从而影响人类健康。响人类健康。第50页/共113页多肽链是由氨多肽链是由氨基酸连接而成基酸连接而成的。氨基酸具的。氨基酸具有不同的化学有不同的化学性质。性质。多肽链须折叠多肽链须折叠成蛋白质的立成蛋白质的立体结构才能发体结构才能发挥正常的功能。挥正常的功能。如果多肽链中如果多肽链中一个或多个氨一个或多个氨基酸发生了改基酸发生了改变,则蛋白质变,则蛋白质折叠和功能可折叠和功能可能会发生改变。能会发生改变。第51页/共113页有些有些SNPSNP尽尽管位于管位于编码序编码序列内,列内,但并不但并不改变蛋改变蛋白质的白质的组成。组成。例:例:CUG-CUG-CUCCUC亮亮氨酸氨酸第52页/共113页有些有些SNPSNP会给会给蛋白质带来微蛋白质带来微小而无害的影小而无害的影响。响。例:例:GAUGAUGAG GAG 天东氨天东氨酸变成了谷氨酸变成了谷氨酸。两者都是酸。两者都是酸性氨基酸。酸性氨基酸。如果发生位置如果发生位置对蛋白质功能对蛋白质功能影响不大,结影响不大,结果就是无害的。果就是无害的。蛋白质还会发蛋白质还会发挥正常的功能。挥正常的功能。第53页/共113页有些有些SNPSNP会给会给蛋白质的功能蛋白质的功能带来有害的影带来有害的影响,称为变异。响,称为变异。例:例:GAUGAUGUU GUU 天东氨酸天东氨酸变成缬氨酸。变成缬氨酸。由于化学性质由于化学性质完全不同,会完全不同,会严重地影响到严重地影响到蛋白质的折叠蛋白质的折叠和功能。和功能。镰刀形红细胞贫血症血红蛋白基因血红蛋白基因中单个碱基的中单个碱基的改变导致谷氨改变导致谷氨酸被缬氨酸取酸被缬氨酸取代。变异的血代。变异的血红蛋白不能再红蛋白不能再携氧,导致疾携氧,导致疾病。病。第54页/共113页有些有些SNPSNP带来的带来的影响在一般情况影响在一般情况下不显现,只有下不显现,只有在身体暴露在致在身体暴露在致病因子时才显现。病因子时才显现。因为这些因为这些SNPSNP所所在的基因负责调在的基因负责调节有害因子的吸节有害因子的吸收,代谢,排泄收,代谢,排泄等。基因的微小等。基因的微小变化会影响人体变化会影响人体对疾病的易感性。对疾病的易感性。例:吸烟例:吸烟肺癌,肺癌,过量饮酒过量饮酒肝癌。肝癌。第55页/共113页当人吸烟时,当人吸烟时,致癌因子的致癌因子的前体进入肺前体进入肺部细胞内。部细胞内。激活蛋白激活蛋白会会将致癌因子将致癌因子的前体转变的前体转变成致癌因子。成致癌因子。致癌因子会致癌因子会被被解毒蛋白解毒蛋白变成水溶性变成水溶性物质并经尿物质并经尿排出体外。排出体外。第56页/共113页位于激活蛋白基位于激活蛋白基因内的因内的SNPSNP会影会影响激活蛋白的活响激活蛋白的活性。性。有些人的激活蛋有些人的激活蛋白活性超强,可白活性超强,可以在肺部产生大以在肺部产生大量的致癌因子,量的致癌因子,损害细胞的损害细胞的DNADNA导致癌症。导致癌症。有些人的激活蛋有些人的激活蛋白活性超弱,产白活性超弱,产生的致癌因子较生的致癌因子较少,患癌症的可少,患癌症的可能性较低。能性较低。第57页/共113页SNPSNP还会影响还会影响解毒蛋白的活解毒蛋白的活性。性。有些人的解毒有些人的解毒蛋白活性超强,蛋白活性超强,可以很快将致可以很快将致癌因子排出体癌因子排出体外。患癌症的外。患癌症的可能性较低。可能性较低。有些人的解毒有些人的解毒蛋白活性超弱,蛋白活性超弱,将致癌因子排将致癌因子排出体外的速度出体外的速度慢。患癌症的慢。患癌症的可能性较高。可能性较高。第58页/共113页在染料厂工作在染料厂工作的工人会经常的工人会经常接触芳胺,患接触芳胺,患膀胱癌的可能膀胱癌的可能性较高。性较高。肝脏中有两种肝脏中有两种酶可作用于芳酶可作用于芳胺。一种是胺。一种是解解毒酶毒酶,将芳胺,将芳胺转变成无毒物转变成无毒物质并排出体外。质并排出体外。另一种是另一种是激活激活酶酶,可将芳胺,可将芳胺转变成致癌因转变成致癌因子的前体,并子的前体,并转运至膀胱,转运至膀胱,可致膀胱癌。可致膀胱癌。第59页/共113页SNPSNP会影响会影响解毒酶的活解毒酶的活性。有些人性。有些人的解毒酶活的解毒酶活性较低,将性较低,将芳胺转变成芳胺转变成无毒物质的无毒物质的速度较慢。速度较慢。较多的芳胺较多的芳胺会被转变为会被转变为致癌因子。致癌因子。这些人患膀这些人患膀胱癌的可能胱癌的可能性较高。性较高。第60页/共113页疗效及副作用疗效及副作用的个体差异。的个体差异。控制药物的吸控制药物的吸收,转运,代收,转运,代谢,排泄等环谢,排泄等环节的蛋白节的蛋白SNPSNP。例:将药物转例:将药物转变成有效成分变成有效成分的蛋白及将药的蛋白及将药物转变成有毒物转变成有毒副产物的蛋白。副产物的蛋白。解释疗效及副解释疗效及副作用。作用。第61页/共113页SNPSNP数量数量众多,稳众多,稳定及易于定及易于检测。用检测。用作基因的作基因的标记。标记。如如SNPSNP位位于基因的于基因的附近并随附近并随基因一起基因一起遗传。发遗传。发现了现了SNPSNP就等于发就等于发现了基因。现了基因。第62页/共113页科学家科学家们正对们正对很多人很多人的基因的基因组进行组进行大规模大规模的测序,的测序,以找出以找出所有的所有的SNPSNP,并绘制并绘制SNPSNP的的图谱。图谱。第63页/共113页每个人都每个人都有他自己有他自己的的SNPSNP类类型。型。根据根据SNPSNP类型将一类型将一个大的人个大的人群分为小群分为小的群体。的群体。第64页/共113页不同不同SNPSNP类类型的人型的人对治疗对治疗的反应的反应不同。不同。将来,将来,在确诊在确诊后,根后,根据患者据患者SNPSNP类类型来确型来确定治疗定治疗方法。方法。第65页/共113页SNPSNP类型还类型还有助于发现有助于发现疾病基因。疾病基因。只在疾病患只在疾病患者上发现的者上发现的SNPSNP是疾病是疾病基因的标记。基因的标记。有的有的SNPSNP在在基因附近,基因附近,通过通过SNPSNP可可发现疾病基发现疾病基因。因。第66页/共113页SNPSNP类型还有类型还有助于发现患病助于发现患病的危险性。的危险性。例:在随机抽例:在随机抽取的取的100100正常正常人中,人中,8080人有人有SNP ASNP A,2020人人有有SNP BSNP B。而。而在在100100个肾癌个肾癌患者中,患者中,6060人人有有SNP ASNP A,4040人有人有SNP BSNP B。SNP BSNP B的人患的人患肾癌的危险性肾癌的危险性比比SNP ASNP A的人的人高。高。第67页/共113页通过通过SNPSNP图谱,研图谱,研究究SNPSNP与与疾病易感疾病易感性,治疗性,治疗有效性等有效性等的关系。的关系。生活方式生活方式的干预的干预(吸烟,(吸烟,饮酒)饮酒),选择适当选择适当疗法。疗法。第68页/共113页2.3 遗传作图的方法理论基础理论基础:采用一组分子标记构建遗传图:采用一组分子标记构建遗传图的方法主要依赖于的方法主要依赖于连锁分析连锁分析。基本方法基本方法:两点测验法和三点测验法:两点测验法和三点测验法第69页/共113页2.3 遗传作图的方法连锁分析是遗传作图的基础:连锁分析是遗传作图的基础:1905,Bateson,Saunder和和Punnett首创;首创;1911年年Morgan揭示了连锁分析的意义揭示了连锁分析的意义在同一条染色体上的基因间表现出在同一条染色体上的基因间表现出遗传连锁遗传连锁(Genetic linkage),因为它们都是在同一条长的因为它们都是在同一条长的DNA分子上分子上部分连锁与重组:部分连锁与重组:比利时细胞学家比利时细胞学家Janssens发现减数分裂时同源染色体的交换发现减数分裂时同源染色体的交换Sturtevant:2 个彼此靠近的基因之间因交换而分离的频率,个彼此靠近的基因之间因交换而分离的频率,要比相互远离的要比相互远离的2个基因之间发生分离的频率要小个基因之间发生分离的频率要小重组率则可成为测量基因之间相对距离的尺度,只要获得不重组率则可成为测量基因之间相对距离的尺度,只要获得不同基因之间的重组率,就可绘制一份基因位于染色体上相对同基因之间的重组率,就可绘制一份基因位于染色体上相对位置的地理图位置的地理图第70页/共113页第71页/共113页部分连锁与遗传作图构建遗传图谱的基本原理构建遗传图谱的基本原理真核生物遗传过程中会发生减数分裂,此过程中染色体要真核生物遗传过程中会发生减数分裂,此过程中染色体要进行重组和交换,这种重组和交换的概率会随着染色体上进行重组和交换,这种重组和交换的概率会随着染色体上任意两点间相对距离的远近而发生相应的变化。任意两点间相对距离的远近而发生相应的变化。根据概率大小,人们就可以推断出同一条染色体上两点间根据概率大小,人们就可以推断出同一条染色体上两点间的相对距离和位置关系。的相对距离和位置关系。正因为如此,我们得到的这张图谱也就只能显示标记之间正因为如此,我们得到的这张图谱也就只能显示标记之间的的相对距离相对距离。我们称这一距离。我们称这一距离(概率概率)为遗传距离为遗传距离(cM)(cM),由,由此构建的图谱也称为遗传图谱。此构建的图谱也称为遗传图谱。第72页/共113页连锁遗传图的做法一般以最左端的基因位置为一般以最左端的基因位置为0,如发现有新的基因在更左端的位,如发现有新的基因在更左端的位置时,把置时,把0点让给新基因,其余的基因座位作相应移动点让给新基因,其余的基因座位作相应移动由于较远的两基因之间发生偶数次交换,但没有出现重组类型,由于较远的两基因之间发生偶数次交换,但没有出现重组类型,所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率所以交换值要大于重组率。绘制连锁遗传图时,需根据重组率进行图距的校正进行图距的校正第73页/共113页遗传图的偏离重组热点:近端粒区、着丝点区特异基因区段(小鼠主要组织兼容性复合座位)性别影响:不同性别具有不同的重组热点第74页/共113页2.3.3 不同模式生物的连锁分析不同模式生物的连锁分析连锁分析分为连锁分析分为3大范畴:大范畴:1.有性杂交实验有性杂交实验 2.系谱分析系谱分析 3.DNA转移转移第75页/共113页杂交实验的连锁分析选择已知基因型的亲本,设计杂交方案,获得交配的选择已知基因型的亲本,设计杂交方案,获得交配的子代并分析其表型和基因型子代并分析其表型和基因型对于高等真核生物的常规连锁分析并不是直接检查配对于高等真核生物的常规连锁分析并不是直接检查配子,而是检测分别来自两个亲本配子融合形成的二倍子,而是检测分别来自两个亲本配子融合形成的二倍体基因型,即进行遗传杂交体基因型,即进行遗传杂交两点杂交和多点杂交两点杂交和多点杂交第76页/共113页两点杂交:常用测交方法分析子代基因型分离比测交:杂合体X隐性纯合体 子代表型逆推亲代交换率第77页/共113页多点杂交:三个位点分析双杂交子代基因型子代基因型观测数观测数推测的重组事件推测的重组事件ABC/abcabc/abc987无重组,均为亲代基因型aBC/abcAbc/abc51A和BC之间发生一次重组ABc/abcabC/abc63B和AC之间发生一次重组AbC/abcaBc/abc2发生两次重组,一次发生在C与A之间,一次发生在C与B之间第78页/共113页RFLP连锁图RFLP是第一种用于研究的是第一种用于研究的DNA标记(标记(David Bostein,1980)基本设想基本设想:由于同源染色体同一区段由于同源染色体同一区段DNA顺序的差异,用限制酶消化时,顺序的差异,用限制酶消化时,会得到长度各不相同的限制性片段。经过琼脂糖凝胶电泳分离,可直接显会得到长度各不相同的限制性片段。经过琼脂糖凝胶电泳分离,可直接显示不同个体同一位点示不同个体同一位点DNA组成的差异组成的差异由于限制酶的专一性,用不同的限制酶处理同一由于限制酶的专一性,用不同的限制酶处理同一DNA样品时,可以产生与样品时,可以产生与之对应的不同限制性片断,从而提供大量位点多态性信息之对应的不同限制性片断,从而提供大量位点多态性信息第79页/共113页亲本:A1/B1和A2/B2,个体231;新组合:A1/B2和A2/B1,个体39交换率:39/(231+39)=14%;A与B相距14cM第80页/共113页人类遗传图谱的构建系谱分析作图v 人类不可能根据需要选择亲本,设计杂交组 合,构建分离群体。v 只能检测现存家庭连续几代成员的基因型。v 家系分析法。v 资料有限、必须借助于统计学方法。第83页/共113页系谱分析系谱分析法即对某家庭性状相关成员进行系谱分析法即对某家庭性状相关成员进行 统计,分析性状之间的连锁关统计,分析性状之间的连锁关系,通过重组率进行相关基因定位,这种方法又称系,通过重组率进行相关基因定位,这种方法又称家系分析法家系分析法(pedigree method)不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,不能进行有计划的遗传实验,只能收集家系成员的相关资料进行连锁分析,主要涉及人类和多年生树木主要涉及人类和多年生树木优势对数值(优势对数值(lod score)分析:)分析:lod值是基因连锁可能性的对数,用于判值是基因连锁可能性的对数,用于判定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。定所研究的两个标记是否在同一染色体上,换句话说就是基因是否连锁。如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理如果优势对数分析确定了连锁,然后可以提供最可能的重组频率程度。理想的情况是资料来自不同系谱想的情况是资料来自不同系谱第84页/共113页细菌的遗传作图转化(转化(transformation):):供体细胞释放的一段供体细胞释放的一段DNA(通常小于(通常小于50kb),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组),经受体细胞摄取后整合到基因组中,可借助抗性培养基筛选重组克隆克隆转导(转导(transduction):通过噬菌体将小片段通过噬菌体将小片段DNA从供体细胞转移到受从供体细胞转移到受体细胞体细胞接合转移接合转移(conjugation):两个细菌形成物理接触,两个细菌形成物理接触,DNA从供体转移到从供体转移到受体受体第85页/共113页细菌的遗传重组细菌的遗传重组第86页/共113页细菌遗传作图中采用的都是生化标记(如合成色氨酸的能力、对抗生素的敏感性等),隐性表型(如不能合成色氨酸)是可以互补的性状。基因转移在具有野生型等位基因的供体品系与具有隐性等位基因的受体品系之间进行,根据受体细胞是否获得基因指令的生化功能来监测转移的DNA是否进入受体细胞接合:根据野生型基因进入受体的时间表,可以确定基因所在的位置转导及转化:依据所研究的基因是否同时出现在受体细胞中,紧密连锁的基因总是有最高的机率被同时转移。第87页/共113页基因与分子标记的共分离共分离:共分离:如果限制酶多态性在基因组中自由发生,则如果限制酶多态性在基因组中自由发生,则有些会在特定基因附近产生。我们可以确定这样的限有些会在特定基因附近产生。我们可以确定这样的限制性标记,因为该标记与突变表型密切相关。如果比制性标记,因为该标记与突变表型密切相关。如果比较患病者的和正常人的较患病者的和正常人的DNA DNA 限制图谱,可能发现一限制图谱,可能发现一个特定的限制性位点通常出现个特定的限制性位点通常出现(或者丢失或者丢失)在患者在患者DNA DNA 中,原因是限制性标记与表型间中,原因是限制性标记与表型间100%100%相关。它暗示相关。它暗示限制性标记与突变基因距离很紧,以至于它们在重组限制性标记与突变基因距离很紧,以至于它们在重组中不能分离中不能分离第88页/共113页2.4 遗传图绘制2.4.1 人类遗传图 人类解剖图包括4张小图,包括了人类基因组计划的全部主要内容,它们分别是遗传图(连锁图)、物理图、序列图和转录图。人类遗传图有6000多个遗传标记作为路标,把基因组分成6000多个区域,只要以连锁分析的方法,找到某一表现型的基因与其中一种遗传标记邻近(即紧密连锁)的证据,就可以把这一基因定位于这一标记所界定的区域内。这样,如果想确定与某种已知疾病有关的基因,即可根据决定疾病性状的位点与选定的遗传标记间的遗传距离,来确定与疾病相关的基因在基因组中的位置。第89页/共113页人类疾病基因研究致病基因及相关基因的克隆在基因组学研究中占据着核心位置。对疾病的预防,诊断,治疗等有重要意义。人类基因组计划的直接动因是要解决包括肿瘤在内的人类疾病的遗传学基础问题。第90页/共113页人类疾病基因研究单基因病疾病基因研究:例如血友病。多基因病疾病基因研究:例如心脏病,糖尿病,癌症等。第91页/共113页单基因病疾病基因研究人类基因组计划使我们了解基因组序列。现在采用定位候选克隆方法 极大地提高了发现疾病基因的效率。第92页/共113页定位候选克隆 导致了遗传性结肠癌和乳腺癌等一大批单基因遗传病致病基因的发现,为这些疾病的基因诊断和基因治疗奠定了基础。第93页/共113页多基因病疾病基因研究比单基因病困难,目前疾病基因研究的重点。用比较基因表达谱的方法来识别疾病状态下基因的激活或抑制。癌肿基因组解剖计划(Cancer Genome Anatomy Project,CGAP)第94页/共113页癌肿基因组解剖学计划(Cancer Genome Anatomy Project,CGAP)1996年癌肿基因组解剖学计划开始。主要由美国癌症研究所(National cancer institute)开展。第95页/共113页 科学家们发科学家们发现一个正常细现一个正常细胞在经过一定胞在经过一定的分子水平的的分子水平的改变以后就会改变以后就会恶变。这样的恶变。这样的变化通常要数变化通常要数年才能完成。年才能完成。癌肿基因组癌肿基因组解剖学计划的解剖学计划的目的是为研究目的是为研究细胞恶变时发细胞恶变时发生的分子变化。生的分子变化。第96页/共113页癌肿基因癌肿基因组解剖学组解剖学计划研究计划研究在基因组在基因组内发生的内发生的变化。变化。第97页/共113页 在癌症细在癌症细胞中,基胞中,基因会发生因会发生突变,从突变,从而导致蛋而导致蛋白质表达白质表达异常。异常。这种变化这种变化会导致细会导致细胞恶变。胞恶变。第98页/共113页人类基因表达具有组织特异性。某一种组织细胞在一般情况下只表达特定的一组基因,称为表达谱。第99页/共113页通过比通过比较正常较正常组织与组织与癌变组癌变组织的表织的表达谱,达谱,可以发可以发现癌变现癌变组织基组织基因表达因表达的变化。的变化。第100页/共113页癌肿基因组解剖学计划通过测量mRNA水平来比较正常组织与癌变组织的表达谱。第一步骤分离mRNA。第101页/共113页第二步骤第二步骤将将mRNAmRNA转变为转变为cDNAcDNA。第102页/共113页第三步骤第三步骤创建创建cDNAcDNA文库。文库。将每一个将每一个cDNAcDNA都装都装入一个质粒,入一个质粒,并导入一个并导入一个E.coli E.coli 细胞细胞内。内。第103页/共113页第四步骤第四步骤分离单个分离单个cDNAcDNA。第104页/共113页第五步骤第五步骤cDNAcDNA测序测定测序测定polyApolyA附近大约附近大约400bp400bp的序列就的序列就可确认可确认cDNAcDNA。这样的序列成这样的序列成为为ESTEST(expressed expresse