遗传图绘制学习.pptx
《遗传图绘制学习.pptx》由会员分享,可在线阅读,更多相关《遗传图绘制学习.pptx(113页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、结构基因组的研究策略结构基因组的研究策略第1页/共113页为何要绘制遗传图与物理图为何要绘制遗传图与物理图1)1)基因组太大,必需分散测序,然后将分散的顺 序按原来位置组装,需要图谱进行指导。2)2)基因组存在大量重复顺序,会干扰排序,因此 要高密度基因组图。3)3)遗传图和物理图各有优缺点,必须相互整合校正 第2页/共113页DNA测序有一个极大的局限性:即使是最精确的技术,在一个反应中也很难测出大于750bp的序列。这就需要将大分子分解为片段。第3页/共113页问题:分析基因组的重复区域时会发生错误。第4页/共113页 因此,必须首先建立一个基因组的图谱,通过因此,必须首先建立一个基因组的
2、图谱,通过标明基因和其他显著特征的位置,为测序提供指导。标明基因和其他显著特征的位置,为测序提供指导。一旦得到了基因组的图谱,测序阶段可以采用以下一旦得到了基因组的图谱,测序阶段可以采用以下方法进行:方法进行:1.全基因组鸟枪法全基因组鸟枪法(whole-genome shotgun method)全基因组鸟枪法是一种快速获得真核基因组的方法全基因组鸟枪法是一种快速获得真核基因组的方法。2.克隆重叠群法克隆重叠群法(clone contig method):():(作图法测作图法测序,限制测序)。序,限制测序)。这种逐步测序的方法花时间多,但精确。这种逐步测序的方法花时间多,但精确。第5页/共
3、113页克隆重叠群法:contig,指相互间存在重叠顺序的一组克隆。根据重叠顺序的相对位置将各个克隆首尾连接,覆盖的物理长度可达百万级碱基对。在单个的重叠群中,采用鸟枪法测序,然后在重叠群内进行组装。由上至下。直接鸟枪法:首先进行全基因组鸟枪法测序,再以基因组图的分子标记为起点,将鸟枪法DNA片段进行组装。根据高密度的基因组图分子标记,检测组装片段是否处在正确的位置,校正因重复顺序的干扰产生的序列误排。由下至上第6页/共113页第7页/共113页全基因组鸟枪法测序和克隆重叠群法测序最后都必须将DNA序列回归到基因组图上,因此基因组图的绘制是基因组测序和组装的核心内容之一,是基因组全面测序的必要
4、前提。传统上将基因组作图方法分为两类。1.遗传作图 2.物理作图第8页/共113页2.1 遗传图谱与物理图谱1)遗传作图(Genetic mapping):采用遗传学分析方法将基因或其它DNA序列标定在染色体上构建连锁图。这一方法包括杂交实验,家系分析。遗传图距单位为厘摩(cM),每单位厘摩定义为1%交换率。2)物理作图(Physical mapping):采用分子生物学技术直接将DNA分子标记、基因或克隆标定在基因组实际位置。物理图的距离依作图方法而异,如辐射杂种作图的计算单位为厘镭(cR),限制性片段作图与克隆作图的图距为DNA的分子长度,即碱基对(bp,kb)。第9页/共113页2.1
5、基因组作图的方法通过通过遗传图谱遗传图谱,我们可以大致了解各个基因或,我们可以大致了解各个基因或DNADNA片片断之间的断之间的相对距离与方向相对距离与方向,如哪个基因更靠近着丝粒,如哪个基因更靠近着丝粒,那个更靠近端粒等那个更靠近端粒等遗传距离是通过遗传连锁分析获得的,使用的遗传距离是通过遗传连锁分析获得的,使用的DNADNA厘厘摩标志越多,越密集,所得到的遗传连锁图的分辨率就摩标志越多,越密集,所得到的遗传连锁图的分辨率就越高越高遗传图谱不仅是现阶段定位基因的重要手段,即使在人遗传图谱不仅是现阶段定位基因的重要手段,即使在人类基因组全物理图谱建立起来之后,它依然是研究人类类基因组全物理图谱
6、建立起来之后,它依然是研究人类基因组遗传与变异的重要手段基因组遗传与变异的重要手段第10页/共113页2.2 遗传作图标记任何一类图谱都有可识别的标记。遗传图谱的标记是什么呢?标记1标记2标记3染色体上的基因和基因和DNADNA序列序列均可作为路标,路标具有物理属性,他们由特定的DNA顺序组成.路标位于染色体上的位置是固定的,不会更改的,因而提供了作图的依据第11页/共113页2.2.1 基因标记在经典遗传学中,研究一种性状的遗传必须要求同一性状至少2种不同的存在形式或称表型。起初只有那些能通过视觉区分的基因表型用于研究。最初的遗传图谱是在20世纪初针对果蝇等生物使用基因作为标记构建的。第12
7、页/共113页2.2.1 基因标记表型(表型(phenotype)phenotype):一个遗传性状必须以两种替换形一个遗传性状必须以两种替换形式或表型存在才能用于遗传学分析式或表型存在才能用于遗传学分析等位基因(等位基因(alleleallele):):每种表型是由不同的等位基因控每种表型是由不同的等位基因控制制肉眼分辨的表型:肉眼分辨的表型:颜色、形状等。如用于果蝇遗传图颜色、形状等。如用于果蝇遗传图的构建的构建生化表型:生化表型:微生物遗传学研究微生物遗传学研究第13页/共113页2.2.1 基因标记人类的生化性状人类的生化性状ABOABO血型血型HLAHLA(人类白细胞抗原)(人类白细
8、胞抗原)复等位基因(复等位基因(multiple allelesmultiple alleles):):人类白细胞抗原(人类白细胞抗原(HLAHLA)是最复杂最具多态)是最复杂最具多态性的体系,位于性的体系,位于6 6 号染色体号染色体HLA-DRBIHLA-DRBI(human leukocyte antigens-DRBIhuman leukocyte antigens-DRBI)基因位点至少有)基因位点至少有5959个等个等位基因位基因HLA-BHLA-B抗原编码位点有抗原编码位点有6060多个等位基因多个等位基因第14页/共113页ABO 血型基因座上具有编码不同半乳糖转移酶复等位基因
9、其特异性决定了血型的差别第15页/共113页基因是非常有用的标记,但并不是理想的。原因基因是非常有用的标记,但并不是理想的。原因:1.可用作标记的可用作标记的基因十分有限基因十分有限,许多性状都涉及,许多性状都涉及 多基因。多基因。2.高等生物基因组中存在高等生物基因组中存在大量的基因间隔区,大量的基因间隔区,遗遗 传图中留下大片的无标记区段。传图中留下大片的无标记区段。3.只有部分基因其等位基因成员可以通过常规实只有部分基因其等位基因成员可以通过常规实 验予以区分,因而产生的遗传图是不完整的。验予以区分,因而产生的遗传图是不完整的。2.2.1 基因标记第16页/共113页 基因之外的作图工具
10、统称为基因之外的作图工具统称为DNA标记。与基标记。与基因标记一样,因标记一样,DNA标记必须有至少两个等位标记必须有至少两个等位基因才是有用的基因才是有用的。有三种类型的。有三种类型的DNA序列特序列特征可以满足这一要求:征可以满足这一要求:1.限制性片段长度多态性限制性片段长度多态性(restriction fragment length polymorphisms,RFLP)2.简单序列长度多态性简单序列长度多态性(simple sequence length polymorphisms,SSLP)3.单核苷酸多态性单核苷酸多态性(single nucleotide polymorphi
11、sms,SNP)2.2.2 DNA标记第17页/共113页遗传标记的发展:遗传标记的发展:第一代标记第一代标记 经典的遗传标记(蛋白质和免疫学的标记)经典的遗传标记(蛋白质和免疫学的标记)7070年代中后期,限制酶片段长度多态性(年代中后期,限制酶片段长度多态性(RFLPRFLP)第二代标记第二代标记 8585年,年,“小卫星序列小卫星序列(minisatelliteminisatellite)8989年,年,“微卫星序列微卫星序列(microsatellitemicrosatellite)第三代标记第三代标记 单核苷酸多态性标记(单核苷酸多态性标记(single nucleotidesing
12、le nucleotide polymorphism polymorphism,SNPSNP)第18页/共113页7070年代发展起来的年代发展起来的DNADNA重组技术、重组技术、DNADNA克隆技术和克隆技术和DNADNA探针技术探针技术为拓展遗传图谱的构建途径创造了技术条件为拓展遗传图谱的构建途径创造了技术条件使人类基因定位的方法从使人类基因定位的方法从细胞及染色体细胞及染色体水平过渡到水平过渡到分子水分子水平平DNADNA水平的多态性标记位点作为绘制现代遗传图谱的主要水平的多态性标记位点作为绘制现代遗传图谱的主要界标,提高图谱的界标,提高图谱的 精确度、准确性。遗传图谱的绘制进入精确度
13、、准确性。遗传图谱的绘制进入了一个崭新的时代了一个崭新的时代 现代遗传图谱的概念现代遗传图谱的概念由由Botstein DBotstein D等等(1980)(1980)首先提首先提出,在此基础上,限制性片段长度多态性(出,在此基础上,限制性片段长度多态性(RFLPRFLP)作为遗传图谱的第一代崭新标记得以问世作为遗传图谱的第一代崭新标记得以问世 。限制性位点限制性位点能够用作基因标记。广泛应用到基因组研能够用作基因标记。广泛应用到基因组研究中。基因或基因组可以用究中。基因或基因组可以用重叠的限制性片段重叠的限制性片段来作图。来作图。最终扩展到整个序列,构建连锁图谱最终扩展到整个序列,构建连锁
14、图谱第19页/共113页同一物种的亚种、品系或个体间基因组DNA 受到同一种限制性内切酶作用而形成不同的酶切图谱的现象,称为限制性片段长度多态性(RFLP)。这是由于基因组DNA某一位点上的变异有可能引起该位点特异性的限制性内切酶识别位点的改变,包括原有位点的消失或出现新的酶切位点,致使酶切片段长度随之发生变化而产生。第20页/共113页最早发现的DNADNA分子标记RFLP:由于同源染色体同一区段DNADNA序列的差异,当用限制酶处理时,可产生长度不同的限制性片段RFLP:restriction fragment length polymorphism,限制性片段长度多态性第21页/共113
15、页对RFLP的检测主要是用Southern杂交的方法进行基本流程:组织或细胞基因组DNA限制性内切酶消化琼脂糖凝胶电泳印迹转移至滤膜加入探针杂交洗膜放射自显影获得反映个体特异性的RFLP图谱。第25页/共113页RFLP标记的主要特点是:(1)遍布于整个基因组;(2)无表型效应,不受发育阶段及器官特异性限制(3)共显性,可区分纯合子和杂合子;(4)结果稳定、可靠;用途:RFLP主要用于群体水平和系统发育研究上.进行个体识别;绘制遗传图谱;目的基因定位;检测群体内或群体间序列差异程度;辅助育种等。自RFLP问世以来,已经在基因定位及分型、遗传连锁图谱的构建、疾病的基因诊断等研究中得到了广泛的应用
16、。第28页/共113页共显性:(两个亲本的性状在一个个体中同时出现,没有显隐关系)第29页/共113页问题:1.克隆可表现基因组DNA多态性的探针较为困难2.DNA需要量大,实验操作较繁锁,检测周期长成本费用也很高。3.RFLP分子标记分布密度过于稀疏。现已逐步被其他类型分子标记所取代。RFLP是最早发现的分子标记,也被称为第一代分子标记。第30页/共113页2.简单序列长度多态性(SSLP)1)可变排列的简单重复序列,即重复次数不一,在染色体的同一座位重复序列拷贝数不同;2)SSLP的类型:小卫星序列(minisatellite),有时又称可变串联 重复(VNTR),重复单位较长。重复序列为
17、16-100个核苷酸,主要分布在染色体端粒及着丝粒 微卫星序列(micrisatellite),或称简单串联重 复(STR),重复单位较短。重复序列只有2-6个核苷酸,分布在整个基因组。第31页/共113页microsatellite markermicrosatellite marker又称简单串连重复(又称简单串连重复(short short tandem repeattandem repeat,STRSTR),),最重要的优点是高度最重要的优点是高度多态性,提供的信息量相对很大;另外可用多态性,提供的信息量相对很大;另外可用PCRPCR技术使操作实现自动化,遗传图与物理图技术使操作实现自
18、动化,遗传图与物理图研究中非常有用的工具研究中非常有用的工具2020世纪世纪8080年代后期年代后期,人们开始应用人们开始应用微卫星序列微卫星序列(microsatellite,MS)(microsatellite,MS)绘制图谱。绘制图谱。19941994年底,美、年底,美、法完成了以法完成了以RFLPRFLP及微卫星为标志的遗传及微卫星为标志的遗传图谱图谱.图谱包含了图谱包含了58265826位点,覆盖位点,覆盖4000cM4000cM,分辨,分辨率高达率高达0.7cM0.7cM19961996年法国报道了完全以微卫星年法国报道了完全以微卫星DNADNA标志构建的遗传连锁图,包含标志构建的
19、遗传连锁图,包含23352335位点,位点,分辩率为分辩率为1.6cM1.6cM第32页/共113页微卫星序列(微卫星序列(SSR)第33页/共113页第34页/共113页共显性第35页/共113页如何检测SSR根据简单重复顺序两侧的序列设计引物,PCR,经聚丙烯胺凝胶电泳分辨.第36页/共113页SSR技术的优点是:(1)在基因组中随机分布,检测的多态性频率高;(2)PCR特异引物,重复性好;(3)共显性,操作相对简单。问题是:(1)SSR需要测序和设计引物,因而需要大量 的人力、物力和时间;(2)另外其种属特异性强,开发所需的费用高 昂,因此一些实验室进行了合作,共同开 发微卫星引物。第3
20、7页/共113页 利用SSR标记的关键是引物的设计对于已经进行基因组全序列测定的生物或遗传学研究比较经典的生物,可以直接从其基因组进行查找和利用有关程序进行引物的设计或利用别人已经发表的引物来进行实验;而对于没有基因组序列信息的生物,就需要进行有关引物的设计工作。第38页/共113页3.SNP(单核苷酸多态性单核苷酸多态性)SNP是指同一物种不同个体基因组DNA的等位序列上单个核苷酸存在差异的现象。第41页/共113页SNPSNP只涉及单个碱基的变异,这种变异可以由单个碱基的转换(包括C C与T T互换,G G与A A互换),或颠换(包括C C与A A、G G与T T、C C与G G、A A与
21、T T互换)引起。点突变,位于密码子的摇摆位置,表现为沉默突变而被大量保留下来。大多数不能被限制酶识别,必须采取测序或寡聚核苷酸杂交检测在人类基因组中可达到300300万个,平均每10001000个碱基对就有一个数目多,覆盖密度大,被称为第三代分子标记第42页/共113页根据SNP在基因中的位置,SNP可分为:基因编码区SNP(coding SNP,cSNP)基因周边SNP(peripheral SNP,pSNP)基因间SNP(intronicSNP,iSNP)第43页/共113页从对生物的遗传性状的影响,基因编码区SNP cSNP又可分为两种:1.同义cSNP(synonymous cSNP
22、):SNP引起的编码序列的改变并不影响其翻译的蛋白质的氨基酸序列;2.非同义cSNP(non-synonymous cSNP):指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能,这种改变常是导致生物性状改变的直接原因。第44页/共113页SNP标记可用DNA芯片技术检测:将不同的寡核苷酸固定在芯片上,标记待测DNA,一次就可检测很多SNP标记。尽管单一的SNP所提供的信息量远小于现在常用的分子标记,但SNP的数量极其丰富,并且可以自动化检验,因此其具有广泛的应用前景。SNP数量比微卫星标记数要高出几个数量级。第45页/共113页例如:34个SNP这种相邻的界标构成
23、的单倍型(haplotype)就可以有816种:Haplotype:一条同源染色体上的等位基因或遗传标记所构成的组合。第46页/共113页大多数大多数SNPSNP位于位于非编码序列,不非编码序列,不影响基因功能。影响基因功能。有些有些SNPSNP位置靠位置靠近特定的基因,近特定的基因,可作为基因的标可作为基因的标志志。其它的其它的SNPSNP位于位于编码序列内,编码序列内,可可改变基因表达的改变基因表达的蛋白质蛋白质,从而影,从而影响人类健康。响人类健康。第50页/共113页多肽链是由氨多肽链是由氨基酸连接而成基酸连接而成的。氨基酸具的。氨基酸具有不同的化学有不同的化学性质。性质。多肽链须折叠
24、多肽链须折叠成蛋白质的立成蛋白质的立体结构才能发体结构才能发挥正常的功能。挥正常的功能。如果多肽链中如果多肽链中一个或多个氨一个或多个氨基酸发生了改基酸发生了改变,则蛋白质变,则蛋白质折叠和功能可折叠和功能可能会发生改变。能会发生改变。第51页/共113页有些有些SNPSNP尽尽管位于管位于编码序编码序列内,列内,但并不但并不改变蛋改变蛋白质的白质的组成。组成。例:例:CUG-CUG-CUCCUC亮亮氨酸氨酸第52页/共113页有些有些SNPSNP会给会给蛋白质带来微蛋白质带来微小而无害的影小而无害的影响。响。例:例:GAUGAUGAG GAG 天东氨天东氨酸变成了谷氨酸变成了谷氨酸。两者都是
25、酸。两者都是酸性氨基酸。酸性氨基酸。如果发生位置如果发生位置对蛋白质功能对蛋白质功能影响不大,结影响不大,结果就是无害的。果就是无害的。蛋白质还会发蛋白质还会发挥正常的功能。挥正常的功能。第53页/共113页有些有些SNPSNP会给会给蛋白质的功能蛋白质的功能带来有害的影带来有害的影响,称为变异。响,称为变异。例:例:GAUGAUGUU GUU 天东氨酸天东氨酸变成缬氨酸。变成缬氨酸。由于化学性质由于化学性质完全不同,会完全不同,会严重地影响到严重地影响到蛋白质的折叠蛋白质的折叠和功能。和功能。镰刀形红细胞贫血症血红蛋白基因血红蛋白基因中单个碱基的中单个碱基的改变导致谷氨改变导致谷氨酸被缬氨酸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 遗传 绘制 学习
限制150内