基因组的结构精选PPT.ppt
关于基因组的结构第1页,讲稿共76张,创作于星期日第一节第一节 基因组的基因组的C值悖理值悖理一、基因组与一、基因组与C值值基因组基因组(genome):一个物种单倍体全套染色体的全部:一个物种单倍体全套染色体的全部DNA序列序列C值值(C value):一个物种单倍体的:一个物种单倍体的DNA含量含量第2页,讲稿共76张,创作于星期日水稻全套单倍染色体水稻全套单倍染色体DNA序列的分布序列的分布第3页,讲稿共76张,创作于星期日几种代表性生物的基因组的大小几种代表性生物的基因组的大小门(门(phylum)种种(Species)C值(值(C-value)藻类(藻类(algae)Pyrenomas salina6.6105bp支原体(支原体(mycoplasma)M.pneumoniae1.0106bp细菌(细菌(bacterium)E.coli4.2106bp酵母酵母(yeast)S.cerevisiae1.3107bp霉菌霉菌(slime mold)D.discoideum5.4107bp线虫线虫(nematode)C.elegans8.0107bp昆虫昆虫(insect)D.melanogaster1.4108bp鸟鸟(bird)G.domesticus1.2109bp两栖动物两栖动物(amphibian)X.laevis3.1109bp哺乳动物哺乳动物(mammal)H.sapiens3.3109bp第4页,讲稿共76张,创作于星期日(爬行类爬行类)(两栖类两栖类)(硬骨鱼类硬骨鱼类)(软骨鱼类软骨鱼类)(棘皮类棘皮类)(甲壳类甲壳类)(软体动物软体动物)(蠕虫类蠕虫类)(霉霉)(澡澡)human(7109)(支原体支原体)不同类群生物的不同类群生物的C值变化范围值变化范围第5页,讲稿共76张,创作于星期日每类生物最小基因组的每类生物最小基因组的大小基本上对应于生物大小基本上对应于生物在进化上所处地位的高在进化上所处地位的高低;低;进化地位高进化地位高,形态结形态结构复杂的一类生物,其构复杂的一类生物,其最小基因组也较大最小基因组也较大每一类生物的最小基因每一类生物的最小基因组比较:组比较:第6页,讲稿共76张,创作于星期日二、二、C值悖理值悖理(C value paradox):指C值的大小并不能完全说明生物进化的程度和遗传复杂性的高低,即物种的物种的C值和它的进化复杂性之间没有严格的对值和它的进化复杂性之间没有严格的对应关系。应关系。具体表现在:1.在显花植物内部、两栖类内部、爬虫类内部,不同物种之间不同物种之间尽管结构、功能复杂程度相似,尽管亲缘关系相近,尽管结构、功能复杂程度相似,尽管亲缘关系相近,C值却可以相差10倍甚至百倍。两栖类的C值高于进化程度更高、结构和功能更为复杂的哺乳类的C值。(见图:不同类群生物的C值变化范围)2.C值(基因组值(基因组DNA含量)高于预期的编码蛋白质基因所含量)高于预期的编码蛋白质基因所需要的需要的DNA含量含量,两者之间的差异在进化程度高的生物中尤其显著。例如哺乳类的DNA含量可编码40万-60万个基因,但实际上只有3万-4万个基因。第7页,讲稿共76张,创作于星期日 C值悖理现象促使人们探究基因组的结构,即基因组中是否存在基因以外的基因组中是否存在基因以外的DNA序列序列,这些序列具有怎样的组织形式和功能组织形式和功能,它们对生物的生存和进化具有怎样的意义,于是诞生了一们新兴的学科基因组学。基因组学(基因组学(genomics):研究生物体基因组的研究生物体基因组的结构组成结构组成、稳定性稳定性及及功能功能的一门学科。的一门学科。主要包括以下两个方面:结构基因组学结构基因组学(structural genomics):研究基因组的结构基因组的结构,各种遗传元件的序列特征,基因组作图、基因定位乃至整个生物体遗传物质的核苷酸序列的测定等。功能基因组学功能基因组学(functional genomics):研究不同的序列结构具有的不同功能,基因的表不同的序列结构具有的不同功能,基因的表达调控,基因与环境之间达调控,基因与环境之间(包括基因与基因之间,基因与其它DNA序列之间,基因与蛋白质之间)相互作用以及基因对表型的作用等。三、基因组学三、基因组学第8页,讲稿共76张,创作于星期日第二节第二节 原核生物的基因组原核生物的基因组 结构简单。例如噬菌体的各种基因在基因组中只出现一次。X174噬菌体甚至存在不同基不同基因共用一部分因共用一部分DNA序列的现象,称为重叠基因。序列的现象,称为重叠基因。一、重叠基因一、重叠基因(overlapping gene)X174噬菌体的重叠基因噬菌体的重叠基因第9页,讲稿共76张,创作于星期日二、操纵子(二、操纵子(operon)发现大肠杆菌乳糖操纵子的发现大肠杆菌乳糖操纵子的F Jacob(左左)和和J Monod(1961)大肠杆菌的乳糖操纵子示意图大肠杆菌的乳糖操纵子示意图 原核生物中的细菌,基因组结构略比噬菌体复杂。1.首先表现在一些功能相关的基因,一些功能相关的基因,在染色体上彼此靠近地排列成为操在染色体上彼此靠近地排列成为操纵子为共同的表达元件所调控纵子为共同的表达元件所调控。例如大肠杆菌的乳糖操纵子有3个结构基因串连排列在基因组上,其表达和关闭为共同的启动子和调控序列所调控。2.操纵子以外的其他基因则多以操纵子以外的其他基因则多以单一序列存在单一序列存在;但也有例外,例如rRNA基因是一个由7个基因构成的基因簇。第10页,讲稿共76张,创作于星期日3.约75%的染色体的染色体DNA用于编码基因,其用于编码基因,其余余25%则是则是“基因间基因间DNA。一些基因间DNA具有重要功能,例如细菌染色体的复制起点即在此处。其他基因间区域可能与DNA的包装蛋白相作用。4.几乎所有基因都在几乎所有基因都在染色体基因组中染色体基因组中,只有,只有少数基因位于染色体外少数基因位于染色体外DNA。第11页,讲稿共76张,创作于星期日一、基因在基因组中的组织形式一、基因在基因组中的组织形式1单一序列 基因组中的大多数基因,只在基因组中出现一次,属于单一序列。大多数结构基因都是这种单一序列,它们具有高度的表达能力。第三节第三节 真核生物的基因组真核生物的基因组 第12页,讲稿共76张,创作于星期日2.基因家族基因家族 基因家族基因家族(gene family)指真核生物指真核生物基因组中有许多来源相基因组中有许多来源相同、结构相似、功能相关的一组基因同、结构相似、功能相关的一组基因,它们可归为一个基因家,它们可归为一个基因家族。族。基因家族成员的分布存在两种形式:(1)分别散布在基因组不同部位。如果蝇的肌动蛋白基因家族的成员。(2)大多数是集中地、彼此靠近地、成串地排列在一起,形成“基因簇”(gene cluster)。例如人的血红蛋白基因家族成员,形成珠蛋白基因簇和珠蛋白基因簇。第13页,讲稿共76张,创作于星期日 人血红蛋白基因家族人血红蛋白基因家族上:基因簇:下:基因簇 基因簇在11号染色体,包括3个活跃基因和2个假基因。基因簇在16号染色体,包括5个活跃基因和一个假基因。chromosome 11chromosome 16第14页,讲稿共76张,创作于星期日 G A 1 人类人类 簇簇 21 2 1人类人类 簇簇假基因(假基因()与有功能的基因同源,原来可能属有功能的基因,由于缺失、与有功能的基因同源,原来可能属有功能的基因,由于缺失、倒位或突变等原因使该基因失去活性而成为无功能的基因。倒位或突变等原因使该基因失去活性而成为无功能的基因。第15页,讲稿共76张,创作于星期日各种生物的组蛋白基因的组织形式各种生物的组蛋白基因的组织形式3.串联重复基因串联重复基因在基因家族中,在基因家族中,DNA序列完全相同或一致性很高的许多基因,串序列完全相同或一致性很高的许多基因,串联在一起成为基因簇的,特称为串联重复基因联在一起成为基因簇的,特称为串联重复基因。(1)组蛋白基因)组蛋白基因 在真核生物中,组蛋白H1,H2A,H2B,H3,和H4是染色体的重要成分。现在知道,许多真核生物编码这五种组蛋白的基因彼此靠近,构成一个单位;许多这样的单位又串联在一起构成组蛋白的串联重复基因。第16页,讲稿共76张,创作于星期日(2)rRNA基因基因 高等真核生物一般以200500个拷贝的rRNA基因组成串联重复单位。rRNA基因的大量转录产生大量rRNA,形成核仁。含有rRNA基因串联重复单位的染色体区域即次缢痕区域。一个细胞核内有多少RNA基因串联重复单位,就会形成多少个核仁。非洲爪蟾每个卵母细胞非洲爪蟾每个卵母细胞中含有几百个核仁中含有几百个核仁第17页,讲稿共76张,创作于星期日(3)tRNA基因基因 研究比较多的酵母tRNA基因,已知也是串联重复序列,但是不同重复单位中的各个tRNA基因互不相同。第18页,讲稿共76张,创作于星期日二、基因外序列在基因组中二、基因外序列在基因组中的组织形式的组织形式n根据基因外序列在每个基因组中出现的拷贝数,可将它们分为以下四类。单一序列:单一序列:主要指在每个基因组只出现主要指在每个基因组只出现1 1个拷贝的序列。但常将在每个个拷贝的序列。但常将在每个基因组只出现基因组只出现2-32-3个拷贝的序列也包括在内个拷贝的序列也包括在内。低度重复序列:低度重复序列:在每个基因组出现在每个基因组出现2-102-10个拷贝的序列。个拷贝的序列。中度重复序列:中度重复序列:在每个基因组出现在每个基因组出现1010个到几百个拷贝的序列。个到几百个拷贝的序列。高度重复序列:高度重复序列:在每个基因组出现几百到几百万拷贝的序列。在每个基因组出现几百到几百万拷贝的序列。第19页,讲稿共76张,创作于星期日第20页,讲稿共76张,创作于星期日1簇状重复序列(clustered repitative sequence)高度重复序列中常有一些高度重复序列中常有一些AT碱基对含量很高的简单序列,例碱基对含量很高的简单序列,例如螃蟹如螃蟹DNA含有简单的含有简单的AT高度重复序列,以致高度重复序列,以致 AT含量高达含量高达97%。由于由于AT段的浮力密度比较小,因而在将段的浮力密度比较小,因而在将DNA切成几百个碱基切成几百个碱基对的片段进行超速离心时,常常会在主要的对的片段进行超速离心时,常常会在主要的DNA带的上面出现带的上面出现一个次要的一个次要的DNA带,这就是通常所说的带,这就是通常所说的“卫星卫星DNA”。这些卫星这些卫星DNA呈簇状重复,位于着丝粒、端粒等附近的异染色质区,呈簇状重复,位于着丝粒、端粒等附近的异染色质区,不产生不产生RNA和蛋白质,起着保证染色体正常分配,或维持染色体正常和蛋白质,起着保证染色体正常分配,或维持染色体正常结构的作用。结构的作用。第21页,讲稿共76张,创作于星期日电泳电泳DNA片段时显示的卫星片段时显示的卫星DNA(箭头所指箭头所指)第22页,讲稿共76张,创作于星期日卫星卫星DNA的分布区域的分布区域各个异染色质区(图中着色深的区域)着丝粒(亮点)端粒(染色体两端亮点)端粒区域的DNA示意图端粒示意图第23页,讲稿共76张,创作于星期日卫星卫星DNA的应用的应用 有的簇状重复序列,在一个固定位点出现的有的簇状重复序列,在一个固定位点出现的重复次数经常是不相同的。这种可变性存在于重复次数经常是不相同的。这种可变性存在于个体之间,和同一个体的一对同源染色体之间。个体之间,和同一个体的一对同源染色体之间。因此,这些序列被称为变数串联重复序列(简因此,这些序列被称为变数串联重复序列(简称称VNTRVNTR)。使用)。使用PCRPCR反应能扩增这种反应能扩增这种VNTRVNTR,产物的长度取决于重复序列的重复数。产物的长度取决于重复序列的重复数。这种长度的变化可用于鉴定个体之间这种长度的变化可用于鉴定个体之间的差异,和鉴定同一个体一对同源染色体的差异,和鉴定同一个体一对同源染色体之间的差异,已被广泛应用于法学领域,之间的差异,已被广泛应用于法学领域,例如用于排除犯罪嫌疑(或结合其他证据例如用于排除犯罪嫌疑(或结合其他证据确定罪犯),和用于亲子鉴定等,因而被确定罪犯),和用于亲子鉴定等,因而被称为称为DNADNA指纹。指纹。DNA指纹技术发明人杰夫里斯指纹技术发明人杰夫里斯第24页,讲稿共76张,创作于星期日利用卫星利用卫星DNA进行亲子鉴进行亲子鉴定的基本原理定的基本原理第25页,讲稿共76张,创作于星期日亲子鉴定实验室她们真是母女吗?第26页,讲稿共76张,创作于星期日法医利用DNA指纹鉴定罪犯现场DNA(3)和罪犯DNA(4)第27页,讲稿共76张,创作于星期日DNA指纹曾用于鉴定一个坟墓的墓主是否路易十七本人,从而解决了法国历史上的一个悬案。原来法国资产阶级革命胜利后,路易十六被送上断头台,他的儿子按照王室惯例自动登基。这个尚未成年的路易十七被革命党囚禁,后来病死并被就地安葬。保皇党则宣扬他已越狱逃到了国外,并声称坟墓的主人是他的替身。这事一时成为法国历史上的悬案。到20世纪80年代,法国利用DNA指纹技术才确定了坟墓的主人是路易十七本人。右图是防腐药剂浸泡着的路易十七的心脏,曾被偷运出国和辗转在国外,历史真相大白后才送回法国公开展览。第28页,讲稿共76张,创作于星期日2弥散重复序列(dispersed repitative sequence)p弥散重复序列是指广泛分散在整个基因组的重复序列。它们又可以分为长、短两种:短序列称为“短弥散因子”(short interspersed elements,简称SINEs)。这种序列的长度少于500个碱基对。在基因组中重复出现700 000900 000次,存在于大部分地方,有的甚至存在于基因之中。长的序列称为“长弥散因子”(long interspersed elements,简称LINEs)。一个序列大约含有数千个碱基对,在基因组中重复出现3 0004 000次。以上两种序列的作用还有待进一步研究。第29页,讲稿共76张,创作于星期日基因组的作图,需要利用某种遗传标记表示等位基因的位置。基因组的作图,需要利用某种遗传标记表示等位基因的位置。遗传学中通常将遗传学中通常将可识别的等位基因可识别的等位基因称为遗传标记称为遗传标记(genetic marker)。RFLPAFLPRAPDSSR遗传标记可用于基因的连锁分析、基因定位、遗传作图和基因转移的鉴定。遗传标记可用于基因的连锁分析、基因定位、遗传作图和基因转移的鉴定。限制性酶消化和限制性酶消化和分子杂交技术为分子杂交技术为基础基础以以PCR技术为基技术为基础础遗传标记遗传标记形态学标记形态学标记生化标记生化标记分子标记分子标记细胞学标记细胞学标记第四节第四节 遗传标记遗传标记第30页,讲稿共76张,创作于星期日一、形态学标记一、形态学标记形态学标记即生物的外部形态特征,如矮秆、白化、变态叶、雄性不育形态学标记即生物的外部形态特征,如矮秆、白化、变态叶、雄性不育等,就是一种特定的肉眼可见的外部特征。等,就是一种特定的肉眼可见的外部特征。玉米甜粒玉米甜粒/非甜粒非甜粒番茄红果番茄红果/黄果黄果番茄连萼番茄连萼/非连萼非连萼甜椒果色甜椒果色、果形、果形第31页,讲稿共76张,创作于星期日二、细胞学标记二、细胞学标记染色体的变化常常会引起某些表型性状的异染色体的变化常常会引起某些表型性状的异常,从而可以将染色体的变化作为一种遗传常,从而可以将染色体的变化作为一种遗传标记,来分析测定基因所在的染色体及相对标记,来分析测定基因所在的染色体及相对位置,也可通过染色体置换等进行基因的定位置,也可通过染色体置换等进行基因的定位。位。染色体数目的变化染色体数目的变化(如单体、缺体、如单体、缺体、三体、四体三体、四体)染色体结构的变异染色体结构的变异(如缺失、易位、倒如缺失、易位、倒位、重复等位、重复等)染色体组型染色体组型(染色体数目、大小、随体染色体数目、大小、随体有无、着丝粒位置等有无、着丝粒位置等)和带型(和带型(C带、带、N带、带、G带等带等)人类染色体组型人类染色体组型第32页,讲稿共76张,创作于星期日三、生化标记三、生化标记同工酶同工酶(isozyme):同一种酶具有多种不同形式,它们催化同样的生:同一种酶具有多种不同形式,它们催化同样的生化反应。这类化反应。这类结构不同、功能相似的酶称为同工酶结构不同、功能相似的酶称为同工酶。同工酶标记的特点同工酶标记的特点:可用两点或三点测验定位于染色体可用两点或三点测验定位于染色体编码同工酶的等位基因是共显性的编码同工酶的等位基因是共显性的同工酶标记的不足同工酶标记的不足:具有组织特异性具有组织特异性发现的同工酶标记有限发现的同工酶标记有限第33页,讲稿共76张,创作于星期日四、分子标记四、分子标记遗传标记多态性形成的分子基础均是基因组遗传标记多态性形成的分子基础均是基因组DNA的变异,而分子标记所揭示的多态性是的变异,而分子标记所揭示的多态性是直接反映基因组直接反映基因组DNA间的差异。间的差异。第34页,讲稿共76张,创作于星期日(一)(一)分子标记的优越性分子标记的优越性直接以直接以DNA的形式表现的形式表现数量多,遍及整个基因组数量多,遍及整个基因组,检测位点近乎无限,检测位点近乎无限多态性高多态性高,自然存在着许多等位变异,不需要专门创,自然存在着许多等位变异,不需要专门创造特殊的遗传材料造特殊的遗传材料表现为表现为“中性中性”,即不影响目标性状的表达,与不良,即不影响目标性状的表达,与不良性状无必然的连锁性状无必然的连锁有许多分子标记表现为有许多分子标记表现为共显性共显性第35页,讲稿共76张,创作于星期日(二)(二)分子标记技术分类分子标记技术分类第一类是以第一类是以分子杂交分子杂交为基础的为基础的DNA标记技术,主要有限制性片段长标记技术,主要有限制性片段长度多态性标记度多态性标记(Restriction fragment length polymorphisms,简称,简称RFLP标记标记)、可变数目串联重复序列标记、可变数目串联重复序列标记(Variable number of tandem repeats,简称,简称VNTR标记标记)、原位杂交、原位杂交(in situ hybridization)等等第二类是以第二类是以聚合酶链式反应聚合酶链式反应(Polymerase chain reaction,简称,简称PCR反应反应)为基础的各种为基础的各种DNA指纹技术指纹技术第三类是一些第三类是一些新型的分子标记新型的分子标记,如单核苷酸多态性,如单核苷酸多态性(Single nucleotide polymorphism,简称,简称SNP),表达序列标签,表达序列标签(Expressed sequence stags,简称,简称EST)和反转录转座子和反转录转座子(Retro-transposon)等等第36页,讲稿共76张,创作于星期日1.RFLP标记标记RFLP(restriction fragment length polymorphism)称为限制性片段长度多态性,称为限制性片段长度多态性,是指用限制性内切酶酶切不同个体的基因组是指用限制性内切酶酶切不同个体的基因组DNA后,含有与探针序列同源的酶切片段在后,含有与探针序列同源的酶切片段在长度上的差异长度上的差异第37页,讲稿共76张,创作于星期日基因组基因组DNARestriction enzymedigestionDNA小小片段片段琼脂糖琼脂糖电泳电泳按按DNA分分子大小顺序子大小顺序分开分开尼龙膜尼龙膜转移转移杂交杂交32P探针探针同源序同源序列结合列结合探针的限制探针的限制性酶切片段性酶切片段多态性多态性X光片光片放射自显影放射自显影(1)RFLP标记的原理标记的原理第38页,讲稿共76张,创作于星期日电泳检测电泳检测E1E1P1P2插入、缺失、酶切位插入、缺失、酶切位点突变等造成点突变等造成DNA片段长度大小的变化片段长度大小的变化P1 P2第39页,讲稿共76张,创作于星期日Probe BProbe AProbe BProbe B Probe AProbe AProbe BProbe AC H H N H N C HH N H C H H C N1 2 3 4 5 6 7 8Probe BProbe AH N H C H H C NH N H C H H C N1 2 3 4 5 6 7 8Columbia生态型Niederenz生态型F1杂合子表型:CColumbiaNNiederenzH杂合型例1:A与B不连锁例2:A与B连锁子代子代 重组 亲型 亲型 亲型 亲型 亲型第40页,讲稿共76张,创作于星期日第41页,讲稿共76张,创作于星期日(2)RFLP标记的特点标记的特点无表型效应无表型效应RFLP标记具有共显性的特点标记具有共显性的特点RFLP具有种族特异性具有种族特异性RFLP标记范围遍及全基因组标记范围遍及全基因组第42页,讲稿共76张,创作于星期日(3)RFLP标记不足之处标记不足之处DNA量大量大(515ug)检测步骤繁琐,需要的仪器、设备较多,周期长检测步骤繁琐,需要的仪器、设备较多,周期长用作探针的用作探针的DNA克隆其制备与存放较麻烦克隆其制备与存放较麻烦检测中要利用放射性同位素检测中要利用放射性同位素(通常为通常为32P),易造成环境污染,易造成环境污染虽然也可以用非放射性物质虽然也可以用非放射性物质(如如Biotin系统,系统,Dig系统及系统及Ecl系系统统)替代同位素,其杂交信号相对较弱,灵敏度较同位素标记替代同位素,其杂交信号相对较弱,灵敏度较同位素标记低得多且价格较高低得多且价格较高第43页,讲稿共76张,创作于星期日1944-The Nobel Prize in Chemistry 19932.PCR标记标记PCR是是Mullis等等(1985)首创的在首创的在模板模板DNA、引物引物和和4种脱氧核种脱氧核糖核苷酸糖核苷酸存在的条件下,依赖于存在的条件下,依赖于DNA聚合酶聚合酶的体外酶促反应,的体外酶促反应,以合成特异以合成特异DNA片段的一种方法片段的一种方法,其其特异性取决于引物与模板特异性取决于引物与模板DNA结合的特异性结合的特异性第44页,讲稿共76张,创作于星期日.genetic moviesPCR动画.mov第45页,讲稿共76张,创作于星期日第46页,讲稿共76张,创作于星期日PCR检测检测DNA多态性的优点多态性的优点(与与RFLP相比相比):模板模板DNA用量少用量少对模板对模板DNA纯度要求不高纯度要求不高程序简单,分析周期大大缩短程序简单,分析周期大大缩短PCR的特点的特点第47页,讲稿共76张,创作于星期日3.PCR的扩展的扩展A.单引物单引物PCR标记标记随机扩增多态性随机扩增多态性DNA标记标记(Random amplification polymorphism DNA,简称,简称RAPD标记标记):引物为:引物为10个随机核苷酸组成个随机核苷酸组成任意引物任意引物PCR标记标记(Arbitary primer polymerized chained reaction,简称,简称AP-PCR标记标记):引物长度与一般引物长度与一般PCR引物相当,引物相当,开始退火温度低允许错配,后正常开始退火温度低允许错配,后正常PCR,具有随机性,具有随机性单重复序列中间区域标记单重复序列中间区域标记(Inter simple sequence repeats polymorphisms,简称,简称ISSR标记标记):在:在SSR引物端加引物端加2-4个简并核苷酸个简并核苷酸组成,具有较好的随机性和稳定性组成,具有较好的随机性和稳定性第48页,讲稿共76张,创作于星期日RAPD标记标记RAPD标记是用随机排列的寡聚脱氧核苷酸标记是用随机排列的寡聚脱氧核苷酸单链引物单链引物(通常长度为通常长度为10个核苷酸个核苷酸)通过通过PCR扩增染色体组中的扩增染色体组中的DNA所获得的长度不同所获得的长度不同的多态性的多态性DNA片段片段第49页,讲稿共76张,创作于星期日RAPD经典经典PCR引物个数引物个数1对对1个个5560复性温度复性温度36扩增产物扩增产物特异扩增特异扩增随机扩增随机扩增10bp20bp引物长度引物长度RAPD与经典与经典PCR区别区别第50页,讲稿共76张,创作于星期日B.双引物选择性扩增的双引物选择性扩增的PCR标记标记:主要通过引物主要通过引物3端碱基端碱基的变化获得多态性,这种标记主要指扩增片段长度多态性标的变化获得多态性,这种标记主要指扩增片段长度多态性标记记(Amplified fragment length polymorphism),简称,简称AFLP标记标记)第51页,讲稿共76张,创作于星期日AFLP标记标记AFLP标记的基本原理标记的基本原理基因组基因组DNA双酶切选择双酶切选择(frequent cutter+rare cutter)EcoRIMseI连接连接(ligase)合成接头、连接合成接头、连接合成引物合成引物(接头接头(1-3)选择碱基选择碱基)选择性扩增选择性扩增变性聚丙烯酰胺凝胶电泳变性聚丙烯酰胺凝胶电泳分离扩增产物分离扩增产物电泳电泳选择选择EcoRI EcoRIMseI MseI剔除剔除第52页,讲稿共76张,创作于星期日双酶切EcoR IEcoR IMse IMse I5-GAATTCEcoR I酶切位点AATT-3Mse I酶切位点3-CTTAAGTTAA-5连接上接头的片段选择EcoR I和Mse I的酶切粘性末端的片段5-AATTCA-33-GTTAA-5特定引物接头5-NNNN-33-NNNNTTAA-55-ATTNNNN-33-NNNN-5限制性片段ligase连接接头5-NNNNAATTCAATTNNNN-33-NNNNTTAAGTTATNNNN-5增加引物选择性碱基 正向引物系列 反向引物系列 扩增片段数目正向0,反向0 5-NNNNAATTC-3 3-TTATNNNN-5 所有正向+1,反向+1 5-NNNNTATTCT-3 3-ATTATNNNN-5 1/4正向+2,反向+1 5-NNNNTATTCTC-3 3-AGTTATNNNN-5 1/16正向+1,反向+2 5-NNNNTATTCT-3 3-AGTTATNNNN-5 1/4 1/16=1/64选择性引物PCR扩增限制片段第53页,讲稿共76张,创作于星期日C.需要通过克隆、测序来构建特殊双引物的需要通过克隆、测序来构建特殊双引物的PCR标记标记简单序列重复标记简单序列重复标记(Simple sequence repeats,简称,简称SSR标记标记)第54页,讲稿共76张,创作于星期日SSR标记标记pNakamura(1987)发现生物基因组内有一种短的重复次发现生物基因组内有一种短的重复次数不同的序列,统称可变数目串联重复序列数不同的序列,统称可变数目串联重复序列(Variable number tandem repeat,简称简称VNTR)。VNTR标记包括标记包括小卫星小卫星(minisatellites)标记和标记和微卫星微卫星(microsatellites)标标记记p微卫星微卫星DNA又称又称SSR(simple sequence repeats),它它是一类由是一类由16个碱基组成的基序个碱基组成的基序(motif)串联重复而成串联重复而成的的DNA序列,如序列,如(CA)n、(AT)n、(GCT)n、(GATA)n等等重复,其中重复,其中n代表重复次数代表重复次数第55页,讲稿共76张,创作于星期日SSR分子标记的特点分子标记的特点数量几乎无限,检测出多态性的频率极高。数量几乎无限,检测出多态性的频率极高。SSR一般检测的是一个单一的多等位基因位点一般检测的是一个单一的多等位基因位点SSR标记为共显性标记,可鉴别出杂合子和纯合子标记为共显性标记,可鉴别出杂合子和纯合子结果重复性高,稳定可靠。为了提高分辨力,通常使用结果重复性高,稳定可靠。为了提高分辨力,通常使用可检测出单拷贝差异的聚丙烯酰胺凝胶电泳可检测出单拷贝差异的聚丙烯酰胺凝胶电泳兼具兼具PCR反应的优点,即所需反应的优点,即所需DNA样品量少,对样品量少,对DNA质量要求亦不苛刻质量要求亦不苛刻 第56页,讲稿共76张,创作于星期日明恢63与珍汕97杂交,回交BC1F1,wx基因SSR图谱1 21.珍汕珍汕97 2.明恢明恢63第57页,讲稿共76张,创作于星期日4.CAPS标记标记利用PCR产物专门检测内切酶位点变异间的差异如PCR产物无多态性,通过测序,可能发现它们之一的酶切位点(如EcoR I)具有突变EcoR I电泳第58页,讲稿共76张,创作于星期日5.单核苷酸多态性单核苷酸多态性(SNP)标记标记 单核苷酸多态性(Single nucleotide polymorphism,SNP)是指不同个体基因组DNA序列之间单个核苷酸单个核苷酸的差异的差异。SNP共有4种转换形式CT(GA)转换最为常见,约占4种SNP转换的2/3。CA(GT)CG(GC)TA(AT)第59页,讲稿共76张,创作于星期日(1)SNP的分类的分类在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因序列外。基因组内的SNP分为两种形式:一是遍布于基因组非编码区非编码区中的大量单碱基核苷酸变异另一是主要分布于基因编码区内编码区内(Coding region)的突变,故又称其为cSNP。从对生物遗传性状的影响上来看,cSNP又可分为两种:一种是同义同义cSNP(Synonymous cSNP),即SNP导致的突变碱基与未突变碱基在氨基酸密码的变异上属于同义突变,从而使得基因编码序列的改变并不影响其所翻译蛋白质的氨基酸序列的改变;另一种是非同义非同义cSNP(Non-synonymous cSNP),指突变碱基序列的改变导致氨基酸的改变,从而使其蛋白质序列发生改变,影响蛋白质的功能。第60页,讲稿共76张,创作于星期日(2)SNP的检测方法的检测方法直接测序法。直接测序对不同个体进行的PCR扩增,然后对扩增片段测序比较是发现SNP的最常用方法。DNA芯片法芯片法。检测SNP的最佳方法是新近发展起来的DNA芯片技术。SNPs的大规模发现和识别与DNA芯片技术的发展和应用关系密切。基于生物信息学的SNP候选位点搜索。公共数据库中公布有大量的序列信息,其中包括表达序列标签(ESTs)、序列标签位点(STSs)、cDNA文库和基因组测序DNA序列。在这些序列之间必然存在大量的重叠区域,通过比较这些重叠区域,就可获得大量的SNP,并且成本可以大大降低。第61页,讲稿共76张,创作于星期日(3)SNP作为遗传标记的优越性作为遗传标记的优越性 p位点丰富,数量多,分布广泛p具有较高的遗传稳定性p易于基因分型pSNP适于快速、高通量检出因SNP的二态性,更有利于发展自动化的筛选或检测技术。第62页,讲稿共76张,创作于星期日6.插入缺失(插入缺失(InDel)标记)标记 InDel标记是指通过比较基因组学发现不同基因组中缺不同基因组中缺失或者插入失或者插入DNA片段片段,表现出的多态性 InDel标记的设计主要是在插入/缺失片段的两侧设计PCR引物,然后,通过扩增两特定引物之间的片段,从而由于插入/缺失片段在不同个体之间产生多态性。InDel标记与SSR标记一样,具有PCR技术的特点,全基因组分布,数量多,稳定,共显性的特点,在基因组中的位置恒定。第63页,讲稿共76张,创作于星期日五、五、分子标记的应用分子标记的应用建立分子标记遗传连锁图谱建立分子标记遗传连锁图谱进行基因定位和基因克隆进行基因定位和基因克隆可用于品种鉴定、纯度鉴定、亲子鉴定可用于品种鉴定、纯度鉴定、亲子鉴定杂种优势遗传机理研究杂种优势遗传机理研究动植物的起源和进化研究动植物的起源和进化研究第64页,讲稿共76张,创作于星期日人的第1染色体RFLP图谱和细胞图谱的关系。图左为RFLP图谱,右为细胞遗传图谱拟南芥第1染色体RFLP图谱,图左为限制性酶切克隆探针位置,右为cM遗传距离 第65页,讲稿共76张,创作于星期日Litigation:Forensic science,paternity,patent application and infringement.第66页,讲稿共76张,创作于星期日第67页,讲稿共76张,创作于星期日Human chromosomes,with segments containing at least two genes whose order is conserved in the mouse genome as color blocks.Each color corresponds to a particular mouse chromosome.Conserved segments in the Human and mouse genome.第68页,讲稿共76张,创作于星期日人类基因组:人类基因组:22条常染色体条常染色体 1条条X染色体染色体 1条条Y染色体染色体人类基因组计划(人类基因组计划(Human genome project,简称,简称HGP)19901990年年1010月启动、月启动、20032003年年4 4月完成;月完成;美、德、日、英、法、中等美、德、日、英、法、中等6 6国科学家合作;国科学家合作;对人类基因组进行作图和对人类基因组进行作图和DNADNA序列测定,以序列测定,以便破译人类的几乎所有遗传信息。便破译人类的几乎所有遗传信息。第四节第四节 人类基因组计划人类基因组计划 第69页,讲稿共76张,创作于星期日人类基因组人类基因组31.731.7亿个核苷酸对的亿个核苷酸对的序列分布序列分布第70页,讲稿共76张,创作于星期日一、人类基因组计划的内容一、人类基因组计划的内容 遗传图谱遗传图谱:以连锁的基因(或连锁的基因外序列)之间的重组率,确定它们的以连锁的基因(或连锁的基因外序列)之间的重组率,确定它们的相对距离。相对距离。物理图谱物理图谱:以物理长度(碱基对数目)表示图距,如以物理长度(碱基对数目)表示图距,如MbMb、kbkb、bpbp等反映基因等反映基因(或基因外序列)在基因组中的位置。(或基因外序列)在基因组中的位置。序列图谱序列图谱:人类基因组的人类基因组的2222条常染色体和两条性染色体(条常染色体和两条性染色体(X X、Y Y)的)的DNADNA,总共包含约总共包含约3030亿对核苷酸的全基因组亿对核苷酸的全基因组DNADNA分子核苷酸排列顺序。分子核苷酸排列顺序。基因图谱基因图谱:结果表明,结果表明,2424条染色体上的基因的总数约条染色体上的基因的总数约3-43-4万个。基因图谱的作用万个。基因图谱的作用在于鉴别出这些基因的位置、结构和功能。在于鉴别出这些基因的位置、结构和功能。第71页,讲稿共76张,创作于星期日人类基因组图谱人类基因组图谱染色体上的遗传标记染色体与基因染色体DNA碱基排列顺序第72页,讲稿共76张,创作于星期日我国承担我国承担2222号染色体图谱的绘制号染色体图谱的绘制研究人员在工作中心内的实验室国家人类基因组北方研究中心22号染色体特征示意图第73页,讲稿共76张,创作于星期日2222号染色体图谱号染色体图谱第74页,讲稿共76张,创作于星期日二、人类基因组图谱的价值二、人类基因组图谱的价值医学价值医学价值有了人类基因组全序列的信息,将有利于发现致病基因,实现以有了人类基因组全序列的信息,将有利于发现致病基因,实现以DNADNA为基础的诊断、治疗、预防和药物设计。为基础的诊断、治疗、预防和药物设计。科学价值科学价值将人类基因组全序列的信息,与其他哺乳动物相比较,能使我们将人类基因组全序列的信息,与其他哺乳动物相比较,能使我们发现大量的基因调节序列,认识基因调控的规