植物基因组学的的研究进展(11页).doc
《植物基因组学的的研究进展(11页).doc》由会员分享,可在线阅读,更多相关《植物基因组学的的研究进展(11页).doc(11页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、-植物基因组学的的研究进展-第 9 页基因组学课程论文题目:植物基因组学的的研究进展姓名:秦 冉学号:11316040植物基因组学的的研究进展摘 要:随着模式植物拟南芥和水稻基因组测序的完成,近年来关于植物基因组学的研究越来越多。本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、比较基因组学、功能基因组学等领域的研究进展以及研究所使用的技术方法进行简单介绍。关键词:植物;基因组学;研究进展 The recent progress in plant genomics researchAbstract: With the completion of genome sequencing oft
2、he model plant- Arabidopsis and rice,more and more researches on plant genomics emerge in recent years. The research progress of the 2 important model plant-Arabidopsis and rice in structural genomics,comparative genomics,functional genomics and technology methods used in this researchare introduced
3、 briefly in this paper.Keywords: plant; genomics; research advances前言基因组是1924年提出用于描述生物的全部基因和染色体组成的概念。1986年由美国科学家Thomas Roderick提出的基因组学是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学。自从1990年人类基因组计划实施以来,基因组学发生了翻天覆地的变化,已发展成了一门生命科学的前沿和热点领域。而植物基因组研究与其他真核生物和人类基因组研究有很大的不同。首先, 不同植物的基因组大小即使在亲缘关系非常
4、近的种类之间差别也很大; 其次, 很多植物是异源多倍体, 即便是二倍体植物中有些种类也存在较为广泛的体细胞内多倍化( endopolyploidy) 现象1。基因组研究主要包括三个层次:结构基因组学, 以全序列测序为目标,构建高分辨率的以染色体重组交换为基础的遗传图谱和以DNA 的核苷酸序列为基础的物理图谱。功能基因组学,即“后基因组计划”, 是结构基因组研究的延伸, 利用结构基因组提供的遗传信息, 利用表达序列标签, 建立以转录图谱为基础的功能图谱( 基因组表达图谱) , 系统研究基因的功能,植物功能基因组学是当前植物学最前沿的领域之一。蛋白质组学,是功能基因组学的深入,因为基因的功能最终将
5、以蛋白质的形式体现。近来,以水稻( Oryza sativa) 和拟南芥( Arabadopsis thaliana)为代表的植物基因组研究取得了很大进展,如植物分子连锁遗传图谱的构建, 在此基础上, 已经在植物基因组的组织结构和基因组进化等方面得到了有重要价值的结论; 植物基因组物理作图和序列测定的研究集中于拟南芥和水稻上; 植物比较基因组作图证实在许多近缘植物甚至整个植物界的部分染色体区段或整个基因组中都存在着广泛的基因共线性, 使得我们可以利用同源性对各种植物的基因组结构进行研究、分析和利用。本文主要对拟南芥、水稻2种重要的模式植物在结构基因组学、功能基因组学、比较基因组学等研究领域的研
6、究进展进行归纳总结。1 拟南芥基因组学的研究1.1 拟南芥结构基因组学研究美国自1990 年启动“植物基因组学”计划, 2000 年底公布了模式植物拟南芥的全部序列。通过分析基因组序列能够获得基因结构的完整信息, 如基因在染色体上的排列顺序, 基因间的间隔区结构, 启动子的结构以及内含子的分布等。 Bevan2对拟南芥第四染色体上1. 9 Mb 的片段进行了全序列测定. 结果发现:平均每4. 8 Kb 就有一个基因存在;54% 的基因与GenBank 中的基因具有同源性;约20%的基因在该染色体片段上以基因家族的形式存在; 该染色体片段上共发现五种重复序列成分, 约占所测序列的19% 左右:分
7、别为:非编码区中的重复序列、逆转座子成分、叶绿体DNA片段、散布重复的基因家族成员和串联重复的基因家族成员。高等植物中,拟南芥的基因组最小且具有很少的重复DNA 序列,快速复性序列仅占整个基因组的10% 左右. 两种相关的串联重复序列(180 bp 和500 bp)都定位于拟南芥染色体的中心粒异染区. 另一类串联重复序列( 160 bp)定位于染色体的中部. 第四种高度重复序列是端粒序列. 在拟南芥的1号染色体中心粒区的一个串联重复中发现了一个退化的端粒序列, 紧接该序列是一个在遗传作图时有五个位点的重复单元, rDNA 的重复单位大小约为10 Kb,约占整个核基因组的8% 左右。5SrRNA
8、 的编码基因是以497 bp 为重复单位的串联重复序列, 约占基因组的0. 7%3。在拟南芥中还鉴定出了类似逆转座子的成分) Ta1和其相关家族以及转座因子Tat1 和Tag 1,它们都相对具有较低的拷贝数。在拟南芥的突变体中已经鉴定出了多个遗传标记位点,包括RFLP、PAPD、SSR 等标记。已经发展了两套重组近交系作图群体,利用这些作图群体, 已经构建了高密度的拟南芥分子标记遗传连锁图谱。拟南芥物理作图利用粘粒载体,YAC( YeastArtif icial Chromosome)载体进行,已经完成了拟南芥高密度物理图谱的构建。在拟南芥中已利用图位克隆的方法克隆了许多基因4-5。1.2 拟
9、南芥功能基因组学研究2001 年开始, 美国全面启动2010 年计划, 目标是到2010 年确定拟南芥中所有基因的功能。中国国家自然科学基金委员会已于2001 年快速启动“拟南芥全部转录调控因子蛋白组学研究”重大国际合作研究项目, 2004 年3月, 研究取得了重要进展: 共克隆了44 个拟南芥转录调控因子家族中的1 282 个基因, 获得了拟南芥所有已知和预测的1 864 个转录因子的序列, 利用cDNA ( 互补DNA ) 微阵列芯片, 检测了拟南芥幼苗的转录因子在光调控下的表达, 所有表达的基因占整个转录因子的84% ,并通过蛋白质表达实验验证已克隆的拟南芥转录调控因子融合基因中85%以
10、上有一定量的蛋白质表达。与基因组的全序列测定同时进行的拟南芥表达序列标签( expressedsequence tags) 计划也已取得巨大进展。据网站w ww.Arabido psis.or g 发布的信息表明, 至2002 年中期拟南芥的ESTs 标记数已达174 625个。EST 计划的不足在于随机测序难以得到那些低丰度表达的基因和在特殊环境条件下( 如生物胁迫或非生物胁迫) 诱导表达的基因。为了弥补不足, 进行基因组全序列测定。通过分析基因组序列能够获得基因结构的完整信息, 如基因在染色体上的排列顺序, 基因间的间隔区结构, 启动子的结构以及内含子的分布等。 拟南芥基因组全序列测定的完
11、成对整个植物科学具有重要的意义, 例如: 可以用于比较分析真核生物中的转录调节因子。拟南芥中约有超过5%的序列编码1500 多种转录调节因子, 其中45% 是植物特有的。拟南芥中属于所有真核生物共有的转录调节因子, 在其保守的DNA 结合结构域上并不完全与其它真核生物相同, 大多数以其特异的线型组合排列。2水稻基因组学的研究 遗传图谱水稻是已知的单子叶植物中基因组最小的植物之一,基因组大小为450 Mb, 共有12 条染色体。自1988年MeCoueh等6利用IR34583(籼)Bulu Dalam(爪哇)的F2群体构建了第一张水稻分子连锁图谱(含135 RFLP标记)以来,高密度的图谱相继产
12、生。近年来,随着分子遗传学的迅速发展,国际水稻基因组测序计划(International Rice GenomeSequencing Project,IRGSP)成员国以Nipponbare、Kasalath、IR64和Azucena等水稻品种为材料,构建了10个饱和的遗传图谱并与表型的标记进行了整合,以创造新的遗传资源。1998年,Harushima等7构建了一张高密度水稻遗传连锁图,包含2275个遗传标记,覆盖水稻基因组15216 cM。2001年Rice Genome Program(RGP)公布了包含3 267个RFLP分子标记的水稻分子连锁图。还利用次级三体和终级三体(telotri
13、somics)将经典遗传图和分子遗传图中的着丝粒位置确定,修正了分子图谱的方向,把RFLP标记定位到特定的染色体臂上;Wu等8构建了水稻第11和第12染色体短臂末端重复基因组区域的图谱,重复基因组区域大小是25 Mb,表明水稻也存在大染色体片段的重复区域。上述遗传图谱在基因定位、物理图谱的构建和基因测序中发挥了或即将发挥巨大作用。2.2 物理图谱由于遗传图的精确性较低、分辨率有限,而物理图是对遗传图的进一步深化,并能直接应用于图位克隆技术分离目的基因9-10。1998年,Umehara等11构建了水稻第一张物理图谱,共筛选到5701个YAC,其中2117个单一YAC分配到12条染色体上,跨度2
14、16 Mb,覆盖水稻基因组的50。接着日本水稻基因组计划(RGP)开始将YAC重叠群(contig)分解成粘粒(cosmid)DNA克隆,构建更精细的物理图谱。2001年,RGP还构建了一个覆盖270 Mb(全基因组的63的YAC文库的物理图,由6934个YAC组成,插入片段平均长度为350 kb。由于YAC克隆不太稳定、插入DNA难以分离、转化效率低等原因,美国Clemson大学基因组研究(Clemson University Genomics Institute,CUGI)又建成了两个BAC库,一个是由37000个Hindm酶切的BAC文库,插入片段平均长度为128.5 kb;另一个是有5
15、6 000个克隆的Eco R工BAC库,插入片段平均大小为120 kb,两者覆盖水稻基因组的26倍。2001年,RGP为了克服YAC克隆的局限性,又以PAC为载体构建了水稻Nipponbare基因组文库,此文库由72 000个Sau3A I酶切克隆组成,平均插入片段长120 kb,覆盖水稻基因组的16倍。,国际水稻基因组测序计划(IRGSP)已于2002年12月宣布,利用克隆连克隆(逐步克隆)测定法(clone by clone sequencing),提前3年完成了水稻12条染色体的碱基测序工作。日本在其中发挥着主导作用,并最先以9999的精度完成了最长的第1条染色体的测序工作。另外,中国1
16、2家单位,于1998年至2001年利用全基因组霰弹法(whole- genome shotgun sequencing,WGS),构建了籼稻9311基因组工作框架图和低覆盖率的培矮64S草图,并最先向全世界公布了水稻9311全基因组框架图。随后,美国先正达(Syngenta)公司也完成了日本晴基因组工作框架图的测序。两个框架图同时发表在2002年4月的Science第296期第7999页,它们都是对IRGSP的补充。水稻基因组框架图和全长序列的精确测定虽已基本完成,但片段之间或重叠群之间仍存在一些缺口或空隙(gap),如籼、粳两个亚种的基因组工作框架图分别覆盖了水稻全基因组的95.29和93,
17、碱基准确率约99。当前基于物理图精确测序的图谱研究表明12-13,水稻“日本晴”全基因组己获得3721 Mb的高质量精确序列,余下的5分布于12条染色体上的38个间隙(gaps)、10个着丝粒和10个端粒处;水稻全基因组预测有56278个基因位点,因为6498个基因位点编码10432个转录本,所以总转录本为66710;如果去除15236个转座因子相关的蛋白编码基因后,共有41042个基因位点编码非转座因子相关的蛋白,平均9.4 kb含一个基因,其中约29的基因成族出现,约71与拟南芥基因(Arabidopsis,28000-29000个基因)享有同源性(反过来,约90的拟南芥基因与水稻基因享有
18、同源性)。31439个基因位点已经得到ESTs序列、全长cDNA序列、Tiling芯片检测、大规模平行测序(massively parallel sigNature sequencing,MPSS)检测的RNA转录水平上的确认,8226个基因位点的编码蛋白序列与功能已知的蛋白质序列相同或相似,另有13632个基因位点的编码蛋白含有已知的功能域。3 功能基因组的研究方法3.1 芯片技术芯片技术主要是有利于科学家在一次实验中检测了成千上万个基因表达水平的变化,或者更广泛地识别染色体上转录活性区域及甲基化等特殊区域14。这个技术是现代生物信息井喷时代的一个重要的检测手段。通过比较两张不同芯片的结果,
19、就能在全基因组水平上调查各个基因的变化及其程度,这样有助于我们发现突变体中不同处理之间或者处理前后以及不同发育阶段中那些特异基因发生变化,从中寻找重要功能基因。基因芯片的设计,都是依据已知的水稻表达序列(如EST、全长cDNA等数据库)以及IRGSP预测的水稻基因序列进行的。因此,这些基因芯片在检测未知的水稻表达序列上能力欠缺,由此产生了水稻全基因组或染色体的tiling(覆瓦式)芯片。tiling芯片是针对分析全基因组所有转录活性区域的DNA微阵列,根据各条染色体已知的序列,扩增一个个相互重叠的片段15或者每隔十或十几个碱基合成一段寡核苷酸探针,这样一步步覆盖整个水稻基因组或染色体16。一般
20、tiling芯片由一个可操作的数目(如几十张芯片)组成,为了提高芯片的杂交质量还要求在设计的寡核苷酸探针中剔除一些高度重复区域内的探针。3.2 大规模平行测序技术和基因表达系统分析方法除了基因芯片采用杂交手段检测全基因组表达水平变化外,水稻基因表达的大规模分析平台里还有两个以测序为基础的检测方法:大规模平行测序技术(massively parallel signature sequencing MPSS)17和基因表达的系统分析(serial analysis of gene expression,SAGE)18。两者检测的理论基础都是一个长度20 bp左右的寡核苷酸序列足以作为特定基因的识别
21、标签这些识别标签在表达文库中出现的频率能很好地代表特定基因体内的表达丰度。最近一篇文章报道了利用MPSS技术建立的整个基因组的水稻表达图谱17,该研究从22个水稻mRNA文库中检测了46971553个短序列识别标签,验证和识别了大量已知的和未知的转录本。还从3个小RNA文库中检测了2953855个短序列识别标签,是目前最深入地挖掘作物中小RNA的研究工作。2024 bp的小RNAs,包括microRNAs(简称miRNA)和short interfering RNAs(简称siRNAs),两者都能通过序列互补与靶基因的mRNA结合并降解靶mRNA,使靶基因沉默。siRNAs还能通过DNA的甲基
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 植物 基因组 研究进展 11
限制150内