基因组与比较基因组学研究.ppt
《基因组与比较基因组学研究.ppt》由会员分享,可在线阅读,更多相关《基因组与比较基因组学研究.ppt(45页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九讲第九讲基因组与比较基因组学基因组与比较基因组学研究研究一、人工染色体构建一、人工染色体构建二、新的测序策略二、新的测序策略-全基因组鸟枪法测序全基因组鸟枪法测序三、全基因组序列分析三、全基因组序列分析-基因组学的新内容基因组学的新内容四、比较基因组学四、比较基因组学(Comparativegenomics)一、人工染色体构建一、人工染色体构建1983年,美国的Dana-Farber癌症研究所和哈佛大学医学院的教授首次在Nature上发表文章,报道了构建YAC(YeastArtificialChromosome)库的过程。1987年,Burke等人发现,仅仅带有ARS序列的载体虽然能够被复
2、制,但极易在有丝分裂时丢失。即使在选择培养基上,也只有5%-20%的子代细胞带有ARS载体。加入Centromeres(CEN)能显著提高ARS质粒在有丝分裂时的稳定性,90%以上子代细胞带有该载体。CEN还能显著降低拷贝数,从20-50/细胞降为1-2/细胞。(Science,236:806-812)。人工染色体含有三种必需成分:着丝粒、端粒和复制起点。着丝粒(CEN)位于染色体中央,呈纽扣状结构,在有丝分裂时结合微管并调控染色体的运动,也是姐妹染色单体配对时的最后位点,接收细胞信号而使姐妹染色体分开。端粒(TEL):主要功能是防止染色体融合、降解、确保其完整复制。端粒酶以其自身RNA为模板
3、,在染色体端部添加上端粒重复序列,并参与端粒长度和细胞增殖的调控。复制起点:DNA复制通常由起始蛋白与特定的DNA序列相互作用开始。DNA合成的起始位点和DNA复制起点(遗传位点)所需的Cis靶区常位于同一段长约100bp的DNA上。YAC的主要缺点1存在高比例的嵌合体,即一个YAC克隆含有两个本来不相连的独立片段;2部分克隆子不稳定,在转代培养中可能会发生缺失或重排;3难与酵母染色体区分开,因为YAC与酵母染色体具有相似的结构。4操作时容易发生染色体机械切割。以细菌寄主系统为基础的克隆载体形成嵌合体的频率较低,转化效率高,又易于分离。科学家用染色体建造法用F质粒及其调控基因构建细菌载体,克隆
4、大片段DNA。该质粒主要包括oriS,repE(控制F质粒复制)和parA、parB(控制拷贝数)等成分。BAC的优点1易于用电击法转化E.coli(转化效率比转化酵母高10-100倍);2超螺旋环状载体,易于操作;3F质粒本身所带的基因控制了质粒的复制;4很少发生体内重排。有人把人类染色体端粒DNA上单个-卫星DNA单元多聚化形成1Mb左右的大片段并与人类基因组DNA混合,产生了能被复制、能正常分裂并得到长期稳定保存的人工合成的染色体,长度约为6-10Mb,称为MAC或HAC。二、二、新的测序策略-全基因组鸟枪法测序对某基因组文库全部克隆片段进行末端序列测定中未测到的碱基数,即缺口(gap)
5、,与已测定的总碱基数相关。随着已测定碱基数的增加,缺口的总碱基数目会按照泊松公式的一个推论(P=e-m)迅速减小。其中P为基因组中某个碱基未被测定的概率,m为所测定的碱基数与基因组大小相比的倍数。m越大P值越小。当m值达到5(即随机测定的碱基数达到基因组5倍时),基因组中未测定的碱基数为基因组总碱基数的0.67%(e-5=0.0067)。对流感嗜血杆菌这样大的基因组(1.83Mb),可能留有128个平均长度为100bp的缺口。全基因组鸟枪法测序的主要步骤是:第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。第二
6、,高效、大规模的末端测序。对文库中每一个克隆,进行两端测序,TIGR在完成流感嗜血杆菌的基因组时,使用了14台测序仪,用三个月时间完成了必需的28,463个测序反应,测序总长度达6倍基因组。第三,序列集合。TIGR发展了新的软件,修改了序列集合规则以最大限度地排除错误的连锁匹配。第四,填补缺口。有两种待填补的缺口,一是没有相应模板DNA的物理缺口,二是有模板DNA但未测序的序列缺口。他们建立了插入片段为15-20kb的文库以备缺口填补。鸟枪法测序的缺点随着所测基因组总量增大,所需测序的片段大量增加,各个片段重叠或一个连续体的概率是2n2-2n高等真核生物(如人类)基因组中有大量重复序列,导致判
7、断失误。对鸟枪法的改进(1)Clonecontig法。首先用稀有内切酶把待测基因组降解为数百kb以上的片段,再分别测序。(2)靶标鸟枪法(diretedshotgun)。首先根据染色体上已知基因和标记的位置来确定部分DNA片段的相对位置,再逐步缩小各片段之间的缺口。SSLPs,simplesequencelengthpolymorphisms;STRs,simpletandemrepeats;SNPs,singlenucleotidepolymorphisms.LINEs,longinterspersednuclearelements;SINEs,shortinterspersednuclea
8、relements;LTR,longterminalrepeat.FISH,FluorescentinsituHybridization;STS,SequenceTaggedSiteSTS一般为一般为100-500bp的的DNA片段,只在整个片段,只在整个genome或染色体中出现或染色体中出现1次。次。EST,EndSequenceTag.三、全基因组序列分析三、全基因组序列分析-基因组学的新内容基因组学的新内容1数据存放。2碱基百分含量分析。无论是GC富含区还是AT富含区,都可能是一些特殊功能的区域。肺炎支原体GC百分含量高和GC百分含量低的区域对应于重组值较低的区域,包括着丝粒和端粒,而
9、尿殖道支原体GC百分含量最低的区域对应于rRNA和tRNA。流感嗜血杆菌GC百分含量高的区域也对应于6个rRNA基因。3.ORF分析。首先要用多个不同的软件来要找到并估测基因组中的每一个ORF。通过比较确知其功能的;在数据库中有相匹配的蛋白质序列,但不知其能的;在数据库中找不到任何相匹配蛋白质序列的新基因。1995年,J.C.Venter所领导的TIGR(TheInstituteofGenomicReseach)完成了第一个单细胞自由生物基因组,流感嗜血杆菌(HaemopophilusinfluenzaeRd)全序列测定。1996年他们又完成了拥有最小基因组的单细胞生物尿殖道支原体(Mycop
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因组 比较 研究
限制150内