动物遗传学第九章动物基因组学.ppt
第九章第九章 动物基因组学动物基因组学(Animal Genomics)第一节第一节 人类基因组计划人类基因组计划第二节第二节 基因组学与蛋白质组学基因组学与蛋白质组学第三节第三节 基因图谱基因图谱第四节第四节 生物信息学生物信息学第五节第五节 分子遗传标记分子遗传标记一、什么是人类基因组计划?一、什么是人类基因组计划?人类基因组计划(人类基因组计划(Human Genome Project,Human Genome Project,HGP)HGP)是指通过测定人类基因组是指通过测定人类基因组DNADNA的的3103109 9对核对核苷酸的序列,探寻所有人类基因并确定他们在染苷酸的序列,探寻所有人类基因并确定他们在染色体上的位置,明确所在基因的结构及功能,解色体上的位置,明确所在基因的结构及功能,解读人类的全部遗传信息,使得人类第一次在分子读人类的全部遗传信息,使得人类第一次在分子水平上全面认识自我。水平上全面认识自我。第一节第一节 人类基因组计划人类基因组计划(Human Genome Human Genome ProjectProject)二、为什么启动人类基因组计划?二、为什么启动人类基因组计划?随着研究的不断深入,人们对随着研究的不断深入,人们对DNADNA的认识的认识越来越深,我们有必要对人类所有遗传信息进越来越深,我们有必要对人类所有遗传信息进行测序,同时由于测定方法的完善,使得进行行测序,同时由于测定方法的完善,使得进行人类基因组测序成为可能。人类基因组测序成为可能。三、人类基因组计划的研究进展三、人类基因组计划的研究进展l1985198519851985年,美国的杜尔贝克年,美国的杜尔贝克年,美国的杜尔贝克年,美国的杜尔贝克“癌症研究的转折点癌症研究的转折点癌症研究的转折点癌症研究的转折点-测测测测定人类基因组序列定人类基因组序列定人类基因组序列定人类基因组序列”。l1988198819881988年,美国国会批准,政府资助成立人类基因组,年,美国国会批准,政府资助成立人类基因组,年,美国国会批准,政府资助成立人类基因组,年,美国国会批准,政府资助成立人类基因组,由多个国家筹集基金和科研力量,积极参与这一国际由多个国家筹集基金和科研力量,积极参与这一国际由多个国家筹集基金和科研力量,积极参与这一国际由多个国家筹集基金和科研力量,积极参与这一国际性研究计划。性研究计划。性研究计划。性研究计划。l 1990199019901990年年年年10101010月,国际月,国际月,国际月,国际人类基因组计划正式启动,预人类基因组计划正式启动,预计用计用1515年的时间,投资年的时间,投资3030亿美元,完成亿美元,完成3030亿对碱基的亿对碱基的测序,并对所有基因进行绘图和排序,全球人类基因测序,并对所有基因进行绘图和排序,全球人类基因组计划有美国、英国、日本、法国、德国和中国六个组计划有美国、英国、日本、法国、德国和中国六个国家负责,分别承担国家负责,分别承担54%54%,33%33%,7%7%,2.2%2.2%,2.8%2.8%和和1%1%测序任务。测序任务。oo多国合作小组多国合作小组多国合作小组多国合作小组2001200120012001年在年在年在年在NatureNatureNatureNature上公布结果上公布结果上公布结果上公布结果oo Craig VenterCraig Venter博士采用鸟枪法于博士采用鸟枪法于ScienceScience上发表上发表结果。结果。oo 人基因组测序的完成可与人类登月媲美。人基因组测序的完成可与人类登月媲美。人基因组测序的完成可与人类登月媲美。人基因组测序的完成可与人类登月媲美。四、人类基因组计划结果公布四、人类基因组计划结果公布p耗时耗时耗时耗时 10 10 10 10 载,耗费载,耗费载,耗费载,耗费 30 30 30 30 亿美元;亿美元;亿美元;亿美元;p基因组大小基因组大小基因组大小基因组大小 30303030亿亿亿亿 碱基,其中中国承担碱基,其中中国承担碱基,其中中国承担碱基,其中中国承担 1%1%1%1%的测序任的测序任的测序任的测序任务。务。务。务。p 1%1%1%1%为外显子,为外显子,为外显子,为外显子,99%99%99%99%为内含子和重复序列;为内含子和重复序列;为内含子和重复序列;为内含子和重复序列;p 表达蛋白质的基因组数量约为表达蛋白质的基因组数量约为表达蛋白质的基因组数量约为表达蛋白质的基因组数量约为 3 3 3 3 万;万;万;万;p约含约含约含约含 100100100100百万百万百万百万 个个个个SNPSNPSNPSNP标记。标记。标记。标记。序列测定方法序列测定方法 1 1 全基因组鸟枪法:全基因组鸟枪法:在一定作图信息基在一定作图信息基础上,绕过大片段连续础上,绕过大片段连续克隆系的构建而直接将克隆系的构建而直接将基因组分解成小片段随基因组分解成小片段随机测序,利用超级计算机测序,利用超级计算机进行组装(美国机进行组装(美国CeleraCelera公司)。公司)。序列测定方法序列测定方法 2 2五、人类基因组计划的意义五、人类基因组计划的意义第一:获得人类全部基因序列将有助于人类认识许多第一:获得人类全部基因序列将有助于人类认识许多遗传疾病以及癌症等疾病的治病机理,为分子诊断、遗传疾病以及癌症等疾病的治病机理,为分子诊断、基因治疗等新方法提供理论依据。基因治疗等新方法提供理论依据。第二:破译生命密码的人类基因组计划有助于人们对第二:破译生命密码的人类基因组计划有助于人们对基因的表达调控有更深入的了解。基因的表达调控有更深入的了解。第三:人类基因图谱对揭示人类发展,进化的历史具第三:人类基因图谱对揭示人类发展,进化的历史具有重要意义。有重要意义。基因组大小的比较(基因组大小的比较(1 1)基因组大小的比较(基因组大小的比较(2 2)六、其它物种基因组六、其它物种基因组o20002000年年3 3月,月,“全基因组鸟枪法全基因组鸟枪法”获得果蝇获得果蝇全基因组序列,发表在全基因组序列,发表在ScienceScience上。上。o20002000年年1010月,美英等科学家宣布绘出拟南芥月,美英等科学家宣布绘出拟南芥基因组的完全图谱,这是人类首次破译出一基因组的完全图谱,这是人类首次破译出一种基因的序列。种基因的序列。o水稻基因组水稻基因组我国二十世纪的大事我国二十世纪的大事第二节第二节 基因组学及蛋白质组学基因组学及蛋白质组学一、基因组与基因组学基因组与基因组学oo基因组(基因组(GenomeGenome)就是指生物体染色体、细就是指生物体染色体、细胞器中所含的全套遗传物质;一种生物全部胞器中所含的全套遗传物质;一种生物全部基因的集合称为基因的集合称为“基因组基因组”。oo基因组学(基因组学(GenomicsGenomics)就是研究基因组结构就是研究基因组结构和功能的科学。和功能的科学。(一)(一)基因组学的分类基因组学的分类根据研究对象分为:肿瘤基因组学根据研究对象分为:肿瘤基因组学根据研究对象分为:肿瘤基因组学根据研究对象分为:肿瘤基因组学 、植物基因组、植物基因组、植物基因组、植物基因组学、药物基因组学、环境基因组学等学、药物基因组学、环境基因组学等学、药物基因组学、环境基因组学等学、药物基因组学、环境基因组学等根据研究重点基因组学可以分为结构基因组学和根据研究重点基因组学可以分为结构基因组学和根据研究重点基因组学可以分为结构基因组学和根据研究重点基因组学可以分为结构基因组学和功能基因组学。功能基因组学。功能基因组学。功能基因组学。结构基因组学结构基因组学结构基因组学结构基因组学 功能基因组学功能基因组学功能基因组学功能基因组学结构基因组学结构基因组学1 1、概念和目的、概念和目的 以全部基因组测序为目标的基因结构研究,弄清基因组中全部基因的位置和结构,为基因功能的研究奠定基础。其目的是建立高分辩的遗传图谱、物理图谱、转录图谱和序列图谱。2 2、结构基因组研究常用方法、结构基因组研究常用方法1 1 脉冲场凝胶电泳:脉冲场凝胶电泳:改变电场方向和调整脉冲时间,将长度不同的DNA分开。2 2 毛细管电泳:毛细管电泳:可用于单核苷酸改变的寻找,短串联重复序列的检查,DNA测序,基因及其表达产物的分析。3 3 基因芯片技术基因芯片技术:可用于表达谱测定、突变检测、多态性分析、基因组文库作图和杂交测序等。4 4 全基因组随机测序(全基因组鸟枪战略):全基因组随机测序(全基因组鸟枪战略):先打断DNA测序,然后作图。功能基因组学功能基因组学1 1、概念:、概念:利用结构基因组学提供的信息,以高通量,大规模试验方法及统计与计算机分析为特征,全面系统的分析全部基因的功能。2 2、基因功能从研究角度包括、基因功能从研究角度包括:生物学功能、细胞学功能、发育学功能等。3 3、功能基因组学研究的方法、功能基因组学研究的方法o差异显示反转录差异显示反转录PCRPCRo基因表达序列分析(基因表达序列分析(SAGESAGE)o基因芯片或微点矩阵基因芯片或微点矩阵oRNARNA干涉技术干涉技术o遗传足迹法遗传足迹法o发求遗传学发求遗传学o蛋白质组学和生物信息学方法蛋白质组学和生物信息学方法生物芯片生物芯片 生物芯片生物芯片 (二)比较基因组学(二)比较基因组学 利用生物在进化上的亲缘关系利用生物在进化上的亲缘关系,来比较它们来比较它们与人类之间的相似与相异与人类之间的相似与相异,即比较基因组学。即比较基因组学。(三)后基因组时代(三)后基因组时代(Postgenome era)*人类基因组计划完成之后,生物学被重新划分为人类基因组计划完成之后,生物学被重新划分为前基因组和后基因组两部分。前基因组和后基因组两部分。*科学研究已开始进入科学研究已开始进入科学研究已开始进入科学研究已开始进入“后基因组时代后基因组时代后基因组时代后基因组时代”。主要是。主要是。主要是。主要是开展蛋白质组的研究。开展蛋白质组的研究。开展蛋白质组的研究。开展蛋白质组的研究。*有科学家形象地说道:有科学家形象地说道:有科学家形象地说道:有科学家形象地说道:即使基因测序全部完成,即使基因测序全部完成,即使基因测序全部完成,即使基因测序全部完成,也只好像是一本没有姓名、只有号码的电话簿。也只好像是一本没有姓名、只有号码的电话簿。也只好像是一本没有姓名、只有号码的电话簿。也只好像是一本没有姓名、只有号码的电话簿。“后基因组时代后基因组时代后基因组时代后基因组时代”的最终目标,是要把深奥的的最终目标,是要把深奥的的最终目标,是要把深奥的的最终目标,是要把深奥的DNADNADNADNA语言变成一本基因大百科全书。语言变成一本基因大百科全书。语言变成一本基因大百科全书。语言变成一本基因大百科全书。蛋白组(蛋白组(ProteomeProteome)蛋白质组蛋白质组蛋白质组蛋白质组是指是指是指是指“一种一种一种一种基因基因基因基因组所表达的全套蛋白质组所表达的全套蛋白质组所表达的全套蛋白质组所表达的全套蛋白质”。蛋白组学(蛋白组学(ProteomicsProteomics)一门在整体水平上研究细胞内蛋白质的组成及其一门在整体水平上研究细胞内蛋白质的组成及其一门在整体水平上研究细胞内蛋白质的组成及其一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科。活动规律的新兴学科。活动规律的新兴学科。活动规律的新兴学科。蛋白组学与功能基因组学息息相关。蛋白组学与功能基因组学息息相关。二、蛋白组与蛋白组学二、蛋白组与蛋白组学1 1.蛋白质分离和鉴定:蛋白质分离和鉴定:2.2.翻译后修饰:翻译后修饰:翻译后修饰是蛋白质调节功能的重要方式,因翻译后修饰是蛋白质调节功能的重要方式,因此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作此对蛋白质翻译后修饰的研究对阐明蛋白质的功能具有重要作用。用。3.3.蛋白质功能确定:蛋白质功能确定:如分析酶活性和确定酶底物,细胞因子的如分析酶活性和确定酶底物,细胞因子的生物分析生物分析/配基配基-受体结合分析。可以利用基因敲除和反义技术受体结合分析。可以利用基因敲除和反义技术分析基因表达产物分析基因表达产物-蛋白质的功能。另外对蛋白质表达出来后蛋白质的功能。另外对蛋白质表达出来后在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。在细胞内的定位研究也在一定程度上有助于蛋白质功能的了解。4.4.对人类而言,蛋白质组学的研究最终要服务于人类的健康,对人类而言,蛋白质组学的研究最终要服务于人类的健康,主要指促进分子医学的发展主要指促进分子医学的发展。如寻找药物的靶分子,很多药物。如寻找药物的靶分子,很多药物本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可本身就是蛋白质,而很多药物的靶分子也是蛋白质。药物也可以干预蛋白质以干预蛋白质-蛋白质相互作用。蛋白质相互作用。蛋白质组学的研究内容蛋白质组学的研究内容蛋白质组学研究方法蛋白质组学研究方法1 用于蛋白质分离技术方面的如双向凝胶电泳,双向“高效”柱层析等2 用于蛋白质鉴定技术如质谱技术,凝胶图像分析,蛋白质和多肽的N端,C端测序及氨基酸组成分析3 用于蛋白质相互作用及作用方式研究的双杂交系统4 用于分析大量数据的生物工程信息学等第三节第三节 基因图谱基因图谱 (gene mapgene map)一、遗传图谱:一、遗传图谱:又称连锁图谱又称连锁图谱(linkage map)(linkage map),应用遗传学技术构建能显示基因以及其它序列应用遗传学技术构建能显示基因以及其它序列特征在基因组上位置的图。特征在基因组上位置的图。方法是以多态的遗传标记作为界标,计算细胞减方法是以多态的遗传标记作为界标,计算细胞减数分裂过程中遗传标记之间发生重组的频率,来确数分裂过程中遗传标记之间发生重组的频率,来确定两个遗传标记在染色体上的相对位置。定两个遗传标记在染色体上的相对位置。遗传标记之间的相对距离即图距以厘摩(遗传标记之间的相对距离即图距以厘摩(cM,厘,厘摩尔根,摩尔根,centi-Morgan)为单位。当两个遗传)为单位。当两个遗传标记之间的重组值为标记之间的重组值为1%时,图距即为时,图距即为1cM。现代遗传图现代遗传图的概念是于的概念是于19801980年提出的,就年提出的,就是是将单纯的表型多态性界标改变为以将单纯的表型多态性界标改变为以DNADNA序列序列的多态作为作图界标。的多态作为作图界标。各种遗传界标可在国际互联网上可以查阅各种遗传界标可在国际互联网上可以查阅(http:/http:/www.gdb.orgwww.gdb.org)。)。当用当用DNADNA序列多态作为界标的遗传图时,一序列多态作为界标的遗传图时,一但确定该但确定该DNADNA界标与某一基因的具体位置,便界标与某一基因的具体位置,便可分离克隆这个基因。可分离克隆这个基因。人类第一张以人类第一张以RFLPRFLP为界标的遗传图发表于为界标的遗传图发表于19871987年。年。经典遗传图的作图最常用的是经典遗传图的作图最常用的是三点测交法三点测交法。遗传图的局限性遗传图的局限性1.1.分辨率有限分辨率有限 高等真核生物子代数量有限,只高等真核生物子代数量有限,只有少数的减数分裂事件可供研究,连锁分析有少数的减数分裂事件可供研究,连锁分析的分辨率受很大限制的分辨率受很大限制2.2.精确度较低精确度较低 假设交换是随机发生的,但由于假设交换是随机发生的,但由于交换热点的存在使某一区段的交换频率远高交换热点的存在使某一区段的交换频率远高于其它区段,无法绘制精确的遗传图。于其它区段,无法绘制精确的遗传图。二、物理图谱(二、物理图谱(physical map)physical map)是指有关构成基因组的全部基因的排列和是指有关构成基因组的全部基因的排列和是指有关构成基因组的全部基因的排列和是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的间距的信息,它是通过对构成基因组的间距的信息,它是通过对构成基因组的间距的信息,它是通过对构成基因组的DNADNADNADNA分子分子分子分子进行测定而绘制的。绘制物理图谱的目的是把进行测定而绘制的。绘制物理图谱的目的是把进行测定而绘制的。绘制物理图谱的目的是把进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相有关基因的遗传信息及其在每条染色体上的相有关基因的遗传信息及其在每条染色体上的相有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。对位置线性而系统地排列出来。对位置线性而系统地排列出来。对位置线性而系统地排列出来。随着遗传图谱和物理图谱的完成,测序就成为重中之随着遗传图谱和物理图谱的完成,测序就成为重中之重的工作。重的工作。DNADNA序列分析技术是一个包括序列分析技术是一个包括DNADNA片段碱基片段碱基分析、分析、DNADNA信息翻译的多阶段的过程。通过信息翻译的多阶段的过程。通过测序测序得到得到基因组的基因组的序列图谱。序列图谱。四、基因图谱四、基因图谱基因图谱(转录图谱)基因图谱(转录图谱)是在识别基因组所包含的蛋白是在识别基因组所包含的蛋白质质编码序列编码序列的基础上绘制的结合有关基因序列、位置的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。在人类基因组中鉴别出占及表达模式等信息的图谱。在人类基因组中鉴别出占具具2%5%2%5%长度的全部基因的位置、结构与功能,最主长度的全部基因的位置、结构与功能,最主要的方法是通过基因的表达产物要的方法是通过基因的表达产物mRNAmRNA反追到染色体的反追到染色体的位置。位置。三、序列图谱三、序列图谱第第三节三节 生物信息学生物信息学 (Bioinformatics)背景知识背景知识包括人、鸡、水稻等动植物以及大肠杆菌等原核生包括人、鸡、水稻等动植物以及大肠杆菌等原核生包括人、鸡、水稻等动植物以及大肠杆菌等原核生包括人、鸡、水稻等动植物以及大肠杆菌等原核生物的数十种模式生物的基因组序列的成功获得,以物的数十种模式生物的基因组序列的成功获得,以物的数十种模式生物的基因组序列的成功获得,以物的数十种模式生物的基因组序列的成功获得,以及更多生物基因组序列的即将获得。及更多生物基因组序列的即将获得。及更多生物基因组序列的即将获得。及更多生物基因组序列的即将获得。生物信息学是在此背景下发展起来的综合运用生物生物信息学是在此背景下发展起来的综合运用生物生物信息学是在此背景下发展起来的综合运用生物生物信息学是在此背景下发展起来的综合运用生物学、数学、物理学、信息科学以及计算机科学等诸学、数学、物理学、信息科学以及计算机科学等诸学、数学、物理学、信息科学以及计算机科学等诸学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科。生物信息学是多学科的理论方法的崭新交叉学科。生物信息学是多学科的理论方法的崭新交叉学科。生物信息学是多学科的理论方法的崭新交叉学科。生物信息学是内涵非常丰富的学科,其核心是基因组信息学,包内涵非常丰富的学科,其核心是基因组信息学,包内涵非常丰富的学科,其核心是基因组信息学,包内涵非常丰富的学科,其核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释。括基因组信息的获取、处理、存储、分配和解释。括基因组信息的获取、处理、存储、分配和解释。括基因组信息的获取、处理、存储、分配和解释。生物信息学生物信息学是以生物大分子为研究对象,以是以生物大分子为研究对象,以计算机为工具,运用数学和信息科学的观计算机为工具,运用数学和信息科学的观点、理论和方法去研究生命现象、组织和点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门分析呈指数级增长的生物信息数据的一门科学科学.什么是生物信息学?什么是生物信息学?主要研究内容主要研究内容 1 1 1 1、生物信息的收集、存储、管理与提供、生物信息的收集、存储、管理与提供、生物信息的收集、存储、管理与提供、生物信息的收集、存储、管理与提供包括建立国际基本生物信息库和生物信息传输的国际联包括建立国际基本生物信息库和生物信息传输的国际联包括建立国际基本生物信息库和生物信息传输的国际联包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与检测系统;生网系统;建立生物信息数据质量的评估与检测系统;生网系统;建立生物信息数据质量的评估与检测系统;生网系统;建立生物信息数据质量的评估与检测系统;生物信息的在线服务;生物信息可视化和专家系统。物信息的在线服务;生物信息可视化和专家系统。物信息的在线服务;生物信息可视化和专家系统。物信息的在线服务;生物信息可视化和专家系统。2 2 2 2、基因组序列信息的提取和分析、基因组序列信息的提取和分析、基因组序列信息的提取和分析、基因组序列信息的提取和分析包括基因的发现与鉴定;基因组中非编码区的信息结构包括基因的发现与鉴定;基因组中非编码区的信息结构包括基因的发现与鉴定;基因组中非编码区的信息结构包括基因的发现与鉴定;基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能;分析,提出理论模型,阐明该区域的重要生物学功能;分析,提出理论模型,阐明该区域的重要生物学功能;分析,提出理论模型,阐明该区域的重要生物学功能;进行模式生物完整基因组的信息结构分析和比较研究;进行模式生物完整基因组的信息结构分析和比较研究;进行模式生物完整基因组的信息结构分析和比较研究;进行模式生物完整基因组的信息结构分析和比较研究;利用生物信息研究遗传密码起源、基因组结构的演化、利用生物信息研究遗传密码起源、基因组结构的演化、利用生物信息研究遗传密码起源、基因组结构的演化、利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与基因组空间结构与基因组空间结构与基因组空间结构与DNADNADNADNA折叠的关系以及基因组信息与生折叠的关系以及基因组信息与生折叠的关系以及基因组信息与生折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。物进化关系等生物学的重大问题。物进化关系等生物学的重大问题。物进化关系等生物学的重大问题。3 3 3 3、功能基因组相关信息分析、功能基因组相关信息分析、功能基因组相关信息分析、功能基因组相关信息分析包括与大规模基因表达谱分析相关的算法、软件研究,基包括与大规模基因表达谱分析相关的算法、软件研究,基包括与大规模基因表达谱分析相关的算法、软件研究,基包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白因表达调控网络的研究;与基因组信息相关的核酸、蛋白因表达调控网络的研究;与基因组信息相关的核酸、蛋白因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。质空间结构的预测和模拟,以及蛋白质功能预测的研究。质空间结构的预测和模拟,以及蛋白质功能预测的研究。质空间结构的预测和模拟,以及蛋白质功能预测的研究。4 4 4 4、生物大分子结构模拟和药物设计、生物大分子结构模拟和药物设计、生物大分子结构模拟和药物设计、生物大分子结构模拟和药物设计包括包括包括包括RNA(RNA(RNA(RNA(核糖核酸核糖核酸核糖核酸核糖核酸)的结构模拟和反义的结构模拟和反义的结构模拟和反义的结构模拟和反义RNARNARNARNA的分子设计;蛋的分子设计;蛋的分子设计;蛋的分子设计;蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质空间结构模拟和分子设计;具有不同功能域的复合蛋白质以及连接肽的设计;生物活性分子的电子结构计算和白质以及连接肽的设计;生物活性分子的电子结构计算和白质以及连接肽的设计;生物活性分子的电子结构计算和白质以及连接肽的设计;生物活性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于结构、细胞表面受体结构的药物设计;基于结构、细胞表面受体结构的药物设计;基于结构、细胞表面受体结构的药物设计;基于DNADNADNADNA结构的药物结构的药物结构的药物结构的药物设计等。设计等。设计等。设计等。5 5 5 5、生物信息分析的技术与方法研究、生物信息分析的技术与方法研究、生物信息分析的技术与方法研究、生物信息分析的技术与方法研究包括发展软件、数据库工具;改进现有的理论分析方法;创建包括发展软件、数据库工具;改进现有的理论分析方法;创建包括发展软件、数据库工具;改进现有的理论分析方法;创建包括发展软件、数据库工具;改进现有的理论分析方法;创建一切适用于基因组信息分析的新方法、新技术。包括引入复杂一切适用于基因组信息分析的新方法、新技术。包括引入复杂一切适用于基因组信息分析的新方法、新技术。包括引入复杂一切适用于基因组信息分析的新方法、新技术。包括引入复杂系统分析技术、信息系统分析技术等;建立严格的多序列比较系统分析技术、信息系统分析技术等;建立严格的多序列比较系统分析技术、信息系统分析技术等;建立严格的多序列比较系统分析技术、信息系统分析技术等;建立严格的多序列比较方法;发展与应用密码学方法以及其他算法和分析技术;发展方法;发展与应用密码学方法以及其他算法和分析技术;发展方法;发展与应用密码学方法以及其他算法和分析技术;发展方法;发展与应用密码学方法以及其他算法和分析技术;发展研究基因组完整信息结构和信息网络的研究方法等;发展生物研究基因组完整信息结构和信息网络的研究方法等;发展生物研究基因组完整信息结构和信息网络的研究方法等;发展生物研究基因组完整信息结构和信息网络的研究方法等;发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新大分子空间结构模拟、电子结构模拟和药物设计的新方法与新大分子空间结构模拟、电子结构模拟和药物设计的新方法与新大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。技术。技术。技术。6 6 6 6、应用与发展研究、应用与发展研究、应用与发展研究、应用与发展研究汇集与疾病相关的人类基因信息,发展患者样品序列信息检测汇集与疾病相关的人类基因信息,发展患者样品序列信息检测汇集与疾病相关的人类基因信息,发展患者样品序列信息检测汇集与疾病相关的人类基因信息,发展患者样品序列信息检测技术和基于序列信息选择表达载体、引物的技术,建立与动植技术和基于序列信息选择表达载体、引物的技术,建立与动植技术和基于序列信息选择表达载体、引物的技术,建立与动植技术和基于序列信息选择表达载体、引物的技术,建立与动植物良种繁育相关的数据库以及与大分子设计和药物设计相关的物良种繁育相关的数据库以及与大分子设计和药物设计相关的物良种繁育相关的数据库以及与大分子设计和药物设计相关的物良种繁育相关的数据库以及与大分子设计和药物设计相关的数据库。数据库。数据库。数据库。EMBLEMBLEMBLEMBL、GenBankGenBankGenBankGenBank和和和和DDBJDDBJDDBJDDBJ是国际上三大主要核酸序是国际上三大主要核酸序是国际上三大主要核酸序是国际上三大主要核酸序列数据库。列数据库。列数据库。列数据库。EMBLEMBLEMBLEMBL是由是由是由是由EuropeanMolecularBiologyEuropeanMolecularBiologyEuropeanMolecularBiologyEuropeanMolecularBiology Laboratory Laboratory Laboratory Laboratory于于于于1982198219821982年创建的,目前由欧洲生物信年创建的,目前由欧洲生物信年创建的,目前由欧洲生物信年创建的,目前由欧洲生物信息学研究所负责管理息学研究所负责管理息学研究所负责管理息学研究所负责管理。数据库网址是:数据库网址是:数据库网址是:数据库网址是:http:/http:/www.ebi.ac.uk/emblwww.ebi.ac.uk/embl/。基因和基因组数据库基因和基因组数据库 GenBankGenBankGenBankGenBank 美国国家健康研究院美国国家健康研究院美国国家健康研究院美国国家健康研究院NIHNIHNIHNIH也于也于也于也于80808080年代初年代初年代初年代初委托洛斯阿拉莫斯国家实验室建立委托洛斯阿拉莫斯国家实验室建立委托洛斯阿拉莫斯国家实验室建立委托洛斯阿拉莫斯国家实验室建立GenBankGenBankGenBankGenBank,后移后移后移后移交给国家生物技术信息中心交给国家生物技术信息中心交给国家生物技术信息中心交给国家生物技术信息中心NCBINCBINCBINCBI,隶属于隶属于隶属于隶属于NIHNIHNIHNIH下设下设下设下设的国家医学图书馆。的国家医学图书馆。的国家医学图书馆。的国家医学图书馆。NCBINCBINCBINCBI的网址是:的网址是:的网址是:的网址是:http:/www.ncbi.nlm.nih.govhttp:/www.ncbi.nlm.nih.govhttp:/www.ncbi.nlm.nih.govhttp:/www.ncbi.nlm.nih.gov。DDBJDDBJDDBJDDBJ是是是是DNADataBaseofJapanDNADataBaseofJapanDNADataBaseofJapanDNADataBaseofJapan的简称,的简称,的简称,的简称,创建于创建于创建于创建于1986198619861986年,由日本国家遗传学研究所负责年,由日本国家遗传学研究所负责年,由日本国家遗传学研究所负责年,由日本国家遗传学研究所负责管理。管理。管理。管理。DDBJDDBJDDBJDDBJ的网址是:的网址是:的网址是:的网址是:http:/http:/http:/http:/www.ddbj.nig.ac.jpwww.ddbj.nig.ac.jpwww.ddbj.nig.ac.jpwww.ddbj.nig.ac.jp/。1988198819881988年,年,年,年,EMBLEMBLEMBLEMBL、GenBankGenBankGenBankGenBank与与与与DDBJDDBJDDBJDDBJ共同成立共同成立共同成立共同成立了国际核酸序列联合数据库中心,建立了合作了国际核酸序列联合数据库中心,建立了合作了国际核酸序列联合数据库中心,建立了合作了国际核酸序列联合数据库中心,建立了合作关系。关系。关系。关系。蛋白质数据库蛋白质数据库 1.PIR1.PIR和和PSDPSDPIRPIRPIRPIR国际蛋白质序列数据库国际蛋白质序列数据库国际蛋白质序列数据库国际蛋白质序列数据库(PSD)(PSD)(PSD)(PSD)是由蛋白质信息资源是由蛋白质信息资源是由蛋白质信息资源是由蛋白质信息资源(PIR)(PIR)(PIR)(PIR)、慕慕慕慕尼黑蛋白质序列信息中心尼黑蛋白质序列信息中心尼黑蛋白质序列信息中心尼黑蛋白质序列信息中心(MIPS)(MIPS)(MIPS)(MIPS)和日本国际蛋白质序列数据库和日本国际蛋白质序列数据库和日本国际蛋白质序列数据库和日本国际蛋白质序列数据库(JIPID)(JIPID)(JIPID)(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。共同维护的国际上最大的公共蛋白质序列数据库。共同维护的国际上最大的公共蛋白质序列数据库。共同维护的国际上最大的公共蛋白质序列数据库。PIRPIRPIRPIR和和和和PSDPSDPSDPSD的网址是:的网址是:的网址是:的网址是:http:/pir.georgetown.edu/http:/pir.georgetown.edu/http:/pir.georgetown.edu/http:/pir.georgetown.edu/。2.SWISS-PROT2.SWISS-PROTSWISS-PROTSWISS-PROTSWISS-PROTSWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息是经过注释的蛋白质序列数据库,由欧洲生物信息是经过注释的蛋白质序列数据库,由欧洲生物信息是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所学研究所学研究所学研究所(EBI)(EBI)(EBI)(EBI)维护。维护。维护。维护。SWISS-PROTSWISS-PROTSWISS-PROTSWISS-PROT的网址是:的网址是:的网址是:的网址是:http:/www.ebi.ac.uk/swissprot/http:/www.ebi.ac.uk/swissprot/http:/www.ebi.ac.uk/swissprot/http:/www.ebi.ac.uk/swissprot/。3.PROSITE3.PROSITE3.PROSITE3.PROSITEPROSITEPROSITEPROSITEPROSITE数据库收集了生物学有显著意义的蛋白质位点和序数据库收集了生物学有显著意义的蛋白质位点和序数据库收集了生物学有显著意义的蛋白质位点和序数据库收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个列模式,并能根据这些位点和模式快速和可靠地鉴别一个列模式,并能根据这些位点和模式快速和可靠地鉴别一个列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。未知功能的蛋白质序列应该属于哪一个蛋白质家族。未知功能的蛋白质序列应该属于哪一个蛋白质家族。未知功能的蛋白质序列应该属于哪一个蛋白质家族。PROSITEPROSITEPROSITEPROSITE的网址是:的网址是:的网址是:的网址是:http:/www.expasy.ch/prosite/http:/www.expasy.ch/prosite/http:/www.expasy.ch/prosite/http:/www.expasy.ch/prosite/。4.PDB4.PDB4.PDB4.PDB蛋白质数据仓库蛋白质数据仓库蛋白质数据仓库蛋白质数据仓库(PDB)(PDB)(PDB)(PDB)是国际上唯一的生物大分子结构数据是国际上唯一的生物大分子结构数据是国际上唯一的生物大分子结构数据是国际上唯一的生物大分子结构数据档案库,由美国档案库,由美国档案库,由美国档案库,由美国BrookhavenBrookhavenBrookhavenBrookhaven国家实验室建立。国家实验室建立。国家实验室建立。国家实验室建立。RCSBRCSBRCSBRCSB的的的的PDBPDBPDBPDB数据库网址是:数据库网址是:数据库网址是:数据库网址是:http:/www.rcsb.org/pdb/http:/www.rcsb.org/pdb/http:/www.rcsb.org/pdb/http:/www.rcsb.org/pdb/。功能数据库功能数据库1.KEGG1.KEGG1.KEGG1.KEGG京都基因和基因组百科全书京都基因和基因组百科全书京都基因和基因组百科全书京都基因和基因组百科全书(KEGG)(KEGG)(KEGG)(KEGG)是系统分析基因功能,是系统分析基因功能,是系统分析基因功能,是系统分析基因功能,联系基因组信息和功能信息的知识库。联系基因组信息和功能信息的知识库。联系基因组信息和功能信息的知识库。联系基因组信息和功能信息的知识库。http:/www.genome.ad.jp/kegg/http:/www.genome.ad.jp/kegg/http:/www.genome.ad.jp/kegg/http:/www.genome.ad.jp/kegg/。2.DIP2.DIP2.DIP2.DIP相互作用的蛋白质数据库相互作用的蛋白质数据库相互作用的蛋白质数据库相