生物信息学绪论.ppt
《生物信息学绪论.ppt》由会员分享,可在线阅读,更多相关《生物信息学绪论.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第一章第一章 生物生物信息信息学学绪论绪论金萍金萍南京师范大学南京师范大学比较基因组学与生物信息学实验室比较基因组学与生物信息学实验室1内内 容容一、生物信息学定义一、生物信息学定义一、生物信息学定义一、生物信息学定义二、生物信息学的发展历史二、生物信息学的发展历史二、生物信息学的发展历史二、生物信息学的发展历史三、生物信息学的主要研究内容三、生物信息学的主要研究内容三、生物信息学的主要研究内容三、生物信息学的主要研究内容四、生物信息学的研究意义四、生物信息学的研究意义四、生物信息学的研究意义四、生物信息学的研究意义五、生物信息学所用的方法和技术五、生物信息学所用的方法和技术五、生物信息学所用
2、的方法和技术五、生物信息学所用的方法和技术六、生物信息学学习方法六、生物信息学学习方法六、生物信息学学习方法六、生物信息学学习方法七、研究生物信息学的一般步骤七、研究生物信息学的一般步骤七、研究生物信息学的一般步骤七、研究生物信息学的一般步骤八、生物信息学的展望八、生物信息学的展望八、生物信息学的展望八、生物信息学的展望2一、生物信息学定义一、生物信息学定义3生物信息学(生物信息学(Bioinformatics)名词的由来)名词的由来八十年代末期,八十年代末期,林华安林华安博士认识到博士认识到将计算机科学与生物学将计算机科学与生物学结合起来的重要意义结合起来的重要意义,开始留意要为这一领域构思
3、一个合适的,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是是“CompBio”;之后,又将其更改为兼具法国风情的;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他,看起来似乎有些古怪。因此不久,他便便进一步把它更改为进一步把它更改为“bio-informatics(bio/informatics)”。但由于当时的电子邮件系统与今日不同,该名
4、称中的但由于当时的电子邮件系统与今日不同,该名称中的-或或/符号符号经常会引起许多系统问题,于是林博士将其去除,今天我们所经常会引起许多系统问题,于是林博士将其去除,今天我们所看到的看到的“bioinformatics”就正式诞生了,林博士也因此赢得就正式诞生了,林博士也因此赢得了了“生物信息学之父生物信息学之父”的美誉。的美誉。4生物信息学之父生物信息学之父林华安林华安Dr.HwaA.Lim(林华安)(林华安)1987年提出年提出“Bio-informatique”“Bioinformatics”1955年出生于马来西亚。联合国年出生于马来西亚。联合国Bioinformatics专家,专家,
5、UniversityofTexasatDallas分子与细胞生物学分子与细胞生物学AdjunctProfessor、中国科学院基因遗传研究所客座教授。中国科学院基因遗传研究所客座教授。1981年英国伦敦大学帝国学院年英国伦敦大学帝国学院(ImperialCollege,LondonUniversity)毕业,毕业,1986年获得美国年获得美国RochesterUniversity生化物理学博士学位,生化物理学博士学位,30岁取得佛罗里达州立大学终生教授。岁取得佛罗里达州立大学终生教授。1992年受聘担任美国国家癌症中心及美国国家科年受聘担任美国国家癌症中心及美国国家科学基金会审核委员。学基金会
6、审核委员。1995年后,历任多家生年后,历任多家生物科技公司生化信息执行长、副总裁等高层物科技公司生化信息执行长、副总裁等高层管理职位。管理职位。1997年,创立结合软件与数据分年,创立结合软件与数据分析的专业顾问公司析的专业顾问公司DTrends,服务生物技术、,服务生物技术、制药及卫生保健等机构。制药及卫生保健等机构。5什什么么是是生生物物信信息息学学?6背景背景人类基因组计划人类基因组计划(HumanGenomeProject,HGP):1990年正式启动,旨在完成人类基因组约年正式启动,旨在完成人类基因组约30亿个碱亿个碱基的全序列测定。基的全序列测定。海量生物数据的迅速膨胀:海量生物
7、数据的迅速膨胀:DNA、RNA和蛋白质和蛋白质序列,蛋白质二级结构和三维结构数据,蛋白质相序列,蛋白质二级结构和三维结构数据,蛋白质相互作用数据等。互作用数据等。对大量生物数据的管理、分析和信息化需求促进对大量生物数据的管理、分析和信息化需求促进了生物信息学的迅速发展。了生物信息学的迅速发展。7生命信息的组织、生命信息的组织、传递、表达传递、表达物理物理化学化学分子分子生物学生物学遗传学遗传学信息技术信息技术各学科参与、协作:生命科学、数学、物理学、化学、计算机各学科参与、协作:生命科学、数学、物理学、化学、计算机科学、材料科学以及伦理、法律等社会科学科学、材料科学以及伦理、法律等社会科学生物
8、信息学生物信息学诞生诞生8生物信息学定义的历史演变生物信息学定义的历史演变定义一:生物信息学是一门收集、分析遗传数据以及分发给定义一:生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科研究机构的新学科(Bioinformaticsisanewsubjectofgeneticdatacollection,analysisanddisseminationtotheresearchcommunity)。)。(Dr.HwaA.Lim,1987)定义二:生物信息学特指数据库类的工作,包括持久稳固的定义二:生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持在一个稳定的地
9、方提供对数据的支持(Bioinformaticsreferstodatabase-likeactivities,involvingpersistentsetsofdatathataremaintainedinaconsistentstateoveressentiallyindefiniteperiodsoftime)。)。(Dr.HwaA.Lim,1994)定义三:生物信息学是在大分子方面的概念型的生物学,并定义三:生物信息学是在大分子方面的概念型的生物学,并且使用了信息学的技术,这包括了从应用数学、计算机科学且使用了信息学的技术,这包括了从应用数学、计算机科学以及统计学等学科衍生而来各种方法
10、,并以此在大尺度上来以及统计学等学科衍生而来各种方法,并以此在大尺度上来理解和组织与生物大分子相关的信息。理解和组织与生物大分子相关的信息。(Luscombe,2001)9生物生物信息信息学学说文解字:说文解字:生物生物+信息信息+学学(bioinformatics)biology+information+theory广义:广义:应用信息科学的方法和技术,研究生物体应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种
11、生物信息,或者生理、病理、药理过程中的各种生物信息,或者也可以说成是也可以说成是生命科学生命科学中的中的信息科学信息科学。狭义:狭义:应用应用信息科学信息科学的理论、方法和技术,管理、的理论、方法和技术,管理、分析和利用分析和利用生物分子生物分子数据。数据。10“生物信息学和计算生物学生物信息学和计算生物学”计计划划 NIH于于2003年形成了一个通向生命科学未来的年形成了一个通向生命科学未来的“中中长期发展规划长期发展规划”-国立卫生研究院路线图国立卫生研究院路线图(NIHRoadmap)。)。NIH路线图中启动了一个路线图中启动了一个“生物生物信息学和计算生物学信息学和计算生物学”计划,希
12、望通过这个项目的计划,希望通过这个项目的实施而铺设一条通向生命科学未来的实施而铺设一条通向生命科学未来的“信息高速公信息高速公路路”。该项目计划从该项目计划从2004年开始,建立数个年开始,建立数个“国立国立生物医学计算中心生物医学计算中心”,以便开发相关软件和数据管,以便开发相关软件和数据管理工具。理工具。11计算生物学计算生物学计算生物学(计算生物学(ComputationalBiology)是生物学的)是生物学的一个分支。根据一个分支。根据美国美国国家卫生研究所国家卫生研究所(NIH)的定)的定义,它是指开发和应用数据分析及理论的方法、义,它是指开发和应用数据分析及理论的方法、数学建模数
13、学建模、计算机仿真计算机仿真技术等,用于生物学、行技术等,用于生物学、行为学和社会群体系统的研究的一门学科为学和社会群体系统的研究的一门学科。12生物信息学与计算生物学生物信息学与计算生物学区别与联系区别与联系 有些人将计算生物学作为生物信息学的有些人将计算生物学作为生物信息学的同义同义词词处理;但是另外一些人认为计算生物学和生物处理;但是另外一些人认为计算生物学和生物信息学应当被作为不同的信息学应当被作为不同的条目条目处理。处理。生物信息学主要侧重于对生物信息学主要侧重于对生物学生物学中所得信息中所得信息的采集、存贮、分析处理与可视化方面,而计算的采集、存贮、分析处理与可视化方面,而计算生物
14、学主要侧重于使用生物学主要侧重于使用计算技术计算技术对生物学问题进对生物学问题进行研究方面。行研究方面。13生物信息学生物信息学基本思想的产生基本思想的产生生物信息学生物信息学的迅速发展的迅速发展二十世纪二十世纪50年代年代二十世纪二十世纪80-90年代年代生物科学和生物科学和技术的技术的发展发展人类基因组人类基因组计划的计划的推动推动二、生物信息学的发展历史二、生物信息学的发展历史14(一)前基因组时代的生物信息学(一)前基因组时代的生物信息学u属于生物物理学范畴的传统生物信息学可以追溯到很久以前,属于生物物理学范畴的传统生物信息学可以追溯到很久以前,如研究生物发光、生物电、生物磁和激素等信
15、息物质的传递如研究生物发光、生物电、生物磁和激素等信息物质的传递现象及其相应测定技术。以研究序列比对为标志的现代生物现象及其相应测定技术。以研究序列比对为标志的现代生物信息学则起源于信息学则起源于20世纪世纪7080年代。年代。u这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生这一阶段的主要成就包括核酸和蛋白质序列的初步分析、生物学数据库的建立以及检索工具的开发。例如物学数据库的建立以及检索工具的开发。例如Dayhoff的替的替换矩阵、换矩阵、Neelleman和和Wunsch的序列比对(的序列比对(sequencealignment)及)及GenBank(由美国国立生物技术信息中心建(由
16、美国国立生物技术信息中心建立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,立和维护的核酸与蛋白质序列数据库)等大型数据库的建立,形成了生物信息学的雏形。形成了生物信息学的雏形。1520世纪世纪50年代,生物信息学开始孕育年代,生物信息学开始孕育20世纪世纪60年代,生物分子信息在概念上将计算年代,生物分子信息在概念上将计算生物学和计算机科学联系起来生物学和计算机科学联系起来20世纪世纪70年代,生物信息学的真正开端年代,生物信息学的真正开端(序列比对算法序列比对算法)20世纪世纪80年代初期,生物信息分析方法的发展年代初期,生物信息分析方法的发展20世纪世纪80年代以后,生物信息服务机构
17、和数据库年代以后,生物信息服务机构和数据库20世纪世纪90年代后年代后,HGP促进生物信息学的迅速发展促进生物信息学的迅速发展生物信息学的孕育和初步形成生物信息学的孕育和初步形成161956:美国田纳西州首次召开了美国田纳西州首次召开了“生物学中的理论研讨会生物学中的理论研讨会”;1962:Zucherkandl和和Pauling研究了序列变化与进化的关研究了序列变化与进化的关系,开创了一个新的领域系,开创了一个新的领域分子进化;分子进化;1967:Dayhoff研制出蛋白质序列图集,即后来著名的蛋白研制出蛋白质序列图集,即后来著名的蛋白质信息源质信息源PIR;1970:Needleman和和
18、Wunsch提出了著名的序列比对算法,提出了著名的序列比对算法,是生物信息学发展中最重要的贡献;是生物信息学发展中最重要的贡献;1970:Gibbs和和McIntyre发表著名的矩阵打点做图法;发表著名的矩阵打点做图法;1978:Gingeras等人研制了核酸序列中酶切位点识别程序;等人研制了核酸序列中酶切位点识别程序;1981:Smith和和Waterman提出了著名的公共子序列识别算提出了著名的公共子序列识别算法,同年法,同年Doolittle提出了关于序列模式的概念;提出了关于序列模式的概念;171982:GenBank第第3版本正式发行;版本正式发行;1983:Wilbur和和Lipm
19、an发表了数据库相似序列搜索算法;发表了数据库相似序列搜索算法;1986:日本核酸序列数据库日本核酸序列数据库DDBJ诞生;诞生;1986:蛋白质数据库蛋白质数据库SWISS-PROT诞生;诞生;1988:美国国家生物技术信息中心美国国家生物技术信息中心NCBI诞生;诞生;1988:成立欧洲分子生物学网络成立欧洲分子生物学网络(EMBNet),EMBL数据库诞数据库诞生;生;1988:Person和和Lipman发表了著名的序列比较算法发表了著名的序列比较算法FASTA;1990:快速相似性序列搜索算法快速相似性序列搜索算法BLAST问世,问世,1987年年BLAST的改进版本的改进版本PSI
20、-BLAST投入使用投入使用18(二)基因组时代的生物信息学(二)基因组时代的生物信息学u以基因组计划的实施为标志的基因组时代(以基因组计划的实施为标志的基因组时代(1990年至年至2001年)是生物信息学成为一个较完整的新兴学科并得到高速年)是生物信息学成为一个较完整的新兴学科并得到高速发展的时期。发展的时期。这一时期生物信息学确立了自身的研究领域这一时期生物信息学确立了自身的研究领域和学科特征,成为生命科学的热点学科和重要前沿领域之和学科特征,成为生命科学的热点学科和重要前沿领域之一。一。u这一阶段的主要成就包括大分子序列以及表达序列标签这一阶段的主要成就包括大分子序列以及表达序列标签(e
21、xpressedsequencetag,EST)数据库的高速发展、)数据库的高速发展、BLAST(basiclocalalignmentsearchtool)和)和FASTA(fastalignment)等工具软件的研制和相应新算)等工具软件的研制和相应新算法的提出、基因的寻找与识别、电子克隆(法的提出、基因的寻找与识别、电子克隆(insilicocloning)技术等,大大提高了管理和利用海量数据的能)技术等,大大提高了管理和利用海量数据的能力。力。19人类基因组计划人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的
22、奥秘由美国由美国NIH和能源部提出和带头,美、英、德、法、和能源部提出和带头,美、英、德、法、日、中共同参与的国际合作项目。日、中共同参与的国际合作项目。重大国际研究项目:测定人类基因组全部重大国际研究项目:测定人类基因组全部DNA序列,序列,构建人类基因组遗传图谱和物理图谱。构建人类基因组遗传图谱和物理图谱。1990年:年:正式启动,正式启动,30亿美元。亿美元。2001年:人类基因组草图公开发表。年:人类基因组草图公开发表。2003年:美国宣布该项目完成。年:美国宣布该项目完成。20HGP的历史回顾的历史回顾1984.12犹他州阿尔塔组织会议,初步研讨测定人类整个基犹他州阿尔塔组织会议,初
23、步研讨测定人类整个基因组因组DNA序列的意义序列的意义1985Dulbecco在在Science撰文撰文“肿瘤研究的转折点肿瘤研究的转折点:人人类基因组的测序类基因组的测序”美国能源部美国能源部(DOE)提出提出“人类基因组计划人类基因组计划”草案草案1987美国能源部和国家卫生研究院(美国能源部和国家卫生研究院(NIH)联合为)联合为“人类人类基因组计划基因组计划”下拨启动经费约下拨启动经费约550万美元万美元1989美国成立美国成立“国家人类基因组研究中心国家人类基因组研究中心”,Watson担担任任第一任主任第一任主任1990.10经美国国会批准,人类基因组计划正式启动经美国国会批准,人
24、类基因组计划正式启动211995第一个自由生物体流感嗜血菌第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成的全基因组测序完成1996完成人类基因组计划的遗传作图完成人类基因组计划的遗传作图启动模式生物基因组计划启动模式生物基因组计划H.inf全基因组全基因组Saccharomyces cerevisiae酿酒酵母酿酒酵母Caenorhabditis elegans秀丽线虫秀丽线虫221997大肠杆菌大肠杆菌(E.coli)全基因组测序完成全基因组测序完成1998完成人类基因组计划的物理作图完成人类基因组计划的物理作图开始人类基因组的大规模测序开始人类基因组的大规模测序Celera公司
25、加入,与公共领域竞争公司加入,与公共领域竞争启动水稻基因组计划启动水稻基因组计划1999.7第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划231999.7第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度2000Celera公司宣布完成果蝇基因组测序公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组国际公共领域宣布完成第一个植物基因组拟南芥全基拟南芥全基因组的测序工作因组的测序工作Drosophila melanog
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 绪论
限制150内