生物信息与生物信息学(共13页).docx
《生物信息与生物信息学(共13页).docx》由会员分享,可在线阅读,更多相关《生物信息与生物信息学(共13页).docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上一、生物信息生物信息是反映生物运动状态和方式的信息。碱基序列便是生物信息。自然界经过漫长时期的演变,产生了生物,逐渐形成了复杂的生物世界。生物信息形形色色,千变万化,不同类的生物发出不同的信息。目前,人们对生物信息的研究已取得了一些可观的成果,人们发现,鸟有“鸟语”,兽有“兽语”,甚至花也有“花语”。人们还发现生物信息与非生物信息之间有着某种必然的联系,如燕子、大雁的飞来飞去,预示着季节的变换和气温的升降;鱼儿浮出水面预示着大雨即将来临;动物的某些反常现象,预示着地震即将发生的信息。简介调节和控制生命活动的信号。是构成生物体的三大要素(物质、能量、信息)之一。生物信息
2、一般可分为遗传信息、神经和感觉信息及化学信息。虽然遗传信息和神经感觉信息的载体都属于化学物质,但通常所指的化学信息是除以上两类物质以外的化学物质所携带和传递的信息。高等生物的激素及昆虫外激素都属于这一类。遗传信息以密码形式存储在DNA分子上,通过DNA的复制传递给子代。在后代生长发育过程中,遗传信息自DNA转录给RNA,后翻译成特异的蛋白质,以执行各种生命功能。神经和感觉信息靠电脉冲和神经递质携带和传递。神经系统接受内外环境中的信息,进行加工处理,调节和控制机体各部分功能。化学信息是除上述两类物质外由化学介质传递的信息。生物体的各种功能能够有条不紊地进行,对环境能及时做出反应,是由于生物体内存
3、在着通过各种各样的化学信息分子进行传递的信息系统。计算机科学与基因组技术的发展,生物信息的概念又成为了基因的计算机数据库、数据处理、基因序列信息、生物系统的计算机分析与软件设计等含义,属于生物信息学或计算生物学的内容,从而形成了另外一种概念。遗传信息遗传信息(genetic information) 指生物为复制与自己相同的东西、由亲代传递给子代、或各细胞每次分裂时由细胞传递给细胞的信息, 即碱基对的排列顺序,或指核苷酸的排列顺序,DNA中的脱氧核苷酸、RNA中的核糖核苷酸的排列顺序。研究领域遗传信息是指生物为复制与自己相同的东西、由亲代传递给子代、或各细胞每次分裂时由细胞传递给细胞的信息,即
4、碱基对的排列顺序(或指DNA分子的脱氧核苷酸的排列顺序) 。在1866年首先是由G.J.Mendel(1866)的研究形成了概念,即相应于生物各种性状的因素(称为基因)中包含着相应的信息(以后G.Beadle等人(1941)所开创了遗传生物化学的研究,描绘出这样一个轮廓:基因和决定生物结构与功能的蛋白质之间具有一对一的对应关系。关于基因的化学本质方面,根据O.T.Avery等(1944)进行的转化实验,以及A.Hershey和M.Chase(1952)用大肠杆菌噬菌体的DNA进行的性状表达实验,已阐明DNA是遗传信息的载体。附着DNA结构研究的进展,1960年已经确立了这样的概念,即基因所具有
5、的信息可将DNA的碱基排列进行符号化。信息在表达时,DNA的碱基排列首先被转录成RNA的碱基排列,然后再根据这种排列合成蛋白质。有的病毒的遗传信息的载体不是DNA,而是RNA。遗传信息不仅有相应于蛋白质的基因信息,也包括对信息解读所必需的信息、控制信息表达所必需的信息,以及生物为了复制与自己相同结构所必需的一切信息。种类基因中脱氧核苷酸种类、数目和排列顺序的不同,决定了遗传信息的多样性。遗传传递分类生物体遗传信息的传递的几种类型;中心法则及其补充内容告诉了我们遗传信息的流动方向。其分解过程包含了如下6点:DNA的复制,遗传信息流动方向由DNADNA;DNA的转录,遗传信息流动方向由DNARNA
6、;翻译,遗传信息流动方向由RNA蛋白质;RNA的复制,遗传信息流动方向由RNARNA;RNA的逆转录,遗传信息流动方向由RNADNA;蛋白质的复制,遗传信息流动方向由蛋白质蛋白质。但是究竟在生物体中遗传信息的传递应该包含其6点内容中的几种呢?不同类型的生物,遗传信息的传递过程也有所差异。生物体遗传信息的传递大致分为如下类型:DNA复制型在DNA复制型的生物中,生物体的遗传信息流动包含3点:DNA的自我复制,遗传信息流动方向由DNADNA;DNA的转录和翻译,遗传信息流动方向由DNARNA蛋白质。这种类型的生物主要针对地球上绝大多数的动植物和噬菌体病毒等。RNA复制型在RNA复制型的生物中,生物
7、体的遗传信息流动包含2点:RNA的自我复制,遗传信息流动方向由RNARNA;翻译,遗传信息流动方向由RNA蛋白质。这种类型的生物主要针对植物病毒如烟草花叶病毒和动物病毒如脊髓灰质炎病毒等。也有些遗传信息的流动只有1种:RNA的自我复制,遗传信息流动方向由RNARNA;这种类型的生物主要针对SARS病毒,流感病毒等。RNA逆转录型在RNA逆转录型的生物中,生物体的遗传信息流动包含3点:RNA的逆转录,遗传信息流动方向由RNADNA;转录,遗传信息流动方向由DNARNA,翻译,遗传信息流动方向由RNA蛋白质。这种类型的生物主要针对致癌病毒和导致艾滋病的人体免疫缺陷病毒(HIV)。蛋白质复制型在蛋白
8、质复制类型的生物中,生物体的遗传信息流动包含1点:蛋白质的复制,遗传信息流动方向由蛋白质蛋白质;这种类型的生物2000年以前只发现一种即盛行欧美的疯牛病病毒(朊病毒)。起源遗传信息是由三联体密码子记载的,因此遗传信息的起源归根结底就是密码子的起源问题。迄今为止,提出了若干假说。这些学说分别从偶然性、化学相互作用、协同演化、生化系统起源以及综合作用等不同视角探讨了遗传密码子起源的可能途径,特别是以生化系统构建为目的的从能量转化到信息化的演化机制值得关注。凝固事件假说克里克(Francis Crick)提出凝固事件假说(frozen accident hypothesis),认为密码子与氨基酸的关
9、系是在某一时期固定的,之后很难再被改变。所有的生物几乎使用着同样一套密码似乎支持这一假说,这也表明,所有生物起源自单一的共同祖先(Crick 1968)。这推测了演化事件的重要时间节点。立体化学假说韦斯(Carl Richard Woese)提出了立体化学假说(stereochemical hypothesis),认为氨基酸与它们相对应的密码子有选择性的化学结合力,即遗传密码的起源和分配与RNA和氨基酸之间的直接化学作用密切相关,或者说,密码子的立体化学本质取决于氨基酸与相应的密码子之间物理和化学性质的互补性(Woese et al. 1966)。这可能是密码子起源的一个重要化学机制。Poly
10、ansky等(2013)通过实验和计算发现,mRNAs中不同核酸碱基的密度分布,非常类似于它们所编码的蛋白质中这些相同核酸碱基的氨基酸亲电子密度分布,遗传密码进行了高度最佳化,以最大化这种匹配。共进化假说王子晖(J. Tze-Fei Wong)提出了共进化假说(co-evolution hypothesis),认为密码子系统有原始氨基酸形成的前生物代谢途径的印迹,因此可以从氨基酸代谢途径发现密码子的演变过程,即密码子的进化与氨基酸生物合成的进化是并列的。该假说认为,氨基酸和相应编码的忠实性反映了氨基酸生物合成路径的相似性,并非物理化学性质的相似性(Wong 1975)。这推测了密码子起源的一种
11、可能路线,但是,从简单的原料合成各种氨基酸可能是发生在前生命演化末期的事情了。ATP中心假说谢平(2016)提出了ATP中心假说(ATP-centric hypothesis),认为遗传密码子是生化系统的一部分,因此,必须与生化系统的演化相关联,而生化系统的核心是能量载体ATP(各种生化循环,如卡尔文循环、糖酵解和三羧酸循环等,均与ATP相耦联),它是光能转化成化学能的唯一终产物,它可以衍生出其它核苷酸,这些核苷酸可以自身缩合成核酸。ATP可活化氨基酸,为多肽链的缩合提供了能量基础。因此,只有ATP才能建立起核酸和蛋白质之间的联系。综合进化假说Knight等(1999)提出了综合性假说,认为遗
12、传密码是由选择(selection)、历史(history)和化学(chemistry)三个因素在不同阶段起作用的。该假说认为,在遗传密码起源初期,可能主要是氨基酸和密码子之间的直接相互作用来决定氨基酸的编码;在新氨基酸的引入和密码子扩展阶段,共进化作用可能占据主导地位;而随着tRNA的进化和蛋白质的功能增加,逐渐去除了氨基酸和密码子的直接相互作用,密码子在不同尺度上的交换在某些程度上允许通过密码子的重新分配进行优化。其它假说1981年艾根提出了试管选择(in vitro selection)假说,1989年英国化学家奥格尔(Leslie Eleazer Orgel)提出了解码(decodin
13、g)机理起源假说,1988年比利时细胞生物学和生物化学家杜维(Christian de Duve,1974年获诺贝尔生理学或医学奖)提出了第二遗传密码(second genetic code)假说。英国巴斯大学的Wu等(2005)推测,三联体密码从两种类型的双联体密码逐渐进化而来,这两种双联体密码是按照三联体密码中固定的碱基位置来划分的,包括前缀密码子(Prefix codons)和后缀密码子(Suffix codons)。不过,也有人推测三联体密码子是从更长的密码子(如四联体密码子quadruplet codons)演变而来,因为长的密码子具有更多的编码冗余从而能抵御更大的突变压力(Bara
14、nov et al. 2009)。2007年中国科学院北京基因组研究所的肖景发和于军(2007年)提出了遗传密码的分步进化假说(stepwise evolution hypothesis),认为最初形成的遗传密码应该仅仅由腺嘌呤A和尿嘧啶U来编码,共编码7个多元化的氨基酸,随着生命复杂性的增加,鸟嘌呤G从主载操作信号的功能中释放出来,再伴随着C的引入,使遗传密码逐步扩展到12,15和20个氨基酸(肖景发和于军2009)。厦门大学的有机化学家赵玉芬(1994-1996年)也曾提出核酸与蛋白共同起源的观点,认为“磷是生命化学过程的调控中心”,因为磷酰化氨基酸能同时生成核酸及蛋白,又能生成LB膜及脂
15、质体。她认为,原始地球火山频发,焦磷酸盐、焦磷酸脂类化合物容易在地表积累,其POP键含有的能量,通过与氨基酸形成PN键,最终转移到肽键和核苷酸的磷酸二酯键中。她推测,磷酰化氨基酸在同时生成蛋白质和DNA/RNA的过程中,蛋白质与DNA/RNA可以通过磷酰基的调控作用相互影响,从而产生了原始密码子的雏形,并进一步进化到遗传密码的现代形式。但问题是,磷酰化氨基酸为何要导演核酸和蛋白质的共进化故事呢?也有将关于密码子起源的各种学说分为这样四类的:化学原理(Chemical principles)、生物合成扩展(Biosynthetic expansion)、自然选择(Natural selectio
16、n)和信息通道(Information channels)。根据信息理论研究中的率失真模型(rate-distortion models)推测,遗传密码子的起源取决于三种相互冲突的进化力量的平衡:对多样的氨基酸的需求、抵御复制错误以及资源最小成本化(Freeland et al. 2003,Sella and Ardell 2006,Tlusty 2008,)。化学信息:生物在某些特定条件下,或某个生长发育阶段,分解出某些特殊的化学物质。这些分泌物不是对生物提供营养,而是在生物的个体或种群之间起着某种信息的传递作用,即构成了化学信息。如蚂蚁可以通过自己的分泌物留下化学痕迹,以便后面的蚂蚁跟随;
17、猫、狗可以通过排尿标记自己的行踪及活动区域。化学信息对集群活动的整体性和集群整体性的维持具有极重要的作用。二、生物信息学生物信息学(Bioinformatics)是研究生物信息的采集、处理、存储、传播,分析和解释等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术而揭示大量而复杂的生物数据所赋有的生物学奥秘。简介生物信息学(Bioinformatics) 1 是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的
18、核心领域之一。其研究重点主要体现在基因组学(Genomics)和蛋白质组学(Proteomics)两方面,具体说就是从核酸和蛋白质序列出发,分析序列中表达的结构功能的生物信息。定义生物信息学是一门收集、分析遗传数据以及分发给研究机构的新学科(Bioinformatics is a new subject of genetic data collectionanalysis and dissemination to the research community)。(林华安,Dr. Hwa A. Lim,1987)二.生物信息学特指数据库类的工作,包括持久稳固的在一个稳定的地方提供对数据的支持(B
19、ioinformatics refers to databaxxxxse-like activitiesinvolving persistent sets of data that are maintained in a consistent state over essentially indefinite periods of time)。(林华安,Dr. Hwa A. Lim,1994)三.生物信息学是在大分子方面的概念型的生物学,并且使用了信息学的技术,这包括了从应用数学、计算机科学以及统计学等学科衍生而来各种方法,并以此在大尺度上来理解和组织与生物大分子相关的信息。(Luscombe
20、2001)具体而言,生物信息学作为一门新的学科领域,它是把基因组DNA序列信息分析作为源头,在获得蛋白质编码区的信息后进行蛋白质空间结构模拟和预测,然后依据特定蛋白质的功能进行必要的药物设计。基因组信息学,蛋白质空间结构模拟以及药物设计构成了生物信息学的3个重要组成部分。从生物信息学研究的具体内容上看,生物信息学应包括这3个主要部分:新算法和统计学方法研究;各类数据的分析和解释;研制有效利用和管理数据新工具。生物信息学是一门利用计算机技术研究生物系统之规律的学科。生物信息学基本上只是分子生物学与信息技术(尤其是因特网技术)的结合体。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具
21、是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。1990年代以来,伴随着各种基因组测序计划的展开和分子结构测定技术的突破和Internet的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。对生物信息学工作者提出了严峻的挑战:数以亿计的ACGT序列中包涵着什么信息?基因组中的这些信息怎样控制有机体的发育?基因组本身又是怎样进化的?生物信息学的另一个挑战是从蛋白质的氨基酸序列预测蛋白质结构。这个难题已困扰理论生物学家达半个多世纪,如今找到问题答案要求正变得日益迫切。诺贝尔奖获得者W. Gilbert在1991年曾经指出:“传统生物
22、学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设”。生物信息学的主要研究方向:基因组学 - 蛋白质组学 - 系统生物学 - 比较基因组学,1989年在美国举办生物化学系统论与生物数学的计算机模型国际会议,生物信息学发展到了计算生物学、计算系统生物学的时代。姑且不去引用生物信息学冗长的定义,以通俗的语言阐述其核心应用即是:随着包括人类基因组计划在内的生物基因组测序工程的里程碑式的进展,由此产生的包括生物体生老病死的生物数据以前所未有的速度递增,已达
23、到每14个月翻一番的速度。同时随着互联网的普及,数以百计的生物学数据库如雨后春笋般迅速出现和成长。然而这些仅仅是原始生物信息的获取,是生物信息学产业发展的初级阶段,这一阶段的生物信息学企业大都以出售生物数据库为生。以人类基因组测序而闻名的塞莱拉公司即是这一阶段的成功代表。生物信息学产业的高级阶段体现于此,人类从此进入了以生物信息学为中心的后基因组时代。结合生物信息学的新药创新工程即是这一阶段的典型应用。经历阶段前基因组时代(20世纪90年代前) 这一阶段主要是各种序列比较算法的建立、生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析等。基因组时代(20世纪90年代后至2001年) 这一
24、阶段主要是大规模的基因组测序,基因识别和发现,网络数据库系统地建立和交互界面工具的开发等。后基因组时代(2001至今) 随着人类基因组测序工作的完成,各种模式生物基因组测序的完成,生物科学的发展已经进入了后基因组时代,基因组学研究的重心由基因组的结构向基因的功能转移。这种转移的一个重要标志是产生了功能基因组学,而基因组学的前期工作相应地被称为结构基因组学。发展简介生物信息学是建立在分子生物学的基础上的,因此,要了解生物信息学,就必须先对分子生物学的发展有一个简单的了解。研究生物细胞的生物大分子的结构与功能很早就已经开始,1866年孟德尔从实验上提出了假设:遗传因子是以生物成分存在,1871年M
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息 信息学 13
限制150内