模式微生物基因组学.ppt
《模式微生物基因组学.ppt》由会员分享,可在线阅读,更多相关《模式微生物基因组学.ppt(135页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、模式生物的功能基因组学模式生物的功能基因组学从新的视角看老问题梁 磊1原核生物如大肠杆菌(Escherichia coli)和枯草芽孢杆菌(Bacillus subtilis),单细胞真核生物如啤酒酵母菌(Saccharomyces cerevisiae)都被作为传统的模式生物,这是因为它们结构简单、功能复杂、在实验系统中具有内在的优势。E.coli 的非致病实验菌株(K-12)被列为最早的全基因组测序对象,它在原核遗传学、分子生物学、生物技术、尤其是DNA重组技术领域是首选的模式生物。B.subtilis 是第一个进行全基因组测序的革兰氏阳性菌(1997),并且被作为研究生物化学、生理学、系
2、统发育的遗传学范例。S.cerevisiae 具有真核细胞的所有基本功能,并且人类疾病30的阳性克隆与酵母同源,对S.cerevisiae 基因产物的生物学作用做准确的测定是极其重要的一步,这有助于我们提高对遗传学上更复杂的、不易研究的多细胞动物的认识。基因组序列信息表明,超过30的开放阅读框(ORFs),包括E.coli的染色体和B.subtilis 的染色体没有实际的功能。在S.cerevisiae中大约6000个预测基因中的三分之一仍被归为未知细胞功能的阅读框。因此,除了基因组结构分析以外,其它的系统研究得到的信息对大量的序列数据归类于生物学上有意义的位置是十分必要的。功能遗传学和相关的
3、高通量综合技术学和方法学(例如,DNA微阵列、全基因组突变、双向凝胶电泳、双杂交系统、蛋白微阵列)试图在转录组学、蛋白组学、代谢组学、内部作用组学的细胞区域中确定新的基因。用功能基因组学方法分析和综合技术阐明模式生物的细胞区域生物信息学计算机建模DNA微阵列质谱噬菌体展示双杂交系统蛋白质芯片2D-PAGE二维电泳质谱2 Escherichia coli(大肠杆菌):(大肠杆菌):模式真细菌模式真细菌E.coli作为原核生物学中的模式实验生物,它的地位是无可比拟的。E.coli是最具特征的可自由生长的单细胞生物,并且它已用于研究细胞过程的生物学模式,如DNA的复制和修复、转录、代谢途径、应激反应
4、、信号传导和遗传学规律。尽管遗传学研究已有几十年,但E.coli K-12基因组中编码4,288个蛋白的38%的基因仍然不清楚生物学功能。这表明我们的认知还存在严重的不足,甚至是对于那些已被很好地研究过的模式生物。2.1Escherichia coli(大肠杆菌大肠杆菌)基因组基因组E.coli 序列数据除了使全基因组功能分析的方法成为可能,同时也揭示了一些新的基因。基因组序列的生物信息学分析也已经预测了一些结构和调控元件,这些是各种生物化学途径或细胞机制方面知识所不能预见的。在搜索序列相似性的基础上,芳香族化合物,如苯酚丙酸盐的降解途径的未知步骤被其他四个假定的mhp基因所揭示。在基因组序列
5、确定之前,mhp基因是已经存在的,但没有被鉴定。保守序列单元的出现确定了其中的一个mhp基因可能是由操纵子编码的代谢途径的转录调节子。序列研究揭示了第二个以前没有认识到的操纵子,该操纵子含有一些类似于假单胞菌(Pseudomonas)基因,能够降解芳香族化合物,如甲苯、苯、联苯。假设的操纵子由三个基因组成,包括能够打开芳香环和氧化C1,C2的1,2-双加氧酶,一个类似于二氢-1,2-双加氧酶的开放阅读框和基因编码的铁氧化还原蛋白还原酶。2.2 E.coli 转录组学转录组学全基因组核酸序列使研究者们能够应用cDNA方法或者基于寡核苷酸的微阵列分析方法,根据特异性刺激物、遗传变异或者生理紊乱来评
6、价基因组转录图。热激应答热激应答热激应答,有时一般也称作应激应答,是一种内环境稳定的机制。这种机制是由活细胞在对温度升高不适应的情况下显示出来的。这种进化学上保守的分子对热反应的应答是一种限制性蛋白热激蛋白诱导合成的。除了热激外,其他不利的生理条件,如暴露在乙醇中或转入重金属,都能引起热激蛋白产量的提高。在过热条件下,热激蛋白除了防止细胞蛋白变性和聚集外,也表现出一些对普通的生理生长所必要的功能,如辅助纠正多聚结构的组装,使新翻译的多肽折叠到它们自然的三级结构。因此,热激蛋白通常更多地被称为分子陪伴。在细菌中,细胞对热激的反应首先在E.coli中被发现并得到细致地研究。由于热激反应的保守性,它
7、已被作为一种模式系统来研究其他原核生物(如古菌)的调节基因的表达。尽管微阵列提供了E.coli中对应于温度升高时的一系列潜在的参与者,但需要用与基因表达图谱相结合的其他方法给出一个完整的描述:细胞是如何整合和调控这些功能,对环境应激产生一致和快速的适应反应。细胞代谢生长的转录组学分析细胞代谢生长的转录组学分析尽管我们已经知道一些与特定的生物合成或者代谢过程(如色氨酸生物合成)相关的必要的操纵子或基因,但不是出于这一目的的其它的基因在还没有发展更综合更全面的实验方法之前还没有被鉴定,这些基因影响着某些代谢行为或者受到某些代谢行为的影响。E.coli的色氨酸操纵子是分析的最透彻的细菌生物合成操纵子
8、之一。色氨酸操纵子的五个基因(依次是trpE、trpD、trpC、trpB、trpA)编码分支酸转化为色氨酸途径的酶。色氨酸操纵子的转录受抑制蛋白TrpR的抑制调控,也受一种称为转录弱化作用的完全不同的调节模式的抑制调控。功能基因组学,主要体现在微阵列介导的转录图,允许我们看到的不仅仅是微生物生理的某一焦点方面,如色氨酸代谢、特异性基因或调节子如何与基因表达的所有其他方面相互作用;而且还提供了一个观察基因组表达的视窗,如细胞在葡萄糖上生长的生理能力。功能基因组学的价值在一项分析基因组表达的研究中得到了证实,即E.coli在含0.2葡萄糖的基本培养基上和在含0.2的肉汤培养基上对数生长后期的基因
9、组表达。E.coli细胞在含葡萄糖的富营养培养基上的生长速度(世代时间G=25min)是含葡萄糖的基本培养基的两倍(G=57min)DNA阵列表明,某些功能上的基因转录的差异性与两种生长条件下细胞生理性状一致,因此提供了依赖于基因表达和生物合成调节子全面调节的生长速率研究。与119个(占所有标注基因的2.8)在富营养培养基上生长的基因相比,225个(占所有标注基因的5.2)在含葡萄糖的基本培养基上生长的基因有很高的表达水平(比例2.5倍)。影响生长速度的开放阅读框被分成以下几种功能类型:1、翻译装置;2、氮代谢;3、氨基酸生物合成;4、维生素、辅助因子、辅基、载体的生物合成;5、核苷酸生物合成
10、;6、脂肪酸生物合成和降解;7、碳源和能源代谢;8、细胞过程和整体调节子。在以葡萄糖为碳源和能源的丰富培养基上E.coli生长的标志性特征是快速的生长速度,生物合成途径的停止,大分子合成基因,最显著的是蛋白质合成基因表达的增多。所有这些生理方面的特征在基因组表达水平通过利用全基因组序列信息和使用DNA阵列技术得以揭示。微阵列分子也揭示了在基本葡萄糖培养基上生长的细胞,其碳和能量代谢基因的表达量是丰富培养基上生长时的4倍。利用综合的转录图谱,我们能够开始对这些未分类的基因根据它们与相似的或相关的基因共调节来描述一项假定的功能。此外,从微阵列实验中得到的可测试的假设可能提供证据来证实未知基因的生物
11、学功能。因此,基于微阵列的转录图谱为进一步研究特征性模式生物如E.coli提供了进一步的动力。NtrC(氮调节蛋白C)调节子调节子微阵列遗传学技术具有很多优势,它能够在特异性调节蛋白转录控制下检测所有的基因和操纵子。DNA微阵列技术促进了多基因网络的出现,如Ntr(氮调节)系统,它能根据E.coli细胞的生理状态信息执行一项细胞功能,通过吸收环境中可利用的氨得到氮,从而进行氨基酸生物合成。对外部有限的氮的分子反应是在氮调节蛋白C(NtrC)的控制下基因转录的活化。NtrC蛋白激活54-基因的转录,氮的吸收控制(Nac)蛋白通过激活氮限制条件下70-基因的转录,从而作为NtrC和70-操纵子的适
12、配器。细胞以这种方式整合各组基因和操纵子的表达以获得全面的适应反应。这种多基因条件导致了基因产物的表达,这些产物能够允许细胞利用环境中任何残留的氨,然后转变为其他的氮源,从而在氮限制条件下能够最小化生长。为了完全揭示E.coli的NtrC/Nac调节子,Zimmer和他的同事们(2000)使用DNA微阵列将NtrC激活基因过表达的突变株的整体转录水平与具有ntrC无效等位基因菌株中的整体转录水平相比较。尽管氮的网络已经在E.coli中得到很深入的研究,但综合的基因表达图谱鉴定了许多新的NtrC调节子。这些新的与ATP特异性结合的操纵子转运腐胺(potFGHI)、寡肽(oppABCDF)、二肽(
13、dppABCDF)、核苷酸(nupC)和D-丙氨酸/D-丝氨酸/甘氨酸(cycA)的次级离子共转运。其他一些新鉴定的NtrC/Nac-控制基因,包括几个编码假定蛋白(ycdGHIJKLM,yeaGH,yedL)操纵子,再次证明了微阵列表达图谱对于在某些细胞功能中说明未知基因的能力。从全基因组的角度检测NtrC/Nac调节子表明,NtrC控制了大约2的E.coli基因,其中大部分是底物转运的操纵子。这些基因的假定功能强调了E.coli在清除环境中含氮化合物的能力,作为抵御氮饥饿的第一道防线。2.3E.coli蛋白组学蛋白组学除了基因组结构分析和转录组学特征分析使用阵列技术外,蛋白组学分析依然是功
14、能研究的重要组成,因为蛋白组学分析能够观察到基因表达的最基本水平。与蛋白组学分析相关的中心问题是序列分析预测的开放阅读框的可靠性,蛋白质的物理特征是否与那些开放阅读框预测的一致。而且,已测序生物的蛋白组学的研究揭示了重要的特征,这些特征仅从基于基因组序列的理论蛋白组学是推断不出的。其它的信息包括生物体内蛋白的丰度,后翻译修饰,蛋白水解。蛋白组学分析的方法通常包括双向凝胶电泳(2-DE),然后是用N-末端测序或质谱的点鉴定。已有的全基因组序列对从双向凝胶中提取的蛋白种类进行快速鉴定很重要。仅是基因组序列不能对最终在细胞中产生的翻译产物在生化特性和功能上提供一个全面准确的描述。除了个别存在差异,大
15、部分情况下,由实验得到的等电点值和分子量值与基因组序列预测得到的值相当一致。观察值和预期值之间的偏差可能由基因组序列的高度加工蛋白或错译造成。用转录组学分析,蛋白表达和丰度的主要差异能在不同的细胞状态下测得。在Link和他的同事们的研究报道中,作者分别在最低限度的葡萄糖培养基中的指数生长期和丰富培养基中的稳定生长期检测了E.coli蛋白组的动态特性。2-DE分析不能全面的分析细胞的蛋白组学,几个在丰富培养基上稳定生长期早期鉴定的高丰度的蛋白质在葡萄糖最低限度培养基上生长的细胞中没有观察到。这些蛋白质是:色氨酸酶(TnaA),用于色氨酸的降解和合成;半乳糖结合蛋白(MglB),在半乳糖转运入细胞
16、的过程中起作用;饥饿诱导蛋白(Dps),它与DNA形成了稳定的复合物,因此保护DNA不被氧化毁坏。这项研究表明了一个生物学原则:细胞改变它们的蛋白成分以适应变化的环境条件。此外,还表明,更综合的分析方法,如最近发展的基因组学和蛋白组学的方法,正在改变我们观察活细胞的方法,甚至改变对已经被很好地描述过的模式生物的认识,如E.coli。蛋白组学能够被用来加强和支持由基因组序列分析提供的预测信息。2.4 E.coli的模式代谢:计算机代谢组学的模式代谢:计算机代谢组学近来的基因组科学的重要目标是将细胞的核苷酸序列信息与生理功能相联系。由于从基因组序列和功能研究得到的大量数据还在不断的积累,迫切需要能
17、够在硅片上建立系统的阐述和发展复杂而完整的细胞系统的代表或数学模型。图 :用已有基因组序列、生理生化数据重建微生物代谢网络以基因组序列为框架,再结合生理生化实验数据,能够在芯片上构建代谢途径的信息第一步,利用现有的相关基因组数据,生理生化数据重新构建微生物的代谢图谱。第二步,给代谢功能限制条件。第三、四步中,在细胞水平限制条件,以缩小符合要求的表型范围。通过这些步骤来预测代谢表现(例如,可以预测基因删除后对细胞和生物化学结果的影响)。这些研究表明:代谢行为的计算机分析能够简化生长实验的设计和报告基因敲除的鉴定。此外,芯片分析可能会有助于鉴定丢失的(例如,假定的)或者不正确的功能分配,这些功能分
18、配从基因组序列注释中得到。然而,这一领域的最新研究还处于初期,这种计算机模式和计算机模拟需要反复的实验研究来改进芯片模式。3 Bacillus subtilis:革兰氏阳性菌的典范革兰氏阳性菌的典范Bacillus subtilis是革兰氏阳性菌中最具特色的典型。它是一种需氧的杆状菌,能够形成内生孢子,在土壤和水中普遍存在。Bacillus subtilis和它关系相近的菌具有商业意义,因为它们具有代谢多样性,尤其是它们产生胞外水解酶(如,淀粉酶和蛋白酶)的能力,这些水解酶能够降解多糖、核酸、脂质。降解产物将作为生物体的碳源。除了大分子水解酶的产生,Bacillus subtilis在营养饥饿
19、的条件下开始次级代谢途径,如抗生素(如surfactin、fengycin、difficidin)的产生。营养性缺乏的条件使细菌可形成很独特的结构化学物质、辐射和干旱抗性的芽孢,这种条件下细菌生长难以重建。这些生理特征和遗传操纵的特征导致Bacillus subtilis成为研究革兰氏阳性菌的模式实验生物。它的全基因组序列在1997年发表,是第一个得到全基因组序列的革兰氏阳性真细菌。3.1 B.subtilis基因组基因组在已经完成测序的基因组中,即使是研究透彻的模式物种,在全部预测能编码蛋白的基因中也有3060不能根据序列的同源性来划分其功能。B.subtilis也不例外,它有42的基因功能
20、是未知的。尽管几十年来进行着大量的研究,但B.subtilis中只有约1,200个基因(约30)的功能有实验证明,这说明我们要完全了解B.subtilis的生理特征,必须在发现和确认新基因功能方面付出更多的努力。土壤微生物,如B.subtilis,在进化中得到复杂的调控系统以快速应对周围多变的环境条件和胁迫。细胞对环境压力适应性的调节在很大程度上受双组分信号转导途径的影响,该途径在原核生物中广泛存在。双组分调控系统包括一个传感蛋白激酶和与它同源的应激因子。在B.subtilis中,利用与已知蛋白序列的相似性,37个传感蛋白激酶和34个编码应激因子的基因已经被确定。微生物经常面临着许多环境压力的
21、胁迫(如温度、湿度或可用营养物质的变化)。B.subtilis的基因组序列表明,有43个温度休克蛋白和总应激蛋白在细菌适应环境变化中起到重要作用。这些蛋白和它们在大肠杆菌中的同源蛋白有很高的相似性,说明革兰氏阴性菌和阳性菌的细胞应激反应在进化上是保守的。ABC转运蛋白是B.subtilis中确定的功能最多的一组蛋白(Kunst et al.,1997),反映了两大类细菌外荚膜的结构差异。另外一些ATP结合转运蛋白可能增强了B.subtilis抗毒害的能力。B.subtilis基因组中预测共有77种ABC转运蛋白,已经通过克隆基因对它们有深入的了解。E.coli和B.subtilis全基因组的测
22、定,可全面地研究它们相关的基因组多样性。这种比较基因组的分析提出了一个观点,即可能在10亿多年前,真细菌进化分为革兰氏阴性和阳性两大类。尽管在基因组大小上B.subtilis(4.2Mb)和E.coli(4.6Mb)类似,并且预测的B.subtilis基因约有1,000种(25)和E.coli完全同源,但在基因的功能和操纵子结构上两个基因组之间存在一些明显的差异。和E.coli不同的是,许多B.subtilis基因参与次生代谢物如抗生素的合成。B.subtilis将近有4的基因编码大量的多功能酶,这些酶和链霉菌参与抗生素合成的蛋白质序列相似。基因组序列分析还清楚表明至少有10种原噬菌体或原噬菌
23、体的痕迹,说明噬菌体侵染在遗传信息空间传递上起了重要作用。通过观察氨基酸和嘌呤合成基因来研究两个基因组在基因组织方面的差异,显示一些E.coli合成精氨酸和嘌呤的基因分散在染色体上,而在B.subtilis的同源基因则整合在操纵子上。E.coli和B.subtilis的基因组中大量未知基因功能的确定将使我们更深入的了解这些模式物种的进化、生理以及功能分化。3.2 B.subtilis转录组学转录组学B.subtilis的全基因测序完成以来,人们建立了许多系统的功能分析来描绘不同生长条件、环境胁迫或抗逆、遗传突变情况下基因的功能和调控网络。下面我们将讨论基于微阵列技术的B.subtilis热休克
24、反应的功能分析,双组分调控系统和B.subtilis在不同环境下的生长。这些研究说明了功能基因组如何为B.subtilis的生理学提供充足的实验证据。B.subtilis中的热休克中的热休克B.subtilis遇到不同的限制其生长的环境压力,如热休克、渗透压和机械压力时,激活大量应激调节子基因来反应,这些调节子受一种转录因子B调节,同时转录调节因子HrcA或CtsR调控另外一些热诱导基。转录因子B 是革兰氏阳性菌的总应激因子。代谢、环境压力或饥饿情况下B 因子的活化是应激调节子诱导中重要的一步。许多总应激基因的转录在植物依赖A启动子下发生,但是遇到压力或饥饿依赖B因子途径就会急剧增强。发现新的
25、受B调节的基因并且确定其功能将有助于我们了解总抗逆调节子在B.subtilis抗逆适应中起到的生理作用。DNA微阵列包含了约4,100个已知的B.subtilis开放阅读框中将近90的PCR扩增片断,它用来检测热休克的整体转录水平。在这项研究中,培养的B.subtilis细胞从37(最佳生长温度)转到48(热休克温度)来引发热休克反应。从生长在两个不同温度的细胞中提取总RNA,用带有两种荧光的反转录酶标记,然后在B.subtilis的微阵列中做差异显示。在基因组水平分析,B.subtilis整个复杂的热休克反应在单个微阵列实验中就可阐明:超过10的基因表达在热激下呈现明显的上调,同时超过5的转
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 模式 微生物 基因组
限制150内