医学专题—综述:大肠杆菌中重组蛋白的表达:进展与挑战38038.doc
大肠杆菌中重组蛋白的表达:进展与挑战毫无疑问,重组蛋白在微生物中的表达革新了生物化学领域。以前,纯化少量的目的蛋白需要处理几千克的动物或植物组织,或是大量的生物体液,这个时代已经一去不返了。对于每个研究者来说,如果他要开始一个项目,需要某种纯化的蛋白。他马上就会想到,怎样通过重组表达的方式获得这种蛋白。目的重组蛋白的大量表达使人们能够对其生物化学性质进行分析,将其应用于工业并发展成为商业化产品。从理论上来讲,获得重组蛋白的过程相当直接:获得目的基因,克隆到表达载体,转入表达宿主,诱导,纯化。然而,实际上,事情通常并不是这样。宿主菌生长差,包涵体的形成,蛋白无活性,甚至无法获得任何蛋白,这些都是实验中会遇到的问题。在过去,有许多综述详细地介绍了这个课题。综合来说,这些论文收集了2000多个例子。然而在重组蛋白表达纯化领域,一直都在进步着。因此,在本综述中,我们对本领域最近取得的进展做了评述。同时,对于那些那些对异源表达还不大熟练的研究人员,我们通过回答项目开始就需要解决的问题,提供的许多选择和方法,。这些选择和方法,在过去的几十年里,曾被成功的用来表达一系列的蛋白。问题一:选择哪种生物体作为表达宿主?整个过程的开始就是要选择宿主细胞,利用它的蛋白合成机制来获得珍贵的蛋白。宿主的选择决定了我们以后所需要的技术,包括各种分子工具,仪器或者试剂。在这些微生物体中,现有的宿主系统包括细菌,酵母,filamentous fungi, 和 unicellular algae。他们各有优点和缺点,宿主的选择可能取决于我们要表达的蛋白。例如,如果目的蛋白需要翻译后的修饰,那么我们就要选择真核表达系统。在本篇综述里,我们主要详细介绍大肠杆菌表达系统。众所周知,利用大肠杆菌作为宿主具有很多优点。1.它有无可比拟的快速生长机制,在glucose-salts培养基中,以及在最优的环境条件下,它扩增一倍的时间大约是20分钟。这意味着以1/100接种的菌液在几个小时就可以生长至饱和。然而,需要注意,重组蛋白的表达可能对微生物体的造成代谢压力,导致菌体扩增大幅减慢。2.高浓度细胞培养物较容易实现。在液体培养物中,理论的浓度估计最低大约是200g 细胞干重/l 或者1×1013个活力细胞/ml.然而,细菌在复合培养基中的指数生长是的它的浓度远没有达到这个值。在最简单的实验设置中(例如:37,在LB培养基中生长),细菌最高能长到1×1010/ml,还不到理论值的0.1%。因此,甚至为了获得重组蛋白,我们也需要一种高浓度细胞培养的方法以促进大肠杆菌的生长。作为一个重负荷机器的有机体,由于对其生理的深入研究,这些策略不断的出现。3.用一些廉价的成分,可以很容易的配制富营养的复合培养基。4 DNA的转化方便而且快捷。质粒转入大肠杆菌中甚至可以在5分钟内完成。问题二:选择哪一个质粒?目前最普遍使用的质粒是复制子,启动子,选择标记,多克隆位点组合和融合蛋白以及融合蛋白切除策略多个因素组合的结果。因此,表达载体的种类是非常多的,人们常常不知道选择哪一个才好。想要做一个明智的决定,这些特征需要根据每个人的需要认真的评价。复制子基因单元如质粒能够自动的复制,都包含有复制子。复制子是由复制起点以及相关的反式作用元件。选择一个合适载体的一个重要的参考因素是它的拷贝数。拷贝数是由复制子控制的。通常人们会认为,高含量的质粒会得到更多的重组蛋白,因为细胞内存在大量的表达单位。然而,大量的质粒会造成代谢压力,减缓细菌生长,可能会是质粒变得不稳定,因此,能有效合成蛋白的生物体减少。所以,高拷贝质粒无论如何不会提高蛋白产量的。通常使用的载体,例如pET系列载体,具有pMB1复制起点(ColE1衍生,每个细胞有15-60个拷贝),而在pUC系列中存在pMB1复制起点的一个突变的类型型(500-700个拷贝每个细胞)。ColE1复制起点(15-20个拷贝/细胞)的野生型存在于pQE载体中。这些复制起点是不兼容的,在同一个细胞内会相互竞争复制机制,所以他们不能在同一细胞内扩增。想要利用两个质粒进行双表达,可以使用带有p15A复制起点的表达系统(pACYC和pBAD系列载体,10-20拷贝/细胞)。三表达可以使用pSC101质粒,尽管这种情况很少。这个质粒受到复制子的严谨性控制,因此它的拷贝数很低(<5拷贝/细胞)。对于某种基因或者蛋白产物过量对细胞产生有害作用这种情况,可以考虑选择具有该复制子的质粒。可以选择的是,共表达载体通过克隆两个基因在同一个质粒上,可以简化双表达。共表达载体拥有两个多克隆位点,每个多克隆位点都有一个T7启动子,一个lac启动子和一个核糖体结合位点。通过使用不同的兼容的共表达载体,4个表达载体可以得到八种重组蛋白。启动子毫无疑问,在原核启动子研究中最主要的lac启动子。Lac启动子是lac操纵子最主要的元件。对此系统功能的深入了解使得lac启动子在表达载体中有了进一步的应用。乳糖可以作为诱导剂用来产生蛋白。然而,在直接代谢碳源如葡萄糖存在时,诱导可被抑制。在乳糖和葡萄糖同时存在时,由lac启动子引发的表达知道所有的葡萄糖消耗之后才会可是。在这个时候(低葡萄糖),产生了cAMP,促进lac启动子完全激活。这种表达的正控制称为降解物阻遏作用。相应地,在生长于lac启动子抑制性糖类的细胞中,cAMP的水平很低,这与lac启动子低表达速率相关。葡萄糖也破坏了乳糖的吸收,因为在葡萄糖存在的情况下,乳糖透过酶是没有活性的。为了使表达能在葡萄糖存在的情况下进行,引入了一个突变型可以降低(但不完全消除)对代谢产物调控的敏感性,lacUV5 启动子。然而,当多拷贝质粒存在时,即使没有加入诱导剂,由于lac启动子阻遏蛋白只存在于单个染色体上(大约10个分子/细胞),启动子也会不可避免的高水平表达。本底表达的控制可以通过引入一个lacI基因的突变启动子,称为ladIQ,使LacI蛋白能表达提高十倍左右。Lac启动子及其衍生启动子lacUV5表达相当地弱,因此对于表达重组蛋白并不是十分有用。合成的杂交体结合了其他启动子和lac启动子的优点。比如,tac启动子包含了trp启动子的-35区序列和lac启动子的-10区序列。这个启动子比lacUV5启动能力强了大约10倍。应用较多的采用lac或tac启动子启动表达的商业化质粒包括pUC系列(lacUV5启动子,thermo Scientific)和pMAL系列载体(tac启动子,NEB)采用T7启动子系统的pET载体是相当受欢迎的表达载体。这不足为奇,因为目标蛋白通常会占到总细胞蛋白的50%以上。在该表达系统中,目标基因克隆到一个由噬菌体T7 RNA聚合酶识别的启动子后面。这中高度活性的聚合酶应该由另外一个质粒提供或者更多的是由编码T7RNA聚合酶的前噬菌体整合到细菌基因组中,由lacUV5启动子启动。因此,该系统可以由乳糖或者它的non-hydrolyzable analog isopropyl-D-1-thiogalactopyranoside(IPTG)诱导。本地表达可以有lacIQ控制也可以通过T7溶菌酶共表达控制。T7溶菌酶结合到T7RNA聚合酶上并一致T7启动子的转录起始。通过这种方式,如果少量的T7 RNA聚合酶由于其基因的渗漏表达而产生,T7溶菌酶会有效地抑制T7启动子控制下的不本底表达。T7溶菌酶是由一个兼容的质粒提供(pLysS或者pLysE)。诱导之后,T7 RNA酶的量超过了T7溶菌酶所能抑制的量。“自由的”T7 RNA聚合酶可以参与重组基因的转录。在T7 启动子下游插入lacO启动子,形成了杂合的T7/lacIQ启动子,构成另外一个水平的控制。所有这三种机制(由lacIQ启动子介导的lac诱导T7 RNA聚合酶基因的严谨性抑制,T7溶菌酶介导的T7RNA聚合酶的抑制和在T7启动子下游的lacO启动子)构成了避免本底表达的理想的系统。渗漏表达的问题反映了lac启动子的负调控。依赖于正调控的启动子应该有更低的表达水平。pBAD载体的araPBAD就属于这种启动子。AraC蛋白同时具有激活和抑制的作用。当不存在阿拉伯糖诱导剂的时候,AraC通过与DNA结合抑制抑制翻译。蛋白-DNA复合物形成一个环,有效地阻止RNA聚合酶结合到启动子上。加入了诱导剂,AraC转变为激活模式并启动ara启动子转录。在这种方式下,阿拉伯糖是诱导所必须的。另外一个广泛使用的途径是在调控噬菌体启动子下游加入一个基因。这个强的Lambda噬菌体右侧的启动子(pL)起始促细胞溶解基因表达。这个启动子受到cI抑制蛋白的严谨抑制,在溶原生长阶段cI抑制蛋白结合到启动子上面。当因为DNA损坏引发宿主的SOS应急反应时,RecA蛋白的表达被激活,反过来催化cI的自我剪切,使pL控制的基因转录。这个机制被用在包含pL启动子的表达载体上面。SOS应急反应(重组蛋白表达)可以通过加入萘啶酸,一种DNA旋转酶抑制剂。另外一个激活启动子的方式是通过将cI基因放在另外一个启动子的下游来控制cI的产生。这种两阶段的控制系统已经被用于基于T7启动子/T7 RNA聚合酶的载体上。在pLEX系列载体(Life Technologies)中,cI抑制基因被整合在细菌染色体中受到trp启动子的控制。在缺少trp的情况下,这个启动子通常是打开的,cI蛋白持续地产生。加入trp之后,形成了trp-trpR抑制因子复合物,紧密的结合到trp启动子,阻止cI抑制蛋白的合成。然后在pL启动子控制下的目的蛋白的表达开始。到此为止我们讨论的所有的启动子引发的转录都是有化学信号引发的。也有一些系统是与物理信号反应的(比如温度或者pH)。pL启动子是一个例子。cI抑制蛋白的一个突变体(cI857)是温度敏感的,在高于37的时候不稳定的。包含cI857蛋白大肠杆菌宿主菌(整合到染色体中或者载体中)先生长在28-30,长到需要的浓度,然后当温度达到40-42蛋白表达开始诱导。这个系统的商业价值一部分在于,在发酵过程中,通常都会产热,在培养物达到高浓度的时温度上升是很容易的。另一方面,在温度低于15的时候,在冷诱导启动子cspA控制下的基因开始被诱导。这个温度适于表达一些难于表达的蛋白。pCold 系列载体以pUC118为骨架(一个PUC18的衍生物),有一个cspA启动子。在最初的论文中,30多个不同来源的重组蛋白被成功表达,重组蛋白占了总表达蛋白的20-40%。然而,应该注意,在一些情况下,获得的目的蛋白并不可溶。选择性标记为了阻止不含有质粒细胞的生长,在质粒的骨架上加入了一个选择性标记。在大肠杆菌系统中,抗性基因通常是为此目的而使用。氨苄抗性是由bla提供,bla基因的产物是一种周质酶,可以使-lactam ring of-lactam antibiotics失活。然而,当-lactamase持续分泌时,抗生素开始降解,在几个小时之后,氨苄青霉素几乎消耗干净。在这种情况下,在培养过程中,没有携带质粒的细胞开始增加。尽管在实验上还没有证实,抗性基于降解的选择试剂,比如氯霉素,卡那霉素也都有这样的问题。为此,在培养过程中Tetracycline表现高度稳定的特征,因为其抗性是基于抗性细胞抗生素的活性流出。在大规模培养中,主要面临的问题是抗生素成本和抗生素的dissemination。在开发无抗生素质粒系统的过程中,人们做了很多努力。这些系统以质粒依赖这个概念为基础。质粒依赖是当没有质粒的细胞不能生长或者存活所发生的一种现象。例如,可以将一个关键的基因从细菌基因组中删除,然后插入质粒中。因此,当细胞分裂后,没有质粒的细菌死亡。根据他们功能的原则,质粒依赖系统可以分为不同的亚型:1.基于毒素/抗毒素的系统。2.基于代谢的系统和3.启动子抑制因子滴定系统。虽然被证实这个有前景的技术成功的用于大规模发酵,基于质粒依赖的表达系统仍然没有广泛使用。亲和标签如果需要纯化可溶的有活性的重组蛋白,设计这个项目时,我们有手段做到以下方面是很有价值的:1.在表达和纯化过程中,能够检测这个蛋白,2.有最大的可溶性,3.很容易地从细胞中纯化到这个蛋白。表达一段氨基酸(多肽标签)或者一个大的多肽(融合标签)与目的蛋白串联形成嵌合体蛋白可以使得这些目标直接地达到。因为很小,多肽标签与蛋白融合的时候与蛋白作用的可能行很小。然而,在一些情况下,多肽可能对融合蛋白的三级结构或者生物活性产生负面的影响。可以得到标签在N端或者C端的载体(当信号肽在N端时后者更加适合用于分泌表达)。如果知道了目的蛋白的三维结果,最好检查一下哪一端包埋在蛋白内部,将标签放置在接近溶剂一端。常用的小的多肽标签如poly-Arg,FLAG-,poly-his,c-Myc-,S-,和Strep II。因为这些标签都有对应的商业化抗体提供,在表达实验过程中带标签的重组蛋白可以由Western blot检测,这对于目的蛋白的表达水品不足以用SDS-PAGE检测是十分有用。标签也可以用来进行一步纯化,因为能紧密而特异地结合标签的树脂都有提供。例如,His标签蛋白可以用固相金属离子(Ni2+或者Co2+)亲和层析纯化。抗FLAC亲和树脂用来纯化FLAG融合蛋白。另一方面,非多肽融合分子伴侣作为促溶分子更加有优势。最受欢迎的融合标签是麦芽糖结合蛋白(MBP),N-utilization substance protein A,thioredoxin (Trx; LaVallie et al., 1993), glutathioneS-transferase(GST; Smith and Johnson, 1988), ubiquitin (Baker, 1996) and SUMO (Butt et al., 2005)。除了几个假说外,这些伴侣分子的助溶机制仍不清楚。比较而言,GST的助溶能力最差。NusA,MBP和Trx表现出最好的助溶特征,但是他们较大的分子量可能导致对其助溶效果的错误的估计。的确,当这些标签去除之后,目的蛋白的可溶性仍然无法预料。因此,我们更需要一些更小的而且助溶能力强的标签。最近,发现来自寄生肝片吸虫的8 kDa的钙离子结合蛋白Fh8被发现与打的标签有同样强的助溶能力。灵位,当标签去除之后、目的蛋白仍然表现出可溶性。MBP和GST可以通过亲和层析来纯化融合蛋白,因为MBP与淀粉-琼脂糖结合,GST与谷胱甘肽-琼脂糖结合。pGEX(GE)系列载体含有GST标签,pMAL(NEB)系列载体含有MBP标签。如果在纯化过程中需要用到亲和层析,必须在含有融合分子伴侣的的蛋白上再加一个多肽标签。MBP和GST与他们的基质是非共价结合的。相反,HaloTag7(Promega)与基质的结合是共价的,使得这个系统快速而且有很高的专一性。另一种不同的标签是应激标签,在合适的条件刺激下可以可逆地溶出溶液。在重组蛋白加入滚筒标签,在钙离子存在的条件下可以选择性地沉淀。最终的产物具有很高的纯度,整个过程只需要几分钟。另外一个蛋白应激纯化标签是elastin-like多肽(ELPs),它是由VPGXG序列串联组成,其中X代表Val,Ala或者Gly,比例是5:2:3.这些标签在某个转化温度(Tt)下可以发生可逆的相变。当达到Tt时,ELP-融合蛋白选择性地,可逆地沉淀,可以通过离心快速的富集重组蛋白。沉淀也可以通过调整溶液的离子强度来引发。这些技术为亲和层析为基础的纯化方法提供了更多的选择,可以节省成本尤其是对于大规模生产。标签去除如果需要对重组蛋白进行结构或者生化研究,那么融合蛋白必须从重组蛋白上移除。多肽标签也需要去除,因为他们可能会影响蛋白的结果和活性,but they can be left inplace even for crystallographic studies。标签可以用酶法或者化学法去除。在用酶切去除表达标签的情况下,在表达载体目的基因编码序列下游包括蛋白酶酶切位点的编码序列。成功地用于移除多肽标签和融合分子伴侣的酶包括肠激酶,凝血酶,Xa因子和烟草花叶病毒蛋白酶。选择蛋白酶是以专一性,成本,酶切之后残留在目的蛋白的氨基酸数量为标准。肠激酶和凝血酶过去是很受欢迎的蛋白酶但是逐步被his标签的TEV所取代。TEV具有更高的专一性,更容易生产,消化后只留下一个ser或者gly(甚至不会留下多余的氨基酸)。顾名思义,化学法切割标签是用化学试剂去除融合蛋白。化学法的优势是它们可以容易地从反应液中去除而且与蛋白裂解酶相比更廉价。对于大规模生产重组蛋白是一个吸引人的选择。然而,化学法反应条件苛刻,因此他们的使用很大程度上限制在从包涵体中获得的纯化的重组蛋白。它们也会导致不必要的饿蛋白修饰。使用最多的化学切割试剂是CNBr。CNBr切割甲硫氨酸C端的肽键。目的蛋白内部不能含有甲硫氨酸。CNBr切割可以在通常的变性条件(6M盐酸胍)下进行或者70%formic acid 或者trifluoroacetic acid中进行。问题三:选择哪一种宿主菌合适?从文献中快速搜索合适的大肠杆菌菌种作为表达宿主,可以的到几十个可能的结果。各有优缺点。然而,需要注意的是许多都是在特殊情况下才回使用的特殊菌种。在最初的选择中只有几个菌种是必要的:BL21(DE3)和一些K-12直系的几个衍生菌种。经过多次对B line的不同的修饰,BL21菌种由studier在1986年提出。几个遗传特征值得一提。和其他母本B菌种一样,BL21是lon蛋白酶缺陷型的。Lon蛋白酶可以降解许多外源的蛋白。另外一个基因缺失是编码外膜蛋白酶OmpT的基因。ompT可以降解胞外蛋白。降解产生的氨基酸被细胞吸收。如果表达重组蛋白,当细胞裂解后,Ompt可以消化目的蛋白,这很麻烦。另外,对母本菌株B834进行一个hsdSB突变,可以抑制质粒的丢失,由此得到BL21菌株。DNA甲基化和降解被阻断了。当目的基因处于T7启动子下游,就需要T7RNA聚合酶。在守欢迎的Bl21(DE3)菌株中,DE3前噬菌体插入BL21的染色体中,在lacUV5启动子下游包含T7RNA聚合酶基因。BL21(DE3)和他的衍生菌株是迄今为止使用最多的表达菌种。K-12菌系用来表达重组蛋白也仍然有所报道。AD494和OrigamiTM菌株是trxB(thioredoxin reductase)突变型,因此二硫键在胞质中的形成能力增强了。Origami菌株也缺少谷胱甘肽还原酶基因。另一个广泛使用的菌株是来自K-12系列的HMs174,一个recA突变体。这个突变可以促进质粒的稳定。基于大肠杆菌重组系统的质粒多聚体的形成是导致质粒不稳定的主要因素。所有这三个菌株都有包含DE3的衍生物,因此都可以应用T7RNA聚合酶系统。问题4:应该使用哪一个组合才能保证成功?在这一点上,我们应该很清楚,当设计一个表达系统是选择是相当多的。选择完美的组合is not possible a priori,因此为了得到目的蛋白需测试多个条件。如果一个项目需要表达两个蛋白,克隆到六个不同的表达载体中,每个载体转化入三个不同的表达菌种,那么你要做36组试验。如果要考虑其他变量,这个数值会更高。如果在放大之前进行微表达实验,这个试错而且耗时的pilot study 可以变得更快。小量的表达筛选可以在2ml管子或者96孔板中进行。TROUBLESHOOTING RECOMBINANT PROTEIN PRODUCTION这一部分介绍了在大肠杆菌中重组表达优化的不同策略。即使对宿主和质粒的经过了认真的选择,我们仍然无法预料是否可以获得大量的,可溶有活性的蛋白。不幸的是,在实现这些目标所遇到的各种困难经常会发生。表达量很低或者没有表达这可以被认为是最差的情况了。当目的蛋白用很灵敏的技术也不能检测到(比如,western blot)或者可以检测但是量非常低(低于毫克/L)。这常常是因为异源蛋白对细胞有毒害作用。蛋白毒性当重组蛋白在宿主细胞中发挥了不必要和有害的功能时,蛋白毒性的问题出现了。这些功能干扰了微生物体正常的增殖和稳态。表现出来的特征就是生长缓慢,细胞终浓度低和死亡。作为第一次测量,在诱导之前应该监测细胞的生长。如果重组菌生长速率比不携带质粒的细菌生长慢,那么有两点可以解释这个现象:基因毒性和毒性mRNA或者蛋白的本底表达。如前所述,来自与lacI或者lacIQ基因的LacI的表达可以抑制基于lac的启动子。对于高拷贝的质粒(>100个拷贝/细胞),lacIQ应该克隆在表达载体上。pQE载体利用两个lac启动子序列来提高对T5启动子的控制。T5启动子是由大肠杆菌的RNA聚合酶识别。因为在含有tryptone或者peptone的富营养培养基中可能会含有诱导剂乳糖,在培养基中加入0.2-1% W/V的葡萄糖可以实验对表达的严谨型控制。另一个选择是选用以葡萄糖为碳源的defined培养基。在基于T7启动子的启动子中,渗漏表达可以通过与来自pLysS或者pLysE质粒的T7溶菌酶共表达来避免。采用含有严谨控制启动子的低拷贝质粒(例如araPBAD启动子)也是一个选择。拷贝数控制的一个有趣的离子是pETcoco载体(Novagen)。这些质粒具有两个复制起点。oriS起点和它的控制元件,可以将pETcoco控制在每个细胞一个拷贝。然而,TrfA replicator激活中拷贝复制起点(oriV)而实现拷贝数的扩增(达到40拷贝/细胞)。TrfA基因是在同一个载体上,受到araPBAD启动子控制,因此拷贝数可以由阿拉伯糖控制。控制了本底表达之后,培养物应该是生长良好,直至诱导。此时,如果蛋白是有毒性的,细胞生长会停滞。在许多情况下,当达到并超过宿主容忍度,某个一个蛋白的毒性水平变得明显。在这种情况下,表达水平可以随意控制。使用Lemo21(DE3)菌株可以实现Tunable表达。这个菌种与BL21(DE3)pLysS菌种相似,然而,T7溶菌酶是来自受到tunable启动子rhaPBAD控制的lysY基因。在高浓度的L-rhamnose糖存在下,会产生更多的T7溶菌酶,细胞内会有更少的T7RNA聚合酶,会表达更少的重组蛋白。为了确定最佳的表达条件,需要检测0-2000M L-rhamnose糖对表达的影响。相反,当采用IPTG作为诱导剂时,不能实现剂量依赖的表达,因为IPTG可以通过Lac透过酶或者渗透非依赖多肽途径激活转运进入细胞。而Lac透过酶的表达是异源的而且活性透过酶的数量是高度可变的,蛋白表达不会可预测地随着IPTG浓度变化。TunerTM(DE3)菌株(Novagen)是一个BL21的衍生菌株,包含一个lac透过酶的突变(lacY),使IPTG均等地进入LacY细胞,使诱导在一个浓度依赖,均一的水平。同样,通过将lacOc替换野生型的启动子构建了一个大肠杆菌菌株,将lac启动子转换为一个连续的启动子。这个修饰避免了一部分细胞的瞬时的非遗传的LacY的表型,使诱导剂乳糖同步地进入。第二个修饰(gal+)可以使细菌完全利用乳糖作为碳源。有一点需要注意,tunable启动子可以被糖类诱导(乳糖,阿拉伯糖,rhamnose)。对于araPBAD启动子,通过补充不同浓度的阿拉伯糖,目的蛋白的产量可以增加100倍。这使人们错误地认为重组蛋白的合成水平可以随意控制。然而,蛋白表达水平随着活性糖透过酶的多相性而改变,与LacY相似。因此,即使蛋白终产量可以控制,每个细胞的蛋白量是高度可变的,有些可以表达大量蛋白,而有些细胞根本没有蛋白。为了表达一些有毒性的蛋白,需要专门选择一些大肠杆菌的突变体。在一次对提高膜蛋白生产的Bl21(DE3)的衍生菌株的筛选分离中,Miroux 和Walker发现了C41(DE2)和C43(DE3)菌株。最近发现,以前在表达重组蛋白过程中阻止细胞死亡的未明确特征的突变体存在于lacUV5启动子。在BL21(DE3)细胞中,lacUV5启动子趋势T7RNA聚合酶的表达,但是在Walker菌株中在-10区的两个突变使lacUV5启动子回复到更弱的野生型。这导致重组蛋白合成量更少(可能细胞耐受更强)。另一个解决方案是将蛋白从细胞中移除。分泌到周质或者培养基有时是唯一的生产重组蛋白的方法。周质表达的第一个选择是翻译后的Sec-依赖途径。将一个合适的前导肽融合到重组蛋白上,可以使蛋白运输到周质空间。广泛使用的用来分泌的信号肽包括:Lpp, LamB, LTB, MalE, OmpA, OmpC, OmpF, OmpT, PelB, PhoA, PhoE, 或者 SpA。也可以采用基于SRP(信号识别颗粒)路径的共翻译转运机制。SRP识别N端的疏水性信号序列。与膜受体FtsY相互作用之后,新生链和核糖体复合物被转运到SecYFG 转运酶。通过SRP途径,二硫键异构酶I(DsbA)也被用来将重组蛋白转移到周质中。密码子偏好密码子偏好发生在外源编码DNA的同义密码子与宿主密码子有很大不同时。在合成全长重组蛋白时,低丰度的tRNA逐渐消耗净。这种缺失导致氨基酸错误的加入和/或产生不完整多肽,因此影响异源蛋白的表达水平和/或活性。表达重组蛋白要检查是否有密码子偏好问题时,可以使用很多免费在线应用来检测一段基因中的稀有密码子(molbiol.ru/eng/scripts/01_11.html, 解决密码子使用偏好问题有两个策略:外源编码序列优化或者通过修饰宿主提高稀有tRNA的数量。密码子使用优化的原理是依照宿主密码子使用偏好修改目的基因中的稀有密码子。在这个过程中蛋白的氨基酸序列不能改变。这可以通过定点沉默突变或者重新合成整个基因或者一部分。通过沉默突变来优化密码子是一个费力的而且昂贵的过程,因此对于生产许多重组蛋白来说并不实用。另一方面,基因合成简单得多,因为他只需要从海量的组合中选择最合适的序列。改正密码子使用是一个棘手的事情。“一个氨基酸一个密码子”策略没有考虑到除了密码子稀少以外的影响蛋白表达水平的因素。例如,在细菌基因N端富含稀有密码子,蛋白表达实际上是增加的。这个原因并不在于密码子稀少而是RNA二级结构的减少。另外,最近研究表明高水平蛋白表达主要(不仅仅)是由开放阅读框的解码数度决定(比如,核糖体翻译一个mRNA所需要的时间),尤其是当(快的)密码子处于mRNA的5端。这导至起始位点的核糖体快速的消失,因此新的核糖体遇到一个空的其实密码子并快速的参与到翻译当中。最后,一些密码子的组合可以形成类似SD的结构,导至翻译通过mRNA与翻译核糖体的16S rRNA杂交终止。沿着mRNA的翻译终止对蛋白折叠有有利的一面,因为它允许新合成的链形成合适折叠的中间构象。所有这些翻译控制机制对合成基因比例的设计构成了一个挑战。更新的算法应该考虑到5RNA结构,类SD结构的存在,起始位点核糖体的清空率和对共翻译折叠有利的翻译缓慢区域的存在。另一方面,当细胞生产大量的蛋白(异源基因表达的蛋白),编码稀有密码子带电荷的rRNA成为决定蛋白表达的主要因素。低丰度的tRNA消耗导致核糖体停止,然后与RNA链脱离,导致不能产生全长的产物。几种菌株携带包含额外的tRNA基因的质粒可以解决这个问题。BL21(DE3)CodonPlus菌株(Stratagene)包含pRIL质粒(p15A复制子,可以与含有ColE1和类似ColE1复制起点这些最常用的表达载体兼容),可以提供AGG/AGA (Arg), AUA (Ile), and CUA(Leu)的tRNA基因。BL21(DE3)CodonPlus-RP (Stratagene)修改了AGG/AGA (Arg) 和 CCC (Pro)的使用。Rosetta(DE3) 菌株 (Novagen) 和 TunerTMRosetta(DE3) 菌株 (Novagen) 是 TunerTM的衍生菌,含有pRARE质粒(p15A复制子),可以提供所有上面提到的密码子,另外还有GGA(Gly)。应该注意的是这些菌种的使用通常会提高蛋白表达量但是有时候会导致蛋白可溶性的降低。我们已经发现那些RIL(AGG/AGA,AUA, 和CUA)密码子含量超过5%的蛋白在Codon-plus菌种中表达时可溶性较差。在这些宿主中,有RIL密码子导致的翻译终止可能无效,导致翻译速度提高,最终导致蛋白聚集。分批培养的制约因素当重组蛋白的表达量很低,通过不同的机制也无法提高,那么目的蛋白的量可以通过使培养基达到更高的浓度来放大。这可以通过改进几个参数来实现,比如培养基成分和通过剧烈的摇动来提供更好的通气。LB培养基是培养大肠杆菌使用最多的培养基。这种培养基容易配制,富含营养成分,其渗透压对于细菌对数后期的生长是最优的。所有这些特征使LB培养基足够适用于蛋白表达,虽然它并不是获得高浓度培养物的最佳选择。这是因为LB培养基中碳水化合物(和其他可用的碳源)和二价阳离子的含量非常少。理所当然,增加胰蛋白胨或者酵母提取物可以提高细胞的浓度。补充二价阳离子(毫摩尔水平的MgSO4)也会提高细胞浓度。加入葡萄糖却没有太大的作用,因为葡萄糖代谢产生的酸超过了LB的缓冲能力。而在摇瓶中控制pH是非常费事的。如果培养物的酸化构成一个问题,培养基可以用50mM的磷酸钠盐作为缓冲液。2×YT,TB(Terrific Broth)和SB(Super Broth)培养基的成分很容易得到,对于培养高浓度细胞,优于LB培养基。培养基成分的一个主要的突破来自于2005年Studier的进一步的工作,在那篇报道中发展了自动诱导的概念。在自动诱导培养基中,葡萄糖,乳糖和甘油被用作优化的混合物。葡萄糖是优先使用的碳源,在细胞生长中首先被代谢。葡萄糖阻止乳糖的吸收,直至葡萄糖消耗干净,这通常发生在在对数中后期。然后是消耗甘油和乳糖,后者也作为lac控制的蛋白表达的诱导剂。这样,避免了为了及时添加诱导剂而检测生物量以及调节培养基。随着每升培养物中细胞数量的增加,氧气供给对细胞生长产生了巨大的影响。提高溶氧最简单的方式就是提高摇菌的转速。例如,对于一般的三角瓶,最优的转速在400rpm-500rpm。带挡板的三角瓶中的搅动会更剧烈一些,在这些条件下,350rpm-400rpm足以保证很好的通气。然而,剧烈的摇动会形成泡沫,降低氧气的传输。因此,推荐加入消泡剂,尽管消泡剂会影响几种微生物的生长和重组蛋白的产量。合适的通气也取决于培养物所占摇瓶的总体积。一般来说,培养物的体积应该低于摇瓶容积的10%。另一个可以使细胞浓度达到很高的方法是流加式发酵。在重组蛋白生产是极少讨论的两个参数是种子培养基的准备和诱导时间。大多数程序要求稀释过夜培养的饱和培养物(100倍稀释)到更大体积的培养基中。然而,渗漏表达会导致质粒不稳定,最终导致目的蛋白产量低。在终止培养基中,细胞也处于不一致的代谢状态。通过稀释接种到新鲜培养基中,细胞将会以不同的速率生长,导致不可复制的诱导点。一个合适的方案是,种子培养基可以在20-25培养或者使用一个缓慢释放葡萄糖系统。在接种和进一步培养之后,通常是在对数中期加入诱导物,因为在这个时间细胞生长快速,蛋白翻译达到最大。然而,也可以在稳定期早期诱导。实际上,在一些情况下,在这个阶段诱导目的蛋白可溶性更高。很可能是因为蛋白合成的减慢降低了包涵体的聚集。包涵体的形成当一个外源基因转入大肠杆菌,spatio-temporal control of its expression is lost。新合成的重组多肽是在大肠杆菌的微环境中表达,这个微环境与多肽原来的环境可能有所不同,例如pH,渗透压,redox potential, cofactors,和折叠机制。在高水平的表达中,多肽中的疏水张力也会以很高的浓度存在,相似的区域会相互作用。所有这些因素会导致蛋白质不稳定和聚集。这些蛋白质聚集体称为包涵体。包涵体的形成是由于蛋白聚集状态和可溶状态的不平衡导致。因此,通过改善导致包涵体形成的因素来获得可溶的重组蛋白是可能的。一个方法就是将目的蛋白融合到一个助溶标签上。在一些情况下,形成包涵体是有优势的,尤其是当这个蛋白可以容易地在体外重新折叠。如果是这样的话,可以调整条件以利于包涵体的形成,提供了一个重要的一步纯化表达蛋白的简单方法。二硫键的形成对于许多重组蛋白来说,二硫键的正确形成对于获得有生物活性的三维构象是至关重要的。错误的二硫键形成会导致蛋白的错误折叠,聚集为包涵体。在大肠杆菌中,半胱氨酸的氧化发生在周质空间,在这里二硫键是由大量的酶催化形成的。主要的酶是Dsb家族。相反,二硫键在细胞质中很少折叠,可能是因为半胱氨酸残基是在许多酶中是催化位点的一部分。在这些位点的二硫键的形成可能会导致蛋白的失活,错误折叠和聚集。在细胞质中具有更低的氧化还原电势,细胞质是由trxB系统和gor系统保持在一个还原的环境。这中情况对含有二硫键的蛋白质的表达有巨大的影响。一个选择就是使蛋白分泌到周质表达。尽管如此,通过对大肠杆菌进行改造,可以使细胞质变成一个杨欢的环境,更加有利于二硫键的形成。值得一提的两个菌株是Origami (Novagen) 和SHuffle (NEB) strains。OrigamiTM菌株在K-12的基础上有一个双突变,trxB,gor(因为这个双突变的细胞是无法存活的,需要在ahpC基因加入一个抑制突变来保证活力)。OrigamiTM也可以以BL21(DE3) lacY (TunerTM, Novagen)背景获得。Rosetta-gamiTM B strain (Novagen)额外补充了pRARE质粒,修改了菌体的密码子偏好。SHuffle® T7 Express strain BL21(DE3) background, NEB做了进一步的改进。除了trxB,gor突变外,它在染色体中可以组成性地表达二硫键异构酶DsbC。DsbC促进错误折叠的蛋白重新折叠成正确的形式,也可以作为一个伴侣促进那些不需要二硫键的蛋白的折叠。由于DsbC的作用,聚集为包涵体的目的蛋白减少了。分子伴侣的共表达/化学伴侣和cofactor补充分子伴侣处于蛋白质质量控制的中心,帮助新生多肽形成最终的结构。其他一些类型的专门的分子伴侣,比如ClpB,可以分解包涵体中未折叠的多肽。重组蛋白高水平的表达导致cytosol的分子聚集,质量控制机制在这种情况下可能达到饱和。解决这个问题的一个方法是通过去除诱导剂(离心将细胞加入含有可以抑制蛋白合成的chloramphenicol新鲜培养基中)来终止蛋白表达。这使分子伴侣重新促进新合成的重组多肽折叠。因为这些功能,人们自然而然将一个或者几个分子伴侣共表达来抑制包涵体的形成。在商业上使用最多的系统是Takara的分子伴侣质粒组合。这个组合包括了5个质粒(pACYC衍生),使不同的分子伴侣或者他们的组合过量的表达:(i) GroES-GroEL, (ii) DnaK/DnaJ/GrpE, (iii) (i)+(ii), (iv) trigger factor, (v) (i)+(iv).另一方面,如果手边没有这个系统,自然的分子伴侣网络可以通过加入benzyl alcohol或者热激来诱导,尽管不推荐使用后者。当蛋白是以包涵体形式纯化的,尿素变性然后进行体外折叠,加入0.1mM-1M的osmolytes(也成为化学伴侣)提高可溶蛋白的产量。这中情况可以通过在培养基中补充proline, glycine-betaine, and trehalose来mimicked。促进正确折叠蛋白的形成最终正确的构象和稳定的折叠路径也可能需要在培养基中添加特殊的cofactors。比如金属离子(iron-sulfur和magnesium)和多肽cofactors。加入这些化