猴痘病毒基因组分析.docx
猴痘病毒基因组分析猴痘病毒(MPV )属于痘病毒科正痘病毒属,在非洲局部地区流行,引起一种 类似于天花的人类疾病。对MPV基因组196858个碱基对进行了结构特征和开 放阅读框分析。与其他正痘病毒相似,基因组的每一端都包含一个完全相同但方 向相反的长为6379个碱基对的末端反向重复序列、一个假定的端粒分辨序列和 短串联重复序列。利用计算机辅助分析鉴定了 190个含60个氨基酸残基的开放 阅读框,其中,四个存在于反向末端重复中。MPV包含正痘病毒的基本基 因,但只包含假定的免疫调节和宿主范围基因的一个子集。序列比拟证实MPV 是一种独特的正痘病毒,它不是天花病原体天花病毒的直系祖先或直系后代。1 .简介痘病毒科由复杂的双链DNA病毒组成,其特点是在脊椎动物或无脊椎动物细胞 的细胞质中复制。痘病毒属于正痘病毒属,包括天花病毒(VAR )、猴痘病毒(MPV )、 牛痘病毒(CPV )和痘苗病毒(VAC )o VAR是人类天花的病原体,天花是一种 死亡率为10%-40%的传染病在世界卫生组织、国际社会的支持和协调努力下, 通过病例识别和活体VAC预防性接种的战略消除天花。1977年根除天花后,停 止接种疫苗,导致对其他正痘病毒和VAR的免疫力下降。因此,现在人们对人 畜共患正痘病毒,包括MPV、CPV和VAC菌株的易感性增加。这些病毒在人群 中潜在传播的增加可能导致其致病性或传染性的适应性增加。人类猴痘是中非和 西非热带雨林地区的一种散发性疾病,其临床表现与天花相似,而且发病频率似 乎正在增加。猴痘和天花的相似临床表现导致了 MPV是VAR进化祖先的假说。根据基因组限 综上所述,MPV的基因组似乎是典型的正痘病毒,它包括一个中央保守区,更 多可变的左端和右端区域,以及一个具有串联重复的ITR。对MPV、VAR、CPV 和VAC基因组的比拟分析证实,MPV是一个离散的物种,表现出与其他对人类 致病的正痘病毒的多种不同。在VAC的情况下,物种之间的重组是可能的,正 痘病毒很可能是从类似牛痘的祖先病毒独立进化而来。参考文献相关阅读相关产品制性内切酶图谱或单个病毒基因的核甘酸序列比拟VAR和MPV有人认为MPV 和VAR是独立进化的,也有人认为VAR是MPV的祖先。由于这个问题的可靠 答案只能通过比拟全基因组才能得到,我们对人类MPV别离株ZAI-96-I-16 (MPV- ZAI )进行了 DNA测序,得出结论:MPV不是VAR的直系祖先或后代。我们对MPV-ZAI 196858碱基对的DNA序列进行了详细分析,该序列包括除 局部共价末端发夹环外的整个基因组,并与VAC、VAR相应的全基因组序列和 CPV的局部序列进行了比拟。2 .基因组图谱正痘病毒基因组的末端包含一个完全相同但方向相反的序列,称为末端反向重复序列(ITR),其中包括一组短串联重复序列和末端发夹。MPV-ZAI基因组包含一个6379碱基对的ITR0通过S1核酸酶水解和DNA聚合酶I修复,我们成功克隆了 MPV-ZAI DNA中两条互补的、不完全碱基配对的发夹环链之一。该序列与其他正痘病毒的序列比对说明,该序列具有相当大的保守性,并说明只有组成环的四个核甘酸缺失(Fig.l )oTelomere Resolution Target一1pCT-GTTAG-TAAATT-AT - ATACATATAA-TT7TA-TA-ATTAAT-TTA-ATTT7A-AAijC-G7CAG-TAAATT-AT-ATATATATAA-TTTTA-TA-ATTAAT-TTA-ATTTTAAA-|pCTAGTTAG-TAAATC-AT-ATACATATAA-TTTTA-TA-ATTAAT-TTA-ATTT7A-AA-|CTAGTTAG-TAAATT-AT-ATATATATAA TTTTA-TA-ATTAAT-TTA-ATTTTACAATC ATTTAA TA TATATATATT AAAAT AT TAATTA AAT TAAAAT_TL、LjJ L«pJLJLqJ LqJL<pJ LaCAATC ATTCAA CA TAGATATATT AAAAT AT TAATTA AAT TAAAATbpL»pJ L«pJLJ9LaL*i'JLaLttACAATC ATTTAA TA TAGATATATT AAAAT AT TAATTA AAT TAATAT-atLt JL'pJ LqJL<、Lt-J LnJLmJLaJSa1AT21ATT1A-l1TTATTTAGTGTC7AGAAAAAAATTATTTAGTGTCTAGAAAAAAATTATTTAGTGTCTAGAAAAAAATTATTTAGTGTCTAGAAAAA7S82PGTGTGACC- 3'TGTGTGACC-3,1GTGTGACC-3'rGTGTGACC-3,TAA JT-Z JTM JAATAAATCACAGATCTTTTTT7AATAAATCACAGATCTTTTTTTAATAAATCACAGATCTTTTTTlACACACAGG-5/ACACACAGG-5'ACACACAGG-5rMPV-ZAIVAR-BSHVAC-COPVAC-WRVAC-WRVAC-COPVAR-BSHFig.l MPV与其他正痘病毒末端区域的比拟注释:上行显示了 MPV-ZAI终端循环的排序局部。核苗酸与VAC-WR序歹U不同。ZAI、BSH 和WR分别代表Zaire-96-1-16.孟加拉国和西部保护区的病毒株。MPV的端粒解析序列与VAC、VAR相同。MPV-ZAI基因组末端发夹附近的串联重复序列区域较短,由NR工(85碱基对)和NR 口 ( 322碱基对)组 成,由两个70碱基对的重复序列分隔,其中一个70碱基对的元件和两个54碱 基对的元件位于ITR和NR II编码序列之间。MPV-ZAI DNA这一区域的组织结构与VAR-GAR最相似(Fig 2. )o然而所有VAR毒株的末端区域都有非常短的ITR ,缺少ORF ,并且左右末端的重复序列集不同。,/ C23LVAC-COPVAC-COPOOOAAAMAAAAOZVAC-WRVAC-WRNR1 |,1220C1L21VCPV-BRINR I III妫凶拗拗蝴拗拗四aI t .1312 NROEZCPV-GRINR I 163H0H7 NR II-OLZVAR-BSIINR I 14JHH-s NR II VAR-BSH(nght compl)NR I |4CW5 NR II I - .8G3RVAR-GARNR I I2 NR 11)NR I II NR II I67漂:鬻舞NRI > NRHMPV.ZAI 比.匚Fig 2. MPV和其他正痘病毒ITR区域内的串联重复模式注释:色矩形表示独特的ITR序列:NR I和NR II以及编码区。黑色钻石对应于70个碱基的串联重复序 列,其数量如上所示。灰色三角形对应于54个碱基的重复序列,其数量如下所示。VAc-COP和VAc-WR ITR序列中的五边形表示125个碱基的重复。开放的方块和三角形说明,这些重复序列通过删除、替换或 插入而不同于共识序列。黑色的圆圈表示末端的发夹。虚线表示缺少相应的DNAO.编码区计算机辅助分析确定了 190个包含60个氨基酸残基的开放阅读框(ORFs ),给出了 VARIND、VAC-COP和CPV-GRI对应的OFR及其预测的氨基酸长度。MPV-ZAI基因组左侧的四个ORF( Fig 3A.)位于ITR内,因此在基因组右侧也 有对应的ORF ( Fig 3B.)。正如预测的那样,所有在其他正痘病毒中至关重 要的基因都存在于MPV中,并占据基因组的中心区域(ORFsClOL到A25R)。 这些ORF与其他正痘病毒的序列同源性大于90%o正痘病毒之间的大多数物种 特异性和毒株特异性差异存在于左末端和右末端区域,MPV-ZAI也是这样(Fig 3A,和Fig 3B.)。MPV-ZAI没有独特的基因。相反,MPV-ZAI缺少CPV-GRI 中发现的25个ORF和VAR-IND计算的19个潜在ORF。虽然其中一些基因 的作用仍然完全未知,它们可能包括许多可能涉及免疫逃避、宿主范围和细胞增殖的基因。D1LZAX6378IND1029GAR10S8COP14015auxDCLRLD4LD9LDHLD12LDX3LD14LC1LC2LC3L< << <D2LD»i1 T1D4LD5RML > <D7LMLD9LDIOL DHLD12L""DDLD14L<一 <«一iI 一Dl.SLD2RD3LIMRDSL»MLDC.5LD7LMLMLDIOLDHLD12L< <» .<i, r 1B2LB3R<LBSRB6L7LBSLB9L 110L BURB12L B13B B14L B15LB1CLB17L B18L<<-C11R C10L>i JCLi CtL C7LC«LCSLC4LC3L< <->> "m"11C4LCSBCSLC7BC8LC»LC10LClILClll. C13L C14LC1SLC1CL C17L<<< ( -11LDIOLOXI21410ZAX1933ITO12038GAR128,0COF22190)5226ORIDI"O1S&O1BL D1»L FIX. F2LO1X.OILC1LCSC.Cll C4LCSX.C<* C?LCtLC9LDDL Dll.SL M41. ML F3LOIL031.OIL Cll.C2LC1LC4* C5LCCL C?L 0 .0,,i一、 'a.,d< < < < . <JR4»xx19L agB>1X. RIX. BSLQ1LQMQ3L »1L»2L»SLMX BIX,UL 111.<<«.<-«1<av»C2bCll 01L KLH1LRLK1LK2&K1LX«LXSL R«L K7K FILFSL F)L.,. .,. ,.dhmM .一.1 .,.“ 口C1ILC19L FIL F3LOIL03LMil.M2LNil.M4LN5L 6H Oil.G2L G3L-*A “/4 .,“0,>!_B.T-|r111( 1 |.B>.Ctu. C1S&Cl»X.C11&C1U.Ct«LC1«X.CITI,Cltx.C19lr CSOX. C”& C23L C2"PitF2L,0d,.,4C11L C13LCtLCtl.C1*LC12LCl"Cl it,CKLC17L CltL C1»L C20X. C21*KlbULBB,I lllllllllll/“B7L *9LB4LSSLMLBtLB1»LB11LS12LB11L B14L B1SL BKL B17*C1LC2L111VVV11F7LF9Lr«Lpslp«l r»t.n«Lfiilfisln)L pkl pi>l fkl rim six.ula?LQ9LG4L3LML94LO1«L01 ILGtUODL Q14L O1SL OltL O17KFILF3X.11 *1.vwi1W-9 P)LF4C.F5»E»“JL)LMLEM«B?B< “I1I1VC1L C«LOBCOm<" "*-vvv>-rVI3L B4LKSKMilE< > CO» -111 111P)L P4LFf*F<MF7«< ,"> >A27L221A42RJL26LA28LA29L,AMLX)1L”!A34L A3S* A3CL2” AIIB 2”MOB MIL A43R A44L A4S*wA2SL2" A2?L A2«L A2»L A3” A31* A32LK33K A3" JU5B A”07*JULASMW"cnp,V1VVJU9Lr1IA.X73LA27LA2ILJLJOL JU IL A314 A31LA34JI A)5M A3cliA37*A3tM A4«LAil*GUI1CX51«Id171)20<miBUMBint 1)B B14B Bits.Bl««B17«»ltMB1>B> »3 一 iy -, .j teoiTtB1CLB2ia112M atm bi«b ais* a* aitt.1«uoanib?” »24*a”,<U M U >>-t»im IIIII, YYI .173S09MLD12MDia D2M O3K D4B Ma D7LMB6DioaDim Dl»D14B>» f>. >» <- » »3 |" rr 尸I,一 一 |j rv“BUS B12M BDB B14B BIS* BIO B17LB1MBltH KOR> > > >, 一 一 » co,1Ir I I Ii Fig 3. MPV左侧(A)和右侧(B)末端可变区内的ORF与其他正痘病毒相应基因组片段的图形比对。注释:ORF的大小和方向用箭头标出。一种病毒的DNA和蛋白质相对于另一种病毒的缺失,分别超过150个碱基对和50个氨基酸,用圆点标记。黑色方块标记ITR区域内的序列。核甘酸编号显示在右边。我们之前比拟了 MPV和VAR这两类基因,Table 1.中添加了 VAC和CPV的生 长因子和免疫逃避基因,因为后者包含了正痘病毒中存在的所有此类基因。 根据完整且未被广泛截断的毒力基因的数量(括号中所示),我们得到:CPV-GRI(17 ) > VAR-IND ( 11 ) =VAR-GAR ( 11 ) > MPV-ZAI ( 10 ) > VAC-COP(9 ) > VAC-MVA( 6)o如之前所述,MPV-ZAI也比CPV含有更少的锚蛋白重复基因OOrthopoxviral Growth Factor and Immune Evasion GenesVAR-INDVAR-GARMPV-ZAICPV-GRIVAC-COPVAC-MVAORFSize (aa)ORFSize (aa)ORFSize (aa)ORFSize (aa)ORFSize (aa)ORFSize (aa)Viral growth factorD2R140B3R140D3R142C5R138C11R142005R140IL-18 binding proteinD5L126B6L126D6L126C8L124t008L120Complement binding proteinD12L263B18L263D14LT216C17L259C3L263tInterferon resistance factor, homolog ofC3L88P3L88tM3L88K3L88024L88elF-2aInterferon resistance factor, dsRNA-bindingE3L190C3L192F3Lt153F3L190E3L190050L190protein3-Hydroxy-delta5-steroid dehydrogenaseA50Lt61A54Lt61A45L346A47L346A44L346157L346Interferon-y binding proteinB9R266H9R266B9R267B7R271B8R272176Rt226Serine protease inhibitor homolog, SPI-2,B13R344D2R344B12R344B12R345B13RT11618!Rt116inhibition of IL-1。converting enzyme, apoptosis inhibitionlnterleukin-1 -binding proteinB15RI63D4Rt63B14R326B14R326B16RT290184R326Interferon-a/13-binding proteinB20R354D9R355B16R352B17R351B19R353187Rt234Serine protease inhibitor homolog, SPI-1,B25R357D14R357B19R357B20R375C12L353tapoptosis inhibitionTumor necrosis factor binding protein, CrmBJ2L*348D2L*351C22L*t122002L*t176G2R349G2R349J2R*348H4R*351B28R*t122192R*t176Tumor necrosis factor binding protein, CrmCtttA56R186A53Rt103tTumor necrosis factor binding protein, CrmDtttK2R322ttTumor necrosis factor binding protein, CrmEttKlRt70K3R167ttChemokine binding proteinJ1L*246D1L*255C23L*t244001 L*t136G3R253G3R253J3R*246H5R*255B29R*t244193R*t136Semaphorin-likeA42Rt74A45Rt74tA41R402A39R403150Rt83Table 1.正痘病毒生长因子与免疫逃避基因注释:注意。星号表示在左侧和右侧反向末端重复区域(ITR )中复制的ORF。与CPV-GRI的相应ORF 在功能上有重要差异的ORF用匕首表示。CPV-GRI编码kelch超家族的6 -500个功能未知的氨基酸,彼此之间的相似性 为22-26%。虽然VAC-COP编码3个全长的kelch样蛋白,与CPV-GRI蛋白 同源性分别为99.4、97.9和98.6%,但MPV-ZAI基因组只编码1个C9L ,与 CPV-GRI蛋白G3L同源性为97.3%。在VAR的基因组中,这些ORF似乎都被 破坏了,这说明它们在复制中不是必需的。VAC含有两个带有磷脂酶D基序的ORF :F13L是形成细胞外病毒和有效的细胞 间感染传播所必需的,而K4L对于组织培养中的复制是必不可少的。CPV包含 这两个ORF以及一个溶血磷脂酶同源的假定的脂质代谢酶,该酶在VAC菌株中发生了突变。MPV-ZAI包含这三个ORF的完整版本(C4L、C5L和C19L),而VAR株由于DNA片段的缺失而缺乏C4L和C5L同源物(Fig 3A. )。C4L和C5L 蛋白的功能尚不清楚,但它们都是由MPV和CPV这两种正痘病毒编码的,它们 的宿主范围相对较广。4 .系统发育分析根据末端可变区DNA序列,我们认为CPV的组织结构与祖先的正痘病毒种类最 为相似,VAR与MPV的距离比VAC的略远。然而,通过分别分析左侧和右侧 的可变区,情况似乎更加复杂。VAC毒株似乎比他们的左侧更接近MPV-ZAI末 端可变区和VAR菌株相对于右侧末端可变区(Fig 4.),这种差异可能是由于VAC 的复杂重组起源。Fig 4.系统发育分析.总结