2022年基于全基因组序列的黄单胞菌分泌蛋白质预测及其特征分析.docx
《2022年基于全基因组序列的黄单胞菌分泌蛋白质预测及其特征分析.docx》由会员分享,可在线阅读,更多相关《2022年基于全基因组序列的黄单胞菌分泌蛋白质预测及其特征分析.docx(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022年基于全基因组序列的黄单胞菌分泌蛋白质预测及其特征分析 覃悦祝友朋韩长志 摘要: 黄单胞菌(Xanthomonas campestris)作为诸多革兰氏阴性细菌之一,主要危害十字花科农作物和核桃、杧果等经济林植物。前人对植物病原细菌、真菌等的分泌蛋白和相关蛋白质开展了预料及分析探讨,明确其分泌蛋白在致病过程中具有特别重要的作用。本探讨以已经公布全基因组序列的黄单胞菌X.campestris B100、X. campestris pv.campestris str.8004、X. campestris CN14中的蛋白质序列为基础,结合细菌中分泌蛋白的基本特征,采纳在线分析程序(包括Si
2、gnalP v5.0、ProtComp v9.0等)对上述3个黄单胞菌的分泌蛋白序列进行预料和分析,明确上述细菌中分别含有135个、128个、135个分泌蛋白,并对分泌蛋白所具有的基本特征开展分析,为深化探讨黄单胞菌分泌蛋白的功能打下理论基础。 关键词: 黄单胞菌;全基因组;信号肽;生物信息学 中图分类号: S435.1 文献标识码: A 文章编号: 1000-4440(2022)01-0053-07 Prediction and characteristic analysis of Xanthomonas campestris secretory protein based on whole
3、 genome sequence QIN Yue1, ZHU You-peng1, HAN Chang-zhi1,2 (1.College of Biodiversity Conservation and Utilization, Southwest Forestry University, Kunming 650224,China;2.Key Laboratory of Forest Disaster Warning and Control of Yunnan Province, Kunming 650224, China) Abstract: As a kind of many Gram-
4、negative bacteria, Xanthomonas campestris mainly harms cruciferous crops and economic forest plants such as walnut and mango. Some academic predecessors discovered that secretory proteins played an important role in the pathogenic process by predicting and analyzing the secreted proteins and related
5、 proteins of plant pathogenic bacteria and fungi. This study was based on the protein sequences of X. campestris B100, X. campestris pv. campestris str.8004 and X. campestris CN14 whose whole genome sequences had been published, combined with the basic characteristics of secretory proteins, using on
6、line analysis programs (such as SignalP v5.0, ProtComp v9.0, etc.) to predict and analyze the above three protein sequences, it was found that the bacteria contained 135, 128 and 135 secretory proteins, respectively, and analysis on the basic characteristics of secretory proteins was carried out, th
7、us made theoretical foundation for the in-depth study of the function of X. campestris secretory proteins. Key words: Xanthomonas campestris;genome;signal peptide;bioinformatics 植物作為生物界的重要生产者,其在生长过程中始终面临着诸如真菌、细菌等微生物的侵害1。在危害茄科、十字花科以及胡桃科等多种重要经济作物的诸多病原细菌中,尤以黄单胞菌(Xanthomonas campestris)造成的危害较重,该病菌在分类上属于
8、假单胞菌科(Pseudomonadaceae)黄单胞菌属(Xanthomonas)2。国内外学者对于该菌的探讨主要集中于基因功能3、效应蛋白4、该菌与黄原胶的作用关系5以及分类6等方面。前人探讨发觉,细菌的致病机制主要是通过分泌系统将其分泌蛋白输入植物组织中,其效应分子蛋白质往往通过与植物防卫反应的相关分子发生作用,进一步促进其在植物中的定殖、扩展以及对植物产生危害。 近些年,学术界对植物病原菌(真菌、细菌以及卵菌等)分泌蛋白开展了诸多探讨工作7,例如,稻瘟病菌8、致病疫霉9、大丽轮枝菌10、黄单胞菌VI型分泌蛋白11以及细菌性黑斑病菌12的分泌蛋白等。作为危害农林生产的特别重要的黄单胞菌属细
9、菌,其全基因组序列已经被测序,然而,尚未见关于黄单胞菌分泌蛋白的预料及特性的探讨报道,严峻影响着学术界对于该病菌致病机制的解析。 为了更好地明确黄单胞菌中分泌蛋白的数量及特征状况,本探讨选择全基因组序列已经公布的3种黄单胞菌X. campestris B100、X. campestris CN14、X. campestris pv.campestris str.8004(分别简称为XCB100、XCCN14、XC8004),依据分泌蛋白具有的典型特征,从信号肽、亚细胞定位以及跨膜结构等方面入手,利用生物信息学分析软件,对上述黄单胞菌中的分泌蛋白进行预料并对其信号肽、氨基酸残基等性质进行特征分析
10、,同时与同属不同种的细菌性黑斑病菌分泌蛋白12进行对比和分析,以期为深化开展黄单胞菌侵入寄主植物过程中分泌蛋白的作用解析奠定坚实的理论基础,并为后续开展生物学试验验证打下基础。 1 材料与方法 1.1 分泌蛋白序列来源 黄单胞菌X. campestris B100(XCB100)、X. campestris CN14(XCCN14)、X. campestris pv.campestris str.8004(XC8004)的全蛋白质组序列来源于美国国家生物技术信息中心(NCBI),上述菌株登录号分别为GCA_000070605.1、GCA_000401735.2、GCA_000012105.1。
11、 1.2 分泌蛋白的预料 依据分泌蛋白的基本特征,利用SignalP v5.013、ProtComp v9.014、TMHMM v2.015、Phobius16分别预料分析蛋白质信号肽并预料其亚细胞定位,同时解除具有跨膜结构的蛋白质。再利用TargetP v2.017、TatP v1.018和LipoP v1.019預测分析转运肽、信号肽酶识别位点和脂蛋白等,解除定位在胞内细胞器的蛋白质。关于黄单胞菌中分泌蛋白的获得方法,详细规则及步骤参考文献20。 1.3 分泌蛋白基本特征分析 利用Microsoft Excel 2022统计和分析分泌蛋白中的氨基酸残基和信号肽特征,并用Origin 202
12、2作图软件作图。 2 结果与分析 2.1 分泌蛋白的数量预料及所占比例 基于细菌中分泌蛋白所具有的典型特征(在N端含有信号肽、无跨膜结构域、无糖基磷脂酰肌醇(GPI)锚定位点,且不定位于胞内细胞器等),采纳多种生物信息学分析软件对3个黄单胞菌(XCB100、XCCN14、XC8004)中的蛋白质序列进行筛选。结果表明,通过SignalP v5.0预料,黄单胞菌XCB100、XCCN14和XC8004中具有典型信号肽序列的蛋白质数量分别为714个、712个和646个,占总蛋白质数量的比例分别为17.10%、17.26%和15.02%(图1)。进一步通过ProtComp v9.0预料软件对上述蛋白
13、质进行亚细胞定位分析,结果显示,XCB100中136个蛋白质定位在细胞外,其余578个蛋白质分别定位在细胞质膜、胞内细胞器和细胞质;XCCN14中135个蛋白质定位在细胞外,其余577个蛋白质则分布在细胞质膜、胞内细胞器和细胞质中;XC8004中128个蛋白质定位在细胞外,其余518个蛋白质分布在细胞质膜、胞内细胞器和细胞质(图1)。 由于上述分析结果尚不能完全确定细菌中的分泌蛋白,进一步利用TMHMM v2.0、Phobius以及TatP、LipoP等生物信息学分析软件对上述获得的蛋白质进行分析筛选。结果表明,黄单胞菌XCB100、XCCN14和XC8004中不具有跨膜结构域的蛋白质数量分别
14、为135个、135个和128个,含有脂蛋白信号肽的蛋白质数量则分别有59个、58个和52个,含有信号肽酶的蛋白质数量分别为10个、13个和14个。经过上述分析,最终明确黄单胞菌XCB100、XCCN14和XC8004中具有典型特征的分泌蛋白数量分别为135个、135个、128个(表1)。 2.2 分泌蛋白的氨基酸序列长度及组成分析 为了更加清楚地明确分泌蛋白的氨基酸序列长度及组成,本探讨对黄单胞菌XCB100、XCCN14和XC8004中分泌蛋白的氨基酸长度进行进一步统计分析,结果显示,XCB100中的分泌蛋白大小多集中于100300 aa,所占比例为76.3%;XC8004中的分泌蛋白大小多
15、集中于100300 aa,所占比例为78.52%;而XCCN14中的分泌蛋白大小多集中于100250 aa,所占比例为69.53%(图2)。上述分析结果表明,黄单胞菌中的分泌蛋白的氨基酸长度主要集中在100250 aa,属于小分子蛋白质。 同时,对上述3种黄单胞菌中分泌蛋白的氨基酸组成状况进行分析,结果表明,3种黄单胞菌中分泌蛋白的氨基酸组成状况较为相像,其中尤以A(丙氨酸)在分泌蛋白中的含量最高,所占比例为12.5%,而以C(半胱氨酸)在分泌蛋白中的含量最低,所占比例为1.5%,另外,诸如G(甘氨酸)、L(亮氨酸)、R(精氨酸)、V(缬氨酸)等含量也具有较高的比例,分别为8.7%、8.8%、
16、7.0%、6.9%(图3)。 2.3 分泌蛋白的信号肽特征分析 对上述分泌蛋白信号肽开展进一步分析,结果表明,黄单胞菌XCB100、XCCN14和XC8004中的分泌蛋白信号肽长度多集中于1926 aa,所占比例分别为77.94%、76.47%和74.42%,尤以长度为21 aa和22 aa的蛋白质数量居多(图4)。 2.4 信号肽切割位点特征分析 进一步对3种黄单胞菌分泌蛋白中所具有的信号肽切割位点进行特征分析,结果表明,黄单胞菌XCB100中分泌蛋白的氨基酸残基数量占比以丙氨酸最高,为21.75%,谷氨酸的数量占比最低,仅为0.13%,其他氨基酸残基数量占比由高到低依次为亮氨酸、丝氨酸、缬
17、氨酸、甲硫氨酸、苏氨酸、甘氨酸、精氨酸、脯氨酸、半胱氨酸、异亮氨酸、苯丙氨酸、赖氨酸、色氨酸、组氨酸、天冬酰胺、谷氨酰胺、酪氨酸、天冬氨酸(图5)。此外,在信号肽切割位点-3、-2、-1、1、2处,丙氨酸、亮氨酸、丙氨酸、丙氨酸、脯氨酸的数量占比最高,分别为69.63%、14.81%、72.59%、32.59%、17.78%(图5)。氨基酸的组成在-3和-1位点上相对比较保守,属于丙氨酸-随意氨基酸-丙氨酸(A-X-A)类型,在-3位点上,除丙氨酸之外,半胱氨酸、甘氨酸、亮氨酸、丝氨酸、苏氨酸、缬氨酸的数量占比分别为7.41%、3.70%、2.96%、2.96%、4.44%、8.89%,而天冬
18、氨酸、谷氨酸、苯丙氨酸、组氨酸、异亮氨酸、赖氨酸、甲硫氨酸、天冬酰胺、脯氨酸、谷氨酰胺、精氨酸、色氨酸、酪氨酸数量所占比例均为0;在-1位点,除了丙氨酸外,半胱氨酸、甘氨酸、脯氨酸、丝氨酸、苏氨酸数量所占比例分别为11.11%、10.37%、0.74%、2.06%、2.22%(图5)。 黄单胞菌XCCN14分泌蛋白氨基酸组成成分中,尤以丙氨酸数量所占比例最高,为21.44%;谷氨酸的数量占比最低,仅为0.07%,其他氨基酸残基的数量占比由高到低依次为亮氨酸、丝氨酸、缬氨酸、甲硫氨酸、苏氨酸、甘氨酸、精氨酸、脯氨酸、半胱氨酸、苯丙氨酸、异亮氨酸、赖氨酸、色氨酸、谷氨酰胺、天冬酰胺、组氨酸、酪氨酸
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 基于 基因组 序列 黄单胞菌 分泌 蛋白质 预测 及其 特征 分析
限制150内