16srRNA序列同源性分析与细菌系统分类鉴定_焦振泉.pdf
00416s rRNA 序列同源性分析与细菌系统分类鉴定中国预防医学科学院营养与食品卫生研究所(北京100050)焦振泉刘秀梅综述孟昭赫审校摘要本文介绍了 16s rRNA序列测定及同源性分析的方法,并阐述了其在细菌系统分类鉴定中的重要作用。关键词16s rRNA序列同源性分析细菌分类鉴定近 10 多年来,随着分子生物学理论和技术的迅速发展,特别是作为生物技术里程碑的聚合酶链反应(PCR)技术的出现及核酸测序技术的不断完善,产生了许多新的分类方法,如:质粒图谱、限制性片段长度多态性分析、脉冲场凝胶电泳、PCR 指纹图、rDNA 指纹图、16s rRNA 序列分析等。它们主要是对细菌染色体进行直接的 DNA 分析或对染色体外的 DNA 片段进行分析,从遗传进化的角度去认识细菌,从分子水平进行分类与鉴定,使细菌的分类越来越科学和精确,特别是16s rRNA 序列分析方法的出现使细菌进化可以通过试验研究来证实。这是细菌分类史上的一次革命,必将使人们对生物进化及其与其它生物学科关系的认识更加深入。116s rRNA 的结构与性质16s rRNA 为原核生物核糖体中一种核糖体RNA。目前,在细菌的系统分类学研究中最有用的和最常用的分子钟是rRNA,其种类少,含量大(约占细菌RNA 含量的 80%),分子大小适中,存在于所有的生物中,特别是其进化具有良好的时钟性质,在结构与功能上具有高度的保守性,素有“细菌化石”之称。rRNA 在大多数原核生物中都具有多个拷贝 1,5s、16s 和 23s rRNA 的拷贝数相同 2,16s rRNA 由于大小适中,约 1.5kb 左右,既能体现不同菌属之间的差异,又能利用测序技术来较容易地得到其序列,故被细菌学家及分类学家所接受 3。所以,“细菌系统学研究特设委员会”建议依据系统发育关系分类。通过对其序列的分析,可以判定不同菌属、菌种间遗传关系的远近。细菌的 16srRNA 的可变区位点结构如下 4:可变区(variable region,V110)V1:61106bpV2:121240bpV3:436500bpV4:588671bpV5:734754bpV6:829857bpV7:9901045bpV8:11181160bpV9:12401298bp V10:14101492bp恒定区(constant region)可变区序列因不同细菌而异,恒定区序列基本保守,所以,可以利用恒定区序列设计引物将 16s rRNA 片段扩增出来,利用可变区序列的差异来对不同菌属、菌种的细菌进行分12国外医学卫生学分册类鉴定。但较其它方法而言,16s rRNA 序列测定分析更适用于确定属及属以上分类单位的亲缘关系。216s rRNA 序列测定与分析方法对不同细菌的 16s rRNA 序列进行同源性比较分析是推断细菌的系统发育及进化关系的一个重要方法。这些序列主要通过寡核苷酸编目(oligonucleotide cataloging)、克隆序列的测定、反转录直接测序、对 PCR 扩增产物的直接测序等方法获得。2.1寡核苷酸编目采用已知碱基专一性的核酸酶(如 RNaseT 1)彻底消化RNA,消化产物用层析和电泳双向分离,放射自显影记录结果得初级指纹图,再对初级指纹图上的每一个点进行序列分析,最后依字母顺序和链的长短将所试 rRNA 的所有寡核苷酸列出一个目录式清单进行编目,并据此计算不同rRNA 间的相似数(SAB)SAB=2NAB/(NA+NB)NA、NB 分别为两样品中各自具有的长度为 L 个核苷酸以上的寡核苷酸残基数目,NAB 是两样品中共同具有的寡核苷酸残基数最后用 SAB 构建系统发育树 5。Woese 等 6利 用 RNase T 1 对 16srRNA 进行寡核苷酸编目,建立了原核生物系统发育的总体框架。寡核苷酸编目只利用了 rRNA 上 40%的信息,现今,由于核酸快速测定技术的发展,该法已被其它的序列分析法所取代。2.2其它几种方法这些方法主要是利用 16s rRNA 恒定区序列特别保守的特点,在恒定区上设计引物,将细菌 16s rRNA 扩增出来,读取 16s rRNA序列,对不同细菌的 16s rRNA 进行同源性比较及分析。目前比较通用的几种 16s rRNA PCR扩增引物见附表 7。附表目前比较通用的几种 16s rRNA PCR扩增引物引物1序列2(5 3)适用范围fD1ccgaattcgtcg acaacAGAGTT TGAT CCT GGCT CAC大多数真细菌fD2ccg aattcgtcgacaacAGAGT TT GATCATGGCTCAC肠道细菌及其相关细菌fD3ccgaattcgtcgacaacAGAGT TT GATCCTGGCTT AGSp irochetes疏螺旋体fD4ccgaattcgtcgacaacAGAAT TT GATCT T GGT TCAG衣原体属rD1cccgggatccaag cttAAGGAGGT GATCCAGCC许多真细菌rP1cccgggatccaagcttACGGT T ACCT TGT TACGACT T肠道细菌rP2cccgg gatccaagcttACGGCTCCTT GTT ACGCT T大多数真细菌rP3cccgggatccaag cttACGGAT ACCT TGT TACGACT T梭杆菌1引物缩写:f:正向r:反向D:远端P:近端。带f的包含ECoR和Sal的位点;r包含Hind和BamH和Xmal识别序列;反向引物产生rRNA 的互补序列;rP1、rP2、rP3 除从 3 端开始的第 17 个碱基不同外全部相同。2所有引物序列方向都从 5 3,连接序列包含用小写字母写的克隆用酶切位点;由于细菌染色体上的 rRNA 基因以复数存在(约 10 个左右)8,当译读 PCR 产物的直接序列时,复数拷贝如不全是相同序列就译读不出来,即使拷贝间有不同时,也只限于变异较大的区段,稳定区段拷贝间并无不同。rRNA 基因拷贝间有不同时,只能克隆后再测序,而且克隆之后有利于重复测序及以后的工作,所以建议将 PCR 扩增的 16s rD-NA 序列进行克隆。克隆时可根据对大部分细菌 16s rDNA 序列的检索,选择合适的酶切位点,在设计引物时在引物的 5 端修饰进行粘端克隆。常用的克隆载体为 PUC 系列131998年第 25 卷第 1期及 M13 系列。这样有益于产生单链进行测序,但如果所测序列为未知序列,难于找到合适的酶切位点进行粘端克隆时,可利用 PCR扩增产物的 3 端总带有一个 A 的特点,选择一个 5 端带有一个 T 的载体,现在,T-Vec-tor 易于制备且有商品出售,故一般采用PGEM-T-Vector 系统进行克隆。另外还可以通过对 16s rRNA 反转录产物进行直接测序。David 等 9阐述了一种用于细菌系统分离的快速 rRNA 序列测定方法,该法以 rRNA 为模板,以一个或多个寡核苷酸作引物,利用反转录酶合成 cDNA,进行 Sanger 双脱氧链终止法测序。但由于RNA 在 RNase 作用下极易降解,而且很难保证不受 RNase 的污染,所以采用测定 16srDNA 序列。即提取细菌总的染色体 DNA,利用保守的 16s rRNA 引物进行 PCR 扩增,得到细菌的 16s rDNA,这时可利用保守引物 对扩 增产 物直 接 测序,亦 可将 此 16srRNA 克隆后再测序。由于 16s rRNA 约1.5kb,一套反应不能全部读取,所以可利用所取得的核苷酸序列设计新的寡核苷酸,充当后一套反应的引物,从而循序渐进地获得所有 16s rRNA 片段的序列 10。2.3序列分析方法取得 16s rRNA 序列后,从基因数据库中调取所需 16s rRNA 序列,利用一些必要的计算机分析软件对它们进行同源性比较,进而绘制系统进化树。现在比较通用的核酸序列数据库有GenBANK(national institutes of health)、EMBL(European molecular biology labora-tory)、DDBJ(DNA data bank of Japan)11。比 较 通 用 的 序 列分 析 软 件 有 Squence、Philips、T reecon 和 GCG。计算不同菌属、菌种之间的遗传距离的方法主要有 Jukes 和Cantor 方 法 12、Tajima 和 Nei 方 法 13、Kimura 方法 14及Jin 和Nei 方法 15。其中前两种方法为单一参数模式,后两种方法为双参数模式。在取得遗传距离之后构建进化树时有许多种方法,其中有 4 种方法主要是根据聚类分析来进行的 16,它们分别为利用算术平均数的加权配对分组方法(weightedpair group method using arithmatic aver-ages,WPGMA),利用算术平均数的非加权配 对 分 组 方 法(unweighted pair groupmethodusingarithmaticaverages,UPGMA),单个连锁分析(single linkage)及完全连锁分析(completed linkage)。316s rRNA 序列分析在细菌分类鉴定中的作用16s rRNA 的同源性分析最适用于属及属以上的远缘关系。目前,已对 2000 种(约相当于 50%)以上的真细菌的 16s rRNA 进行了测序,不同菌属的 16s rRNA 序列同源性为 70%95%,对分类而言,至少需要测1000 bp 以上。通过同源性比较,可以了解不同菌属、菌种在遗传进化方面的距离。经过 16s rRNA 同源性的比较,结果有时与传统分类结果不符,发现一些新的种属。Funke 等 17测定从人体分离到的棒杆菌依赖补体细胞毒性组及其类似棒杆菌的16s rRNA 序列。通过对这些序列的比较发现这两个棒杆菌组都属于放线菌属,再结合其它的分子实验结果及以前的生化试验结果,提出其为放线菌一个新种,即钮氏放线菌种(Actinomyces neuii.),包含钮氏放线菌钮氏亚种(A ctinomyces neuii subsp.neuii.)(棒杆菌依赖细胞毒性组)和钮氏放线菌无硝亚 种(A ctinomyces neuii subsp.antitratus)(棒杆菌类似依赖细胞毒性组)。Bennasar 等 18测定并比较了 14 株施氏假单胞菌,其中包括模式株 CCUG11256 和Zobell 株(AT CC14405),它们代表了已知的施氏假单胞菌的 7 个不同基因型(DNA-DNA 杂交同源组),结果与 DNA-DNA 杂交所得到的基因型高度相关,并且鉴定了每个基因型的核酸特征位置,结果还发现第 6 基因型 SP1402T(T=模式株)和 SL401 与施氏14国外医学卫生学分册假单胞菌模式株明显不同,从而建议它们应该 属 于 一 个 新 种,命 名 为 Pseudomonasbalearica。有时 16s rRNA 序列同源性比较结果对传统的分类结果给予了证实并提供了更多的分类依据。Gaydos 等 19通 过 对 肺 炎 衣 原 体 的1554bp 16s rRNA 序列与鹦鹉热衣原体及砂眼衣原体的 16s rRNA 序列进行同源性比较并绘制了系统进化树,发现肺炎衣原体与后二者的同源性分别为 96.19%和 94.07%,证实了以前根据其它方法研究所得出的结论,同时说明从遗传进化角度来看,肺炎衣原体与鹦鹉热衣原体的进化关系比与砂眼衣原体的关系更近。蠕虫新立克次氏体是沙门氏菌中毒疾病的致病因子,它是唯一一种已知的通过蠕虫传播的专一性细胞内细菌,通过测定它的1453bp 的 16s rRNA 序列并与 Protecobac-teria 的 A组的细胞内序列进行比较发现,蠕虫新立克次氏体与埃里希氏体属的两个种即里氏埃里希氏体和腺热埃里希氏体特别相似(相似性 95%),而埃里希氏体属的其它种则与之相距较远。这个结果证实了以前通过超微结构和蛋白质印迹(Western blot)所得的结论。埃里希氏体属可被分为 3 个相似的种,每一个种都与其它非埃里希氏体属的一个菌种相近。蠕虫新立克次氏体、里氏埃里希氏体和腺热埃里希氏体之间的相近及与埃里希氏族其它菌属的显著不同,意味着这些菌种将作为从埃里希氏体属中分离出来的一个新的细菌属而存在 20。目前起确定微生物种决定作用的是DNA-DNA 同源性的程度,一般的标准是70%以上同源定为种的范围。16s rRNA 序列和 DNA-DNA 同源性相关关系的研究表明 21:序列的相同性不在 99.8%以上就不能达 到 70%以 上 DNA-DNA 的 同 源 性。16s rRNA总共约有 1500bp,0.2%的不同相当于 3 个碱基。由于数据库中的数据不一定完全而且个人读取数据也可能出现错读,因此由 16s rRNA 序列鉴定种是很难的,必须结合与近缘菌种的DNA-DNA 杂交实验。利用 16s rRNA 测序鉴定病原菌是很有必要的。Relman 等 22利用 16s rRNA 序列中的保守区段设计了寡核苷酸引物,用来扩增杆菌性血管瘤病人的靶 DNA 序列。他们还发现在具有一定病症的病人的组织污染物中已发现有细菌形成,但并没有培养出致病菌,从这些样品的 16s rRNA 扩增产物的序列分析可以看出:致病菌为一种立克次氏体属组织,现在称为汉氏巴尔通氏体 23,24。近几年来,人欧利希氏病 25、肠原性脂肪代谢障碍 26,27和少菌性骨髓炎 28的致病因子也是通过 PCR 扩增 16s rRNA 进行序列分析发现的;同样,疏螺旋体的不同区域分离物根据此法也已被鉴定 29。在北美洲和欧洲的蜱传染性螺旋体病人身上存在的不同疏螺旋体属的 16s rRNA 序列分析解释了为什么这两大洲的蜱传染性螺旋体病的症状不同。随着大部分细菌的 16s rRNA 序列的获得以及核酸扩增 16s rRNA 序列测定自动化分析系统的问世,必将引起细菌分类的一次重大变革,它可以使人们进一步了解细菌的进化关系,从而产生以 16s rRNA 序列分析为主体的所有细菌的系统发育树。参考文献1Kenerly ME et al.J Bacteriol,1997;132:931-9492Ginsberg D and Steitz JA.J Biol Chem,1975;250:5647-56543Sogin and Gunderson.Acad Sci,1987;1503:125-1394现代细菌分类鉴定法.中日细菌分类鉴定和诊断分子生物学新技术研讨班讲义5Staclcebrandt E et al.Methods Microbiol,1985;118:75-1076Fox GE and Woese CR.Science,1980;209:457-4637William G et al.J Bacteriol,1991;173:697-703151998年第 25 卷第 1期8Owen RJ et al.J Med M icrobiol,1989;30:89-999David JL et al.Proc Natl Acad Sci USA,1985;82:6955-695910Sambrook J ed.M olecular Clonning:ColdSpring Harbor.2nd ed,Laboratory Press,1989:610-61511王槐春.蛋白质与核酸序列分析基础.北京:人民军医出版社,1994:2-1012JukesTHetal.Mammalianproteinmetabolism.NewYork:AcademicPress,1969:21-13213Tajima FM et al.Mol Biol Evol,1984;1:269-28514Kimura M et al.J M ol Evol,1980;16:111-12015Jin L et al.Mol Biol Evol,1990;7:82-10216Sneath PHA and Sokal RR.Numerical T axon-omy.San Francisco,1973:251-26517Funke G et al.Int J Sys Bacteriol,1994,44(1):167-17118Bennasar A et al.Int J Sys Bacteriol,1996;46(1):200-20519Gaydos C et al.Int J Sys Bacteriol,1993;43:610-61220Charles P et al.Int J Sys Bacteriol,1995;45:207-21121Stack E et al.Int J Sys Bacteriol,1994;44:846-84922Relman et al.N Eng J Med,1990;323:1573-158023Relman et al.Mol M icrobiol,1992;6:1801-180724Welch DF et al.J Clin M icrobiol,1992;30:275-28025Anderson BE et al.J Clin Microbiol,1992:30:775-78026Wilson KH et al.Lancet,1991;338:474-47527Relman et al.N Eng J Med,1992;327:293-30128Meler A et al.J Clin Microbiol,1993;31:646-65229Marconi RT et al.J Clin Microbiol,1992;30:2830-2834收稿日期:1997-06-19修回日期:1997-10-14(上接第 11 页)10Samarajeewa U et al.Food Chem Toxicol,1991;29(1):41-4711Natarajan KR et al.J Environ Pathol T oxicolOncol,1992;11(4):217-22712Lin KM et al.Cancer,1991;20(4):104-10613Phillips T D et al.Nat T oxins,1995;3/4:204-21314Ciapara IH et al.J Food Sci,1995;60(3):645-64715Judah DJ et al.Biochem J,1993;292:13-1816Hayes JD et al.Cancer Res,1993;53:3887-389417Takahashi N et al.Carcinogenesis,1996;17(1):79-8718Roebuck BD et al.Cancer Res,1991:51(20):5501-550619Bueler T M et al.Cancer Res,1996;56(10):2306-231320Liu DL et al.EUASC2-5(Abstract book ofthe fifth eurasia conference on chemical sci-ences),1996:18021Liu DL et al.Acad J Guangdong Coll Pharm,1996;12(3):166-168收稿日期:1997-04-30修回日期:1997-08-1416国外医学卫生学分册