计算机辅助药物设计中的多维定量构效 关系模型化方法.pdf
《计算机辅助药物设计中的多维定量构效 关系模型化方法.pdf》由会员分享,可在线阅读,更多相关《计算机辅助药物设计中的多维定量构效 关系模型化方法.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 收稿:2004年12月,收修改稿:2005年7月3 通讯联系人 e2mail:zlli2662 计算机辅助药物设计中的多维定量构效关系模型化方法梁桂兆1 梅 虎1 周 原1 李志良1,23(11 生物力学与组织工程教育部重点实验室(重庆大学)重庆400044;21 重庆大学化学化工学院 重庆400044)摘 要 多维定量构效关系(MD QSAR)在计算机辅助药物设计中得到了广泛而成功的应用,结合本研究组的工作,本文系统综述了建立各种MD QSAR模型的方法和策略,对近年来有关的MD QSAR应用研究进展进行了回顾,并对其在新世纪药物设计中应用前景做了展望。关键词 多维定量构效关系 计算机辅助
2、药物设计 模型化中图分类号:R914 文献标识码:A 文章编号:10052281X(2006)0120120208Modeling Techniques of Multidimensional Quantitative Structure2ActivityRelationship in Computer2Aided Drug DesignLiang Guizhao1Mei Hu1Zhou Yuan1Li Zhiliang1,23(11Key Laboratory of Biomechanics and Tissue Engineering,Ministry of Education(Chong
3、qing University,Chongqing400044,China);21College of Chemistry and Chemical Engineering,Chongqing 400044,China)AbstractMultidimensional quantitative structure2activity relationship(MD QSAR)has been successfully appliedas a crucial technique for computer2aided drug design(CADD)in various fields.Based
4、on plentiful literatures,differentstrategies and various methodologies of MD QSAR are systematically summarized by combining with research works inauthorslaboratory.Recent progress of MD QSAR in CADD is reviewed.Key wordsmultidimensional quantitative structure2activity relationship(MD QSAR);computer
5、2aided drugdesign(CADD);molecular modeling and optimization1 引 言Fisher提出“Lock and Key”学说已有110年的历史了,在这一段时间里,此学说曾指引着药物设计工作者进行药物创制研究。与此同时,制药技术也得到了突飞猛进的发展,但直到今天仍然有40%以上的疾病不能治疗1,2。现在制药工业仍然受两个瓶颈的制约:一是相关药靶的寻找;二是高质量(没有严重的副作用、良好的药代动力学性质、易合成、低成本)化合物的合成3。随着生物信息学、化学生物学、分子生物学和计算机技术等学科的迅速发展与惊人成就,计算机辅助药物设计(compute
6、r2aided drugdesign,CADD)在新药开发中起到越来越重要的作用,CADD的理论和方法不断走向成熟47。CADD分为直接药物设计和间接药物设计,作为一种间接方法,多维定量构效关系(multidimensional quantitativestructure2activity relationship,MD QSAR)在CADD中得到了广泛的应用4。MD QSAR技术对于澄清肆虐于人类中的顽疾的机理是很重要的工具8,9。利用MD QSAR模型可预 测 化 合 物 的ADMET(adsorption,distribution,metabolism,elimination,and t
7、oxicity)以及指导新药设第18卷 第1期2006年1月化 学 进 展PROGRESS IN CHEMISTRYVol.18 No.1Jan.,2006计与合成。MD QSAR可以为药物化学理解化合物的结构和功能之间的关系提供有益的帮助,能够克服“黑箱(black2box)效应”式的盲目摸索造成的浪费,以最少的成本直接获得高性能的化学实体研制成新药并推向市场。多年来,MD QSAR技术对药物化学及药物设计的发展起了巨大的推动作用,已经成为研究药物分子的理化性质与生物活性以寻求分子解释的所有学科领域中一个强有力的工具10。结合本课题组的研究工作,本文就各种MD QSAR模型化方法在CADD中
8、的研究及应用作一回顾与展望。2 各种MD QSAR模型化方法通过对一系列结构相似、作用机理相同的化合物的结构特征与其生物活性之间关系的定量研究,利用统计方法在化合物的结构性质与其生物活性之间建立定量的联系,得到MD QSAR模型。应该说,MD QSAR模型的最早雏形可以追溯到19世纪对有机化合物的结构和活性的研究1113。其中最早报道分子结构和生物特性关系的当属来自Strasbourg大学的Cros,1863年发现在哺乳动物体内醇类的毒性与水溶性呈反比关系11。随之在SAR方面研究做出较大贡献的还有Crum2Brown、Fraser、Richardson、Richet、Meyer、Overto
9、n、Hammett和Tafe等。而真正把SAR推向QSAR时代的是60年代初的Hansch和Fujita、Free和Wilson1416。在随后的几十年里,MDQSAR的研究得到了长足的进步和发展,已经产生了大量的MD QSAR模型化方法,这些方法已经较为成功地应用于CADD中,其中主要有以下几种方法。2112D QSAR模型化方法21111Hansch2Fujita与Free2Wilson方法Hansch2Fujita14,15,17模型是基于取代基对分子生物性质的影响是由其电性、立体性和疏水性三者中某些或全部因素变化引起的,并且这三种效应是彼此独立可加的假设提出的:lg1C=algP+bE
10、s+d,其中a、b、d是方程的系数,由多元线性回归确定,其中的变量都有其物理意义,可以用来解释和推测作用机理,进而指导新药设计。Hansch2Fujita方程的核心是化合物的生物活性是电子、大小形状(立体)和疏水三类物理化学参数的函数,因此可以说,如何实现结构信息值化是Hansch2Fujita方法实现的瓶颈问题。Free2Wilson模型15是以母体骨架相同的系列化合物,取代基在不同位置上的影响是相互独立的为假设:lg1C=A0+ijPijAij,式中A0是基准化合物的理论活性负对数值,Pij表示第i个亚结构在第j取代位上有(Pij=1)或无(Pij=0),Aij表示第i取代基在第j位上对活
11、性的贡献。两者的区别是,后者认为生物活性强弱是取代基本身影响,不需要物化参数,虽然不提供有关作用机理的信息,但可以预测化合物的活性,而前者则以物化参数解释这种贡献。Hansch2Fujita与Free2Wilson方法在新药设计方面得到了广泛应用15,16,18,但是并没有考虑药物分子的三维结构特征和分子的各部分结构特点,不能用来设计新的先导化合物,只能用于先导化合物的优化、提高化合物的活性、提高生物利用度等19。21112 分子连接性指数方法分子连接性指数由Randic20提出并由Kier及其合作者21扩展。在拓扑描述子中,各阶分子的零级、一级、二级、三级等分子连接性指数(0,1,2,3,)
12、一起用于表征分子结构时,可认为这个系列构成一个矢量描述子。分子连接性指数系指应用分子骨架中邻接关系定量表达结构,即用计算获得的分子连接性指数X把化合物的结构与生物活性相关:lg1C=b0+i(b2i-1iX+b2iiXV)(i=1,2)。式中iX是指i级连接性指数,iXV表示含有杂原子时各相应的连接性指数,其不是实验值,而是通过代数运算得到的非经验参数。分子连接性指数基于图论和不变量概念编码了某些重要结构信息2224,而这些信息系基于原子之间连接性的二维结构特征编码。该方法适用于含环、多重键和杂原子的分子体系,是2D QSAR研究中应用最普遍的拓扑描述子之一2527,已得到成功应用并仍在改进和
13、发展中1921,2730。21113 电拓扑状态指数方法(electrotopological stateindex,简称E2状态指数)E2状态指数法由Kier与Hall31提出,是以分子图中每个原子的图不变量计算的,其中心思想在于每个原子的内在状态,原子状态的指数值可以作为回归模型的参数。E2状态指数包含了比一个纯粹的数值更多的信息32。其能够表明原子电子特性和分子中的每个骨架原子拓扑环境,同时又可以表示环境对原子的影响效果,可以识别不同原子之间内在的电拓扑状态指数以及它们之间的拓扑距离。每一个原子类型的E2状态指数代表了对特定原子的电子属性,分子中有多少个原子类型就有多少个E2状态指数,这
14、些指数共同描述整个分子,从而构成一121第1期梁桂兆等 计算机辅助药物设计中的多维定量构效关系模型化方法组分子描述子用于编码分子的二维拓扑结构信息32。E2状态指数的应用已经表明23,26,27,其具有强大的能力能够识别一个分子中的原子或者是碎片,而这些分子对于生物活性是很重要的。后来,Kier等33又进一步提出了氢原子水平的E2状态指数。21114 本研究组提出的2D QSAR方法基于距离矩阵和邻接矩阵原理,建立分子距边矢量(VMDE)和原子距边矢量(VADE)描述子,已成功地应用于有机化合物的性质研究和波谱模拟3437。以原子电性和原子间距离描述不同分子环境中各类原子之间的相互作用,并结合
15、原子类型划分方案,建立分子电性距离矢量(MEDV)38及原子电性距离矢量(AEDV)39描述子,已用于烷烃理化性质、药物生物活性、色谱保留指数的QSAR和13C核磁共振化学位移模拟等研究3842。基于20种天然氨基酸的拓扑结构信息以及物化性质,应用主成分分析得到了表征氨基酸的描述子矢量VSTV和VHSE。应用这两类描述子在对多种多肽体系的QSAR的 研 究 中 均 取 得 了 优 于 已 有 文 献 的 结果43,44。2123D QSAR模型化方法2D QSAR方法只能反应原子间连接顺序、方式以及可能的几何异构体,不能区分有关手性对映体和各种构象异构体。而基于3D的QSAR模型在物化意义上更
16、为明确,能直接反映药物分子作用过程中底物和受体之间的非键合相互作用特征:一方面,不同骨架的分子可能有相同的生物活性;另一方面,2D相同但3D不同的化合物可能有不同的生物活性。21211 比较分子场分析方法至今,已经产生了众多的3D QSAR模型化方法,其中最具有代表性的应该归于Cramer等45在1988年提出的比较分子场分析(comparative molecularfield analysis,CoMFA)方法。CoMFA是在分子水平采用分子场研究分子性质,其最初是为小分子集而设计的,在不了解受体三维结构的情况下,研究这些药物分子周围三种作用力场分布,把它们与生物活性定量地联系起来,既可以
17、推测受体的某些性质,又可依此建立一个模型来设计新化合物,并定量地预测其药效强度。CoMFA的基本步骤可概括为:(1)确定各化合物的药效构象,依据合理重叠规则,把它们重叠在一个包容全部化合物分子的空间网格上;(2)使用一个探针比如带一个单位正电荷的甲基计算相互作用能,这一步将产生一个基于Lennard2Jones 6212势 的 立 体 相 互 作 用 能 和 一 个 基 于Coulombic势的静电相互作用能,这些作用能即构成CoMFA描述子矢量;(3)用偏最小二乘法46,47(partialleast square,PLS)确定可区分被研究化合物活性的最少网格点(以立体阻障、静电势、疏水性相
18、互作用表示),进而建立各分子生物活性与相互作用能的3D QSAR模型;(4)作CoMFA系数图,从系数图上可以清楚地看出哪些地方场强对生物活性影响最大,据此可以设计具有更强生物活性的新化合物。这只是一个总体简化的计算过程,大量的研究工作包括在上述各个步骤中,对其展开的激烈争论仍在继续。从CoMFA的计算步骤及其应用情况可以看出:分析过程中要严格选择各种参数,慎重选取电荷以及有关的计算方法;严格定义排列标准和所选择的条件以及场的缩放比例和权重,对每一个分析都应该作交互检验并且应该考虑交互检验中的典型问题如离群项的讨论;最后要提供或至少要讨论最终模型的等高线,给出有关生物数据的出处以及生物数据的标
19、准误差,提供观测值和预测值以及依赖于训练集的生物活性值的预测效果。应该说,CoMFA方法中关键问题是合适的校准策略分子对接问题的选择。相对于2D QSAR,CoMFA具有两大优势即可应用于非同系物体系和可以3D图形显示,因此自其公布以来,正在得到广泛的应用4850。但CoMFA方法受很多因素比如活性构象确定、分子叠合规则、分子场势函数定义以及分子场变量选取等影响,结果不是很稳定;同时还有一定的应用限度51,比如CoMFA中没有真正体现疏水性相互作用,而疏水性相互作用是配体2受体间一种很重要的相互作用力,尽管这种作用力的含义至今尚不完全清楚。其次,CoMFA对于体内生物活性数据的分析经常得不到有
20、意义的结果,并且CoMFA中应用PLS统计技术得出的潜参数(组分)难以用传统的化学思维来解释。另外,由于选取的参数不尽一样,因此结果之间难于比较。正因为如此,其正在不断被完善和发展,如Gaillard等52,53把“疏水场”概念引入到CoMFA计算中;Kellogg等54发展了计算氢键相互作用的HINT(hydropathic interaction)程序并把它成功地引入CoMFA中。起初,CoMFA的方法应用于靶标蛋白结构未知的3D QSAR建模中,最近也被应用于靶标结构已知的研究中5558。Kellogga等59应用Poisson2Boltzmann方程计算出的ZAP静电势能场来代替传统的
21、CoMFA中的Coulombic场,用PLS留一法交互221化 学 进 展第18卷检验,得出的模型可取得较好的预测效果。Schleifer等60采用CoMFA,CoMSIA和GRIDG OLPE方法,通过留一法和留九法交互检验后建立的模型用于抗DHP(blocking 1,42dihydropyridines)的QSAR的研究,并且与经典的QSAR方法对比,效果令人满意。遗传算法和人工神经网络也在CoMFA中得到了应用,Kimura等与Hasegawa等61,62基于遗传算法进行参数选择,得出的CoMFA模型,使变量参数从1 275减少到43,大大减少了工作量并使模型变得易解释。Tetko与其
22、合作者63将人工神经网络应用于CoMFA中进行建模,具有两个优点:减少建模所需要的输入参数的数量;用非线性模型取代PLS法。几十年的验证表明,CoMFA方法在CADD和药物的QSAR研究中得到了成功的应用,但是其不能代替2D QSAR,尤其是不能代替Hansch2Fujita方法。一些研究者将两者结合应用于QSAR6466研究,结果表明,两者可以起到优势互补的作用。21212 比较分子相似性指数分析与假想活性位点阵方法在这里值得一提的是与CoMFA类似的一种3D模型化方法:CoMSIA(comparative molecular similarityindices analysis)。1994
23、年Klebe等67定义了包含配体成键的主要作用场68的5种分子特征:立体场、静电场、疏水场、氢键场(包括氢键受体和氢键给体)。其中,立体场同原子半径的三次方相关,静电场来自于原子净电荷,疏水场来源于Viswanadhan等69的研究工作,氢键场则是通过自经验得到的基本准则来获得的70。CoMSIA中采用与距离相关高斯函数形式代替经典Coulomb和Lennard2Jones 6212势函数形式,致使在分子表面附近格点上的能量自动收敛为确定值,从而不要人为定义cutoff值。CoMSIA方法能有效地避免在CoMFA方法中由静电场和立体场函数形式所引起的缺陷。其计算在不同格点大小以及分子空间取向下
24、得到的结果比CoMFA稳健得多71。在一般情况下,CoMSIA会得到更满意的3D QSAR模型68,72,73。另一个与CoMFA相关的3D QSAR模型化方法 假想活性位点阵7476(hypothetical active sitelattice,HASL)。使用一个描述训练集中各个分子性质的格子,从某种意义上说,这个格子的操作是在与CoMFA相对的方向进行的。在构建CoMFA格子时,产生一个包含所有分子的格子,但那些非常接近或在该分子van der Waals半径的格点将被丢弃。HASL方法中选为网格的是那些处于van der Waals半径以内的那些点。根据最近原子的性质,给这些网格点赋
25、予性质值(HASL型值),然后这些网格对每一个化合物进行操作而形成描述子。该方法已有成功的应用75,76。此外,一组抗疟疾artemisinin模拟物的QSAR研 究 结 果 表 明,HASL方 法 具 有 与CoMFA完全可比的质量77,同时HASL与CoMFA可以取长补短。21213 加权整体不变量分子方法意大利T odeschini研究组78,79提出一种有前途的3D QSAR模型化方法 WHIM(weighted holisticinvariant molecular),其是根据被映射到由原子匹配物的加权协方差矩阵得出的3个主成分的原子统计指数而得到的。其简洁过程如下:首先,一个加权方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机辅助药物设计中的多维定量构效 关系模型化方法 计算机辅助 药物 设计 中的 多维 定量 关系 模型 方法
限制150内