《第十章药物生物信息学ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十章药物生物信息学ppt课件.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十章第十章 药物生物信息学药物生物信息学 第一节 药物生物信息学概论 一、概念 生物信息学随着人类基因组计划的全面开展和深入而出现的一门新兴的学科2004年2月已经有170多个生物的基因组被测定,核苷酸数目达到200亿对这些数据进行处理分析就必须发展新的分析理论、方法、技术和工具,所以必须依赖计算机的信息处理 生物信息学就是在上述背景下发展起来的综合应用生物学、数学、物理学、信息学、计算机科学等诸多学科的理论方法的崭新交叉学科,它研究的材料是生物学数据库,而采用的方法则是从计算机技术衍生而来的 基因组学和生物信息学的研究也改变了新药开发的思路和模式l 对基因组计划产生的核酸序列分析一方面可以
2、从本质上认识疾病尤其是遗传疾病的发生原因,为这些疾病的诊断、预防和治疗奠定基础l这些核酸序列本身就是丰富的药物资源,其中蕴藏着大量目前尚不明了的基因,这些基因及其产物可以作为潜在的药物或者药物靶点而开发 l药物生物信息学正是在在这种背景和思路下应运而生的 药物生物信息学就是综合应用药学、生命科学、数学、计算机等等学科的理论和方法,对伴随基因组计划产生的生物信息进行整理和分析,并应用于药物的设计和开发,以达到合理药物设计目的的一门交叉学科 二、药物生物信息学研究和应用的范围 1. 核酸序列分析 1)基因结构分析对原核生物的操纵子,包括启动子和及其上游序列,终止字和衰减子等;对真核生物的分析,有内
3、含子、重复序列、启动子和增强子等分析等2)核酸序列组装用鸟枪法测序cDNA获得了大量的短的片段,一般不超过400bp,称为序列表达标签(EST),它们都是mRNA的一部分,所以可以通过数据库中的EST的分类和整合,获得潜在的全长的cDNA3)基因定位分析已知序列和基因组的数据比对,可以将基因定位 4)新基因的发现和功能预测 用已知基因的编码区与EST数据库比较,找到感兴趣的EST,再与其它数据库比对,如果是没有克隆的EST,通过引物设计钓出基因,再定位到染色体上。也可以将新基因共过基因序列比较,找到在进化上是同源的基因,从而预测新基因的功能2. 蛋白质序列分析蛋白质序列分析包括蛋白质的组成和性
4、质分析如分子量、等电点、亲水性和疏水性分析)蛋白质二级结构和三级结构的预测 3. 生物信息学软件 现代药物开发特别是生物技术药物的开发,少不了用分子生物学的手段研究问题、解决问题涉及到分子生物学实验,常常需要生物信息软件的帮助对核酸和蛋白质序列分析、蛋白质高级结构分析、蛋白质组研究图谱的处理、蛋白质、核酸三维结构的显示、文件格式转换(Seqverter)等 4. 计算机辅助药物设计 以前药物的发现是通过偶然的途径或定向筛选,但这不可避免地带有盲目性或工作量巨大,据统计,平均筛选1.52万个化合物才能发现一个新药,历时1012年 现在药物研究的主要方向是合理药物设计,它是根据生命科学研究中所揭示
5、的药物作用靶点,在参考天然化合物结构和其配基的基础上,设计合理的药物分子,由于设计目的明确,可以大大减少所筛选的化合物的数目 SARS冠状病毒的基因组序列和其他冠状病毒的基因组序列进行多序列比对,发现SARS冠状病毒是一种新的冠状病毒突变体对11个SARA冠状病毒基因组进行多序列比对分析,发现测序结果几乎完全相同,说明在测序这段时间内,该病毒没有发生较大的转型根据SARS病毒的生活史,推断SARS3CL蛋白酶在SARS病毒结构基因成熟过程中起重要作用抑制该酶可以影响病毒的增殖和扩增在一级结构的基础上预测了三级结构,而且为半胱氨酸蛋白酶设计了19种半胱氨酸蛋白酶抑制剂类药物进行测试,发现6种可能
6、对SARS有效 5. 计算机辅助疫苗设计对于一个已知序列的蛋白抗原,单纯通过实验的方法鉴定表位常须合成大量的交叠肽,或裂解成小肽通过多肽结合试验筛选测定,但都费时费力如果能先对表位进行预测,使待选多肽范围缩小,再通过实验的方法进行验证,往往能够取得事半功倍的效果 近些年来,随着实验技术的发展,使得越来越多的抗原表位得以鉴定,并建立了相应的数据库,使得抗原表位表位预测的效果不断提高 6. 生物芯片生物芯片的实质就是在一个不大的基质载体上,有序地排列了固定在某一位置的可寻址的识别分子,与待检测的物质结合或反应是在同一条见下进行的 常见的芯片有基因芯片和蛋白质芯片 基因芯片应用在新药研究中,据计算,
7、传统的药物筛选方法每个样本需要花4美元,而用芯片技术只需要花40美分 基因芯片测序原理Heller用基因芯片来检测类风湿关节炎病理组织和正常组织基因表达的差异发现了已知的100多个与类风湿关节炎致病有关的基因表达差异发现编码IL-6和另外几个金属蛋白酶(包括金属弹性蛋白酶)的基因表达得到增强弹性蛋白酶可以破坏胶原纤维和组织基底膜层,就为治疗该病提供了新的药物靶标第二节 核酸序列数据库Genbank、EMBL和DDBJ是国际上三大主要核酸序列数据库目前这三个数据中心各自收集世界各国有关实验室和测序机构发布的序列数据通过计算机网络每天都将新发现的或更新过的数据进行交换,以保证这三个数据库序列信息的
8、完整性 一、GenbankGenbank数据库是20世纪80年代初由美国国家健康研究院(NIH)委托洛斯阿拉莫斯(Los Alomos)国家实验室建立后移交给国家生物技术信息中心(NCBI),隶属于NIH下设的国家医学图书馆(NLM)NCBI的网址为:www.ncbi.nlm.nih.govGenbank的网址为:www.ncbi.nlm.nih.gov/Genbank Genban库里的数据来源于约130,000个物种,其中56是人类的基因组序列每条Genbank数据记录包含了对序列的简要描述、它的科学命名、物种分类名称、参考文献、序列特征表以及序列本身 二、EMBL EMBL是欧洲分子生物
9、学实验室在1982年开始创建目前有欧洲生物信息学研究所管理(EBI)其网址为:www.ebi.ac.uk./embl EMBL和Genbank无论是序列的本身,还是对序列的注释,两者的内容完全相同,只是格式有所区别而已,因此进行数据库检索时,只须检索一个即可第三节 基因组与功能基因组数据库 随着许多生物的基因组被测序,特别是人类基因组计划的完成后,科学家们已经开始研究功能基因组学在mRNA水平上观察基因表达的图谱(转录组)和蛋白质水平观察基因表达的图谱(蛋白质组)基因组与功能基因组数据库也就开始建立 一、GDB 由美国Johns Hopkins大学于1990建立,是重要的人类基因组数据库,现在
10、由加拿大儿童医院生物信息中心负责管理,网址为:www.gdb.org GDB数据库用表格的方式给出基因结构数据库,包括基因单位、PCR位点、细胞遗传标记、重复片段等 二、Unigene人类基因组中的序列只有3可以编码蛋白质,因此转录图谱可以把基因组中能够编码的部分集中起来,因此是一种重要的数据资源 Unigene是通过计算机程序对Genbank中的数据进行适当的处理,以便研究基因的 转 录 图 谱 。 其 网 址 为 :www.ncbi.nlm.gov/Unigene 三、SGD 酵母基因组数据库,是已完成基因组测序的啤酒酵母基因组数据库网址:http:/genome-www.standfor
11、d.edu/Saccharomyces 四、TDB包括DNA和蛋白质序列、基因表达、细胞功能以及蛋白质家族信息等。并收录人、植物、微生物等分类信息网址为:www.tigr.org/tdb/tdb.html 五、AceDB 线虫基因组数据库网址为:www.sanger.ac.uk/Software/Acedb 六、dbEST是EST数据库网址是:www.ncbi.nlm.nih.gov/dbEST 七、TRANSFAC 关于转录因子及其结合位点的数据库网址为:http:/transfac.gdf.de/Transfac 八、TRRD 真核生物转录调控数据库网址:www.bionet.nsc.ru
12、/trrd 九、 COMPEL 此数据库收集了脊椎动物在转录调节区的调节元件信息网址:www.gene-regulation. 十、 CUTG 密码子使用频度表(CUTG),是通过Genbank中DNA序列统计出来的网址:www.kazusa.or.jp/codon 第四节 蛋白质序列数据库一、SWISS-PROT数据库 该数据库力图提供高水平的数据注释信息,包括对蛋白质功能、结构域的结构、蛋白质翻译后的修饰、突变体的描述。其目标是提供禁垦恩更详尽的、很少冗余的数据,而且数据库中的连接可以直结链接到其它资源上数据库的网址为:www.ebi.ac.uk/swissprot。二、PIR数据库 PI
13、R是国际上最大的公共蛋白质序列数据库,是一个全面的、经过注释的、非冗余的蛋白质序列数据库。所有的序列都经过整理,超过99的序列已经按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类数据库网址为:www.pir.georgetown.edu 三、PROSITE数据库 收集了生物学有显著意义的蛋白质位点和序列模式,并能根据这些位点和模式快速可靠地鉴别一个未知功能蛋白的蛋白序列应该属于哪一个蛋白家族网址为:www.expasy.ch/prosite 四、PRINTS数据库是建立在蛋白质指纹技术之上的数据库。蛋白质序列指纹图谱是基于多序列的对比结果,它有比对结果得到一系列相当保守的序列模体构建而成,
14、用来表示蛋白质家族特征数据库网址为:www.bioinf.man.ac.uk/dbbrowser/PRINTS 五、TrEMBL数据库 翻译的EMBL,是1996年创建并增补到SWISSPROT数据库中序列是一些免疫球蛋白和T细胞受体、少于8个氨基酸的碎片、合成的序列、具有专利的序列和不能编码真正蛋白的密码子网址为:ftp:/ftp.ebi.ac.uk/pub/database/trembl 六、NRL-3D数据库 包含在PIR数据库中,从蛋白质结构数据库PDB中提取出来的序列构成的数据库库网址为:http:/nbrfa.georgetown.edu/pir/nrl3d.html 第五节 蛋白
15、质结构数据库除了生物序列数据库外,生物大分子的三维结构数据库是另一类重要的分子生物学数据库蛋白质空间结构数据库是随着X射线晶体衍射分子结构测定技术出现而出现的数据库PDB是一个重要的蛋白质结构数据库,在蛋白质序列数据库诞生之前的20世纪70年代就已经问世 PDB数据库网址为:www.rcsb.org/pdb 第六节 蛋白质结构分类数据库PDB数据库中虽然有几千套数据,但其中许多突变体的结构,以及高度同源结构,蛋白质折叠模式是有限的,最著名的结构分类数据库是英国研究小组建立的,分别是SCOP和CATH SCCP:http:/scop.mrclmb.cam.ac.uk/scop. CATH: ww
16、w.biochem.ucl.ac.uk/bsm/cath 第五节 常用生物软件一、Primer Premier5.0 Primer Premier5.0是由加拿大的Premier公司开发的专业用于PCR或测序引物以及杂交探针的设计,评估的软件可以进行引物设计窗口、酶切分析、基元分析(Motif) 二、DNAStar 可以进行ORF的寻找、酶切位点分析、同源序列比对等分析 三、Bandscan 是一款对蛋白质电泳条带进行定量分析的软件 四、Winplas 一款质粒作图软件 五、Oligo6.0引物和探针的设计,质粒作图 六、 VectorNTI序列组装和质粒作图 七、DNAMAN质粒作图软件 八
17、、Readseq序列格式转换软件 第六节 药物基因组学 一、概述 不同病人对同一药物表现出不同的药物治疗效果和毒副作用,一直困扰着临床医疗和制药业 住院病人因为用药不当引起的不良反应发生率在1020,其中5死亡,仅美国每年就有200万以上的病人因为用药不当导致病情加重,其中近10万人因副反应死亡同一种药物有不同的治疗效果 ?个体之间差异性造成的 不同个体对同一药物的不同反应大多数源于个体基因的差异 药物代谢酶、药物转运蛋白、药物作用靶点等药物相关基因的多态性和表达水平不同造成的 最常见的是SNP(单核苷酸多态性)阐明SNP(单核苷酸多态性)和药物反应之间的关系成为基因组计划后的一个重要方向第一
18、次从基因水平上深入认识疾病和药物作用的个体差异机制,并导致了一门新的学科药物基因组学的产生药物基因组学:是研究不同个体的药物反应差异和DNA多态性的关系,即通过DNA序列差异分析,从基因组水平上深入认识疾病和药物作用的个体差异机制,指导和优化药物设计和临床用药 药物基因组学和一般意义上基因学区别药物基因组学不是以发现人体基因组基因为主要目的相对简单地运用已知的基因理论改善病人的治疗药物基因组学是以药物效应及安全性为目标,研究各种基因变异与药效及安全性的关系二、药物基因组学研究的内容1. 基因多态性与药物毒性主要的药物代谢酶是细胞色素P450,它的多态性和药物的毒性与疗效有很大的关系突变型CYP
19、AC9的144位Arg变为Cys,药物与氧化还原酶的亲合力降低 5FU是使许多肿瘤化疗的首选药物,但是其分解代谢的限速酶二氢嘧啶脱氢酶基因能产生突变2. 基因多态性及表达水平多态性与药效n 大多数要通过蛋白质入受体、细胞信号、酶等其作用,编码这些蛋白基因的多态性,影响个体对药物的敏感性n5LO是抗哮喘药物的作用靶点,具有基因上的多态性,有的表现型对抑制剂ABT-761就无效 3. 基因的多态性与微生物的抗药性p 许多药物由于长期使用而导致疗效下降是临床上常见的问题p和病原微生物抗药性的形成密切相关p如在疟原虫抗氯喹(抗疟疾特效药)的研究中发现,有两个基因的多态性起主要影响作用4. 基因多态性和
20、群体许多多态性基因在群体中的频率与人种或种族的特异性有关这方面的信息对个性化用药以及针对独立群体进行合理药物设计具有重大影响,因而也成为药物基因组学研究的一个方面6磷酸脱氢酶缺陷的多态性主要影响了非洲、亚洲、地中海人种的男性对许多药物的敏感以及日本人对酒精的敏感性 三、药物基因组学研究的应用前景1. 为药物研发开辟了一个全新的领域随着人类基因组计划的完成,功能基因组计划进展,使以基因治疗为基础的药物发现和开发进入了一个新的历史时期 2. 合理用药与个性化治疗 基因的多态性决定了病人对药物反应的不同,根据病人的基因组特征给药就是个体化给药的治疗方案,是合理用药的核心个体对药物代谢存在差异,但现代
21、医学实践中采取的仍然是标准体重作为给药剂量的依据,不可避免地存在一些缺陷今后将根据个体的基因型选择药物和给药剂量,从根本上改变药物治疗模式,实现个体化医疗 3. 巨大的商业机会挽救副作用较大的药物。诺华公司的精神分裂症药物氯氮平,目前仍是精神病的首选药,但约1的病人用后会引起危及生命的粒细胞缺乏症,从而限制了市场,如果能检测出粒细胞缺乏症的药物应答基因,无疑会大大拓宽市场药物基因组能提供药物的应答基因,以此为基础开发出诊断试剂盒从I期临床开始收集药物应答基因的数据,III期确定使用病人范围,增加药物上市的机会19981998年和年和20052005年药物基因组产品和年药物基因组产品和服务市场服务市场(百万美元)(百万美元)适应证 1998年 2005年心血管疾病 8.2 139.1传染病 7.3 123.3中枢神经系统疾病 4.3 72.30癌症 2.4 41.30其他 24.8 419.0合计 47.0 795.04. 中医药现代化的研究中医的因人而异的整体治疗方案,正好和个性化的治疗相吻合,目前虽然没有确切证据,但是用药物基因组来解释中医药理论,还是一项具有理论和实践价值的工作
限制150内