最新北京大学化学信息学course-11PPT课件.ppt
《最新北京大学化学信息学course-11PPT课件.ppt》由会员分享,可在线阅读,更多相关《最新北京大学化学信息学course-11PPT课件.ppt(76页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2化学信息学第十一讲Chemoinformatics9名词解释 Chemoinformatics ?: Chemoinformatics 是是知识管理知识管理(knowledge management)的有机组成部分的有机组成部分Nicholas J. Hrib, Norton P. PeetChemoinformatics: are we exploiting these new science?“Drug Discovery Today 5 (11): 483-485, Nov. 200010名词解释 Cheminformatics 化学信息学: 结合化学合成、生物筛选及数据挖掘技术指导药
2、物发现和开发, 用于合理的设计具有类药性质的化合物,构建用于虚拟高通量筛选的智能化合物库,研究以往的数据知道先导化合物的优化Cheminformatics: Intelligent Drug Discovery May 28- 30, 2003 Philadelphia PA 1112Human Alcohol Dehydrogenase (Adh1A) w 分类:Oxidoreductasew 简介:Molecule: Class I Alcohol Dehydrogenase 1, Subunit; Chain: A, B; Engineered: Yesw 实验方法 :X-ray Dif
3、fraction13Human Alcohol Dehydrogenase (Adh1A) 14分子结构信息的计算机存储和表达w 如何使用计算机存储化学结构?w 如何处理存储的结构信息?w 计算机在Chemoinfomatics中的应用?15分子结构信息表达的内容n原子n原子间的连接l键型n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO16分子结构信息表达的内容n原子n原子间的连接l键型n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO17分子结构信息表达的内容n原子n原子间的连接
4、l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH2OHO18分子结构信息表达的内容n原子n原子间的连接l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2CHNH3+OO19分子结构信息表达的内容n原子n原子间的连接l键型(芳香环)n立体化学构型n电荷n同位素 n3D-coordinates for atomsOHCH2C14HNH2OHO2021分子结构一维表示法(Line Notation)w 简介:n使用字符串表示分子结构w 现有的几种表示法nWiswesser Lin
5、e Notation (WLN) (Dialog)nSimplified Molecular Input Line System (SMILES/SMARTS) (Daylight)nRepresentation of Structure Diagram Arranged Linearly (ROSDAL) - (Beilstein)nSybyl Line Notation (SLN)- (Tripos)OHCH2CHNH2OHO1345689111213wROSDAL1O-2=3O,2-4-5N,4-6-7=-12-7,10-13OwSLNOHC(=O)CH(NH2)CH2C1=CHCH=C
6、(OH)CH=CH1wWLN QVYZ1R DQwSMILESOC(=O)C(N)CC1=CC=C(O)C=C122分子结构一维表示法(Line Notation)Simplified Molecular Input Line Entry System (SMILES) 基于价键模型的标记法Author: Dave Weininger (Daylight)23CMethaneC1CCCCC1cyclohexaneOwaterc1ccccc1benzeneCCethaneCOmethanolOC methanol NCH(C)C(=O)OCCOethanolCC(=O)CacetoneO=C=O
7、carbon dioxideL-alanineSMILE标记示例24atom : symbol sign 双字母原子符号: Br (Upper/lower case)原子的预定义价键:B(3), C(4), N(3,5), O(2), P(3,5), S(2,4,6), F(1), Cl(1), Br(1), I(1)大写的字母表示非芳香体系示例:ClHydrochloric acidSH2S Fe+Iron(II)cationAtoms 语法25Bond 语法语法bond : | - | = | # | . ; single | double | triple | disconnection
8、Ethene C=CFormaldehyde C=OHydrogen Cyanide C#NButadiene C=CC=C26分支分支 将支链放在括号中SMILES: CCCC(C(=O)O)CCCbranch : ( ) | ( ) | ( ) | ( )27环定义环定义 合环键用数字标出合环键用数字标出28 非连接关系 (disconnections): 同位素表示:SMILES: Na+.O-c1ccccc1specified inside brackets. SMILES: 13CH4其它定义其它定义29F/C=C/FF/C=CF双键构型的表示双键构型的表示 / / 30从旋光中心沿
9、字符串顺序观察,逆时针为,顺时针为NC(C)(F)C(=O)O手性表示手性表示 or or 31氢原子表示氢原子表示显式表示氢原子的四种情况:带电荷的氢, 如:质子 H+ 与其它氢相连的氢, 如:氢气 HH 氢桥1. 同位素,如:重水, 2HO2H 32芳香性芳香性N1ccccc1 N1=CC=CC=C1C1cc2cccccc2c1 C1=CC2=CC=CC=CC2=C133O-n+1ccccc1pyridine-N-oxideOCH1CCCCCH1Ocis-resorcinolCC(C)NCC(O)COc1cccc2ccccc12Propranolol a beta-blocker一些例子一
10、些例子34SMILES的正规化标记c1ccccc1Oc2ccccc2(N)Nc2ccccc2Oc1ccccc1O(c1ccccc1)(c2ccccc2N)Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 Nc1ccccc1Oc2ccccc2 35分子结构一维表示法(Line Notation)w 优点:n易于手工书写n结构紧凑w 局限:n信息量小n对复杂分子的标记比较繁琐。n某些情况下,标记具有二义性。36分子结构一维表示法的应用 构造查询语言 子结构匹配 相似性搜索(结构指纹) 化合物组合库的压缩存储 反应数据库37SMILES 应用示例w ClogP 辛醇/水分配
11、系数w 实验方法w logP计算 pH 7.0时的分配系数w 数据库规模 = 2,000,000化合物w 工作站搜索速度= 500,000/s38ClogP的计算使用片断加和法 (片断值校正项)片断值基于实验值,与片断的类型有关,如:极性基团、卤素、离子、不饱和键校正项描述不同片断间的相互作用,如:氢键等39http:/ 分子结构二维表示法n连接表 (Connection Table)n邻接矩阵 (Adjacency Table)42连接表 (Connection Table)w 简介:计算机系统中主流结构表示方法w 类型 n“内部” CTs (内存) l程序处理n“外部” CTs (磁盘文件
12、)l文件存储 l数据交换43“Redundant” Connection TableO1 2 1C0 1 1 3 2 4 1O0 2 2C 1 2 1 5 1 6 1N2 4 1C2 4 1 7 1C0 6 1 8 212 1C1 7 2 9 1C1 8 110 2C0 9 211 113 1C110 112 2C111 2 7 1O110 19OHCH2CHNH2OHO13456811121344MDL Connection Tablew 数据交换的事实标准w 衍生文件格式nMolfile (single molecule)nSDfile (set of molecules and data
13、)nRGfile (Markush structure)nRxnfile (single reaction)nRDfile (set of reactions with data)w 示例wbenzenew WLViewer 3D 0w 12 12 0 0 0 0 0 0 0 0 0w 1.1202 0.0003 0.0002 C 0 0 0 0 0 0w 1.8030 1.1835 -0.0005 C 0 0 0 0 0 0w 3.1691 1.1839 -0.0004 C 0 0 0 0 0 0w 3.8522 0.0006 -0.0007 C 0 0 0 0 0 0w 3.1691 -1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 最新 北京 大学化学 信息学 course 11 PPT 课件
限制150内