生物信息学概述.ppt
第一章第一章 生物信息学概述生物信息学概述郑珩 副教授中国药科大学生物信息学教研室什么是生物信息学?(What)为什么要学习生物信息学?(Why)怎样学好这门课程?(How)通过本课程学习,要达到什么要求1.什么是生物信息学信息信息是用符号、信号或消息所包含的内容,来直接或间接描述客观世界生物信息分子:细胞细胞核酸蛋白质多糖DNA-遗传密码的携带者遗传密码的携带者引自Neil Campbell著Biology第4版,1996从基因组序列信息到基因功能染色体染色体基因基因蛋白蛋白质功能功能8 采用信息科学技术,借助数学、采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。储存、分析、解释的一门学科。收集、加工、储存:计算机科学家分析、解释:生物学家生物信生物信生物信生物信息学息学息学息学What is bioinformatics?9生物生物信息信息学:学:研究对象:生物学(核酸蛋白质)研究对象:生物学(核酸蛋白质)研究内容:数学模型;生物学范畴研究内容:数学模型;生物学范畴研究工具:计算机科学(程序)研究工具:计算机科学(程序)研究人员:计算机科学家研究人员:计算机科学家生物学家生物学家10生物生物信息信息学新兴的交叉学科学新兴的交叉学科Mathematical Mathematical sciencessciencesComputer Computer sciencessciencesLife Life sciencessciences2.Why?AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTA C G TA C G T hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheearhisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheearthat this Nation,under GOD,shall have a new birth of freedom;and that government of the People,by the People and for the People shall not perish from the earth AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTA C G TA C G T15人人类基因基因组计划开始划开始(Human Genome Project,HGP)人人类基因基因组计划划带来了来了 生物信息学生物信息学。第一节 生物信息学发展简史16曼哈顿原子弹计划曼哈顿原子弹计划阿波罗登月计划阿波罗登月计划人类基因组计划人类基因组计划人类自然科学史上的人类自然科学史上的 3 大计划大计划17 基因组基因组(Genome)(Genome):包含包含细胞或生物体细胞或生物体全套的遗传信息的全部全套的遗传信息的全部 遗传物质。遗传物质。细胞核基因组细胞核基因组DNADNA细胞质(线粒体、叶绿体)基因组细胞质(线粒体、叶绿体)基因组DNADNA 人类基因组:人类基因组:3.2109 bp18 人人类基因基因组计划准划准备用用15年年时间投入投入30亿美元美元,完成人全部,完成人全部24(22+X+Y)条染色体中条染色体中3.2109个个碱基碱基对的序列的序列测定,主要任定,主要任务包包括括做做图(遗传图谱物理物理图谱以以及及转录图谱的的绘制)、制)、测序序和和基基因因识别,其根本任,其根本任务是解是解读和破和破译生物体的生老病死以及与疾病生物体的生老病死以及与疾病相关的相关的遗传信息。信息。19HGPHGP的的的的历史回顾历史回顾历史回顾历史回顾1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义1985 Dulbecco在Science撰文“肿瘤研究的转折点:人 类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任1990.10 经美国国会批准,人类基因组计划正式启动1998.5 塞莱拉遗传公司成立,宣布3年内完成HGPJames Watson202000 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基 因组的测序工作 Nature刊文发表国际公共领域结果 Science刊文发表Celera公司及其合作者结果Drosophila melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥21At the White House on June 26,Francis Collins(r),Director of the National Human Genome Research Institute,President Clinton,and J.Craig Venter,President of Celara Genomics,lauded the thousands of scientists who contributed to the genome sequence.公共领域和Celera公司同时宣布完成人类基因组工作草图222001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面23我国对人类基因组计划的贡献我国对人类基因组计划的贡献24humanArabidopsis拟南芥拟南芥Thermotoga maritimaEscherichia coli大肠杆菌大肠杆菌Buchnerasp.APSRickettsia prowazekiiUreaplasma urealyticumBacillus subtilisDrosophila melanogasterThermoplasma acidophilumPlasmodium falciparumHelicobacter pylori mouseCaenorhabitis elegansratBorrelia burgorferiBorrelia burgorferiAquifex aeolicusNeisseria meningitidis Z2491Mycobacterium tuberculosis 1,0001,000,0001,000,000,0001,000,000,000,0001,000,000,000,000,0001,000,000,000,000,000,0001,000,000,000,000,000,000,0001,000,000,000,000,000,000,000,000103 Kilo106 Mega109 Giga1012 Tera 1015 Peta1018 Exa1021 Zetta1024 Yotta 100 Tera-bytes(1014)/a typical gene lab/year All the words ever spoken by human beings account to about 5 exa-bytes(5 1018)Soon using 1 zetta-bytes(1021)and 1 yotta-bytes(1024)生物信息量至少是所有人类说过的话的生物信息量至少是所有人类说过的话的200倍倍!至至2004年,国际数据库记录的核酸碱基数目已年,国际数据库记录的核酸碱基数目已超过超过200亿亿!如果用传统的纸张来书写,以每!如果用传统的纸张来书写,以每个核苷酸作为一个字符,则需要印制个核苷酸作为一个字符,则需要印制2万本每万本每本本1000页每页页每页1000字的书!字的书!另外,二维凝胶电泳技术、测序质谱技术以及另外,二维凝胶电泳技术、测序质谱技术以及生物芯片技术的高速发展和广泛应用,也使得生物芯片技术的高速发展和广泛应用,也使得大量的数据信息已经无法用传统的文献形式发大量的数据信息已经无法用传统的文献形式发表,而更多的需以数据库形式,通过文字、图表,而更多的需以数据库形式,通过文字、图象、超链接等多种方式来记录。象、超链接等多种方式来记录。计算机工具的介入计算机工具的介入30生物分子信息的特征生物分子信息的特征生物分子信息数据量生物分子信息数据量大大 生物分子信息生物分子信息复杂复杂 生物分子信息之间存在着密切的生物分子信息之间存在着密切的联系联系31生物信息学(生物信息学(BioinformaticsBioinformatics)这一名词的来由这一名词的来由 八十年代末期,八十年代末期,马来西来西亚的美籍学者林的美籍学者林华安安(Hwa A.Lim)认识到将到将计算机科学算机科学与与生物学生物学结合合起来的重要意起来的重要意义,开始留意要,开始留意要为这一一领域构思一个域构思一个合适的名称。起初,考合适的名称。起初,考虑到与将要支持他主到与将要支持他主办一系一系列生物信息学会列生物信息学会议的佛的佛罗里达州立大学超型里达州立大学超型计算机算机计算研究所的关系,他使用的是算研究所的关系,他使用的是“CompBio”;之;之后,又将其更改后,又将其更改为兼具法国兼具法国风情的情的“bioinformatique”,看起来似乎有些古怪。因,看起来似乎有些古怪。因此不久,他便此不久,他便进一步把它更改一步把它更改为“bio-informatics(或(或bio/informatics)”。但由于当。但由于当时的的电子子邮件系件系统与今日不同,名称中的与今日不同,名称中的-或或/符号符号经常常会引起会引起许多多问题,林博士于是将其去除,林博士于是将其去除,“bioinformatics”就正式就正式诞生了,林博士也因此生了,林博士也因此赢得了得了“生物信息学之父生物信息学之父”的美誉。的美誉。32Bioinformatics生物分子数 据 计算机计 算+第二节 生物信息学的研究领域l基因组序列装配基因组序列装配l基因识别基因识别l基因功能预报基因功能预报l基因多态性分析基因多态性分析l基因进化基因进化lmRNAmRNA结构预测结构预测l基因芯片设计基因芯片设计l基因芯片数据分析基因芯片数据分析l疾病相关基因分析疾病相关基因分析l蛋白质序列分析蛋白质序列分析l蛋白质家族分类蛋白质家族分类l蛋白质结构预测蛋白质结构预测l蛋白质折叠研究蛋白质折叠研究l代谢途径分析代谢途径分析l转录调控机制转录调控机制l蛋白质芯片设计蛋白质芯片设计l蛋白质芯片数据分析蛋白质芯片数据分析l药物设计药物设计(一)、核酸及基因组信息(一)、核酸及基因组信息 1、大规模核酸测序及拼接、大规模核酸测序及拼接 2、基因识别与定位、基因识别与定位 3、基因相关的、基因相关的SNP研究研究 4、非编码区信息结构分析、非编码区信息结构分析 5、比较基因组学、比较基因组学 一、生物学领域一、生物学领域351.大规模基因组测序大规模基因组测序3637运用计算机软件进行序列拼接运用计算机软件进行序列拼接2、基因识别与定位、基因识别与定位 3.基因相关的基因相关的SNP研究研究 Single Nucleotide Polymorphisms(SNP),是指在基因组上单个核苷酸的变异,一般而言,SNP 是指变异频率大于1%的单核苷酸变异40基因变异与疾病基因变异与疾病4、非编码区信息结构分析、非编码区信息结构分析 在微生物中,非编码区非编码区只占整个基因组序列的10%20;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%5、比较基因组学、比较基因组学 比较基因组学比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。(二)蛋白质及蛋白质组信息(二)蛋白质及蛋白质组信息 1、蛋白质结构模拟、蛋白质结构模拟 2、蛋白质功能预测、蛋白质功能预测 3、基因表达及蛋白质组信息学、基因表达及蛋白质组信息学 44蛋白蛋白质三三维结构构测定主要方法:定主要方法:X射射线晶体晶体结构分析、多构分析、多维核磁共振(核磁共振(NMR)波)波谱分析和分析和电子子显微微镜二二维晶体三晶体三维重构(重构(电子晶体学,子晶体学,EC)等物理方法)等物理方法Difficult!Difficult!Expensive!Expensive!Too Much Time!Too Much Time!蛋白质结构及功能预测蛋白质结构及功能预测蛋白质组研究蛋白质组研究(三三)、分子相互作用及代谢调控网络、分子相互作用及代谢调控网络 对生物功能的分析表明基因和蛋白质很对生物功能的分析表明基因和蛋白质很少单独起作用,它们倾向于少单独起作用,它们倾向于成组地通成组地通过网状的交互作用过网状的交互作用而影响生物系统而影响生物系统的功能,分子相互作用信息和单个分子的功能,分子相互作用信息和单个分子的信息一样重要。的信息一样重要。R1R2 R1R248结构与功能结构与功能信号网络信号网络代谢途径代谢途径细胞重建细胞重建系统重建系统重建基因组基因组基因基因后基因组时代单个基因的结构与功能单个基因的结构与功能基因家族基因家族代谢途径代谢途径基因组基因组(四四)、生物进化的研究、生物进化的研究 序列相似性比较序列相似性比较 n生物信息数据库生物信息数据库n数据库接口和检索工具的研制数据库接口和检索工具的研制n新的算法和软件新的算法和软件n1、多序列比较方法、多序列比较方法n2、序列拼接与分析、序列拼接与分析n3、基因组大尺度作图和功能基因组分析方法、基因组大尺度作图和功能基因组分析方法n4、蛋白质结构和功能预测、蛋白质结构和功能预测n5、生物大分子结构图形化显示、生物大分子结构图形化显示n6、细胞代谢过程模拟、细胞代谢过程模拟n7、药物设计相关软件开发、药物设计相关软件开发二、在计算机领域二、在计算机领域第三节第三节 在药学领域应用在药学领域应用一、初始阶段:信息收集一、初始阶段:信息收集 初步调研确定合适的药物作用靶初步调研确定合适的药物作用靶 可行性分析:靶点结构、化合物信息可行性分析:靶点结构、化合物信息 1、诊断类药物:生物芯片设计、诊断类药物:生物芯片设计 遗传病:基因诊断遗传病:基因诊断 感染性疾病:抗体、基因芯片、感染性疾病:抗体、基因芯片、PCR技术技术二、药物设计:二、药物设计:53病人健康人基因芯片诊断及早治疗,对症下药2、预防类药物:、预防类药物:计算机辅助疫苗设计计算机辅助疫苗设计 计算机预测抗原表位计算机预测抗原表位EPIMMUNE http:/ MHCPred 所所谓基因基因组药物物(Genomic drug)是指利用是指利用基因序列数据,基因序列数据,经生物信息学分析、高通生物信息学分析、高通过基因表达、高通量功能基因表达、高通量功能筛选和体内外和体内外药效研究开效研究开发得到的新得到的新药候候选物物 实际上利用了反向生物学的原理沿着从上利用了反向生物学的原理沿着从基因序列一蛋白基因序列一蛋白质一功能一一功能一药物的途径研物的途径研制新制新药,其,其优势是取自是取自庞大的人大的人类基因基因资源及其源及其编码蛋白蛋白质做做为原材料,具有巨大原材料,具有巨大的开的开发潜力。潜力。3、开发基因组药物、开发基因组药物58人类基因组约有人类基因组约有10万万左右的基因编码左右的基因编码10万以上的蛋白质,其中至少万以上的蛋白质,其中至少5即即5000以上的基因编码蛋白质可能具有药以上的基因编码蛋白质可能具有药物开发前景而目前利用常规技术开发物开发前景而目前利用常规技术开发的人类重组蛋白质药物已上市的只有的人类重组蛋白质药物已上市的只有20多种,进入临床实验的只有多种,进入临床实验的只有100多种。多种。美国的人类基因组科学公司美国的人类基因组科学公司(HGS公司公司)。根据其根据其1999年年2月公布的消息,在功能基月公布的消息,在功能基因组研究领域,因组研究领域,HGS公司己发现公司己发现95的的人类人类cDNA;克隆了克隆了9000个人类分泌蛋白个人类分泌蛋白质的全长质的全长cDNA;发现了发现了3000个基因的可个基因的可能医学应用;发现了能医学应用;发现了35个新的白细胞介个新的白细胞介素类分子和素类分子和40个新的生长因子类分子;个新的生长因子类分子;已有已有3个基因组药物进入临床。个基因组药物进入临床。4、寻找药物作用新靶点、寻找药物作用新靶点n基因组比较:抗微生物基因组比较:抗微生物n同源性搜索同源性搜索n表达差异分析表达差异分析 理想的抗生素靶标理想的抗生素靶标应应为微生物细胞存活所为微生物细胞存活所必须,在病原体中高必须,在病原体中高度保守,且在人体中度保守,且在人体中不存在或与人类基因不存在或与人类基因有根本差异。有根本差异。基因组研究促进了新靶标的发现:基因组研究促进了新靶标的发现:63生物信息学和人类基因组计划为药物靶标的发现生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程是基于生物信息学的知识挖掘的过程通通过数据分析数据分析首先确立靶首先确立靶标分子分子预测蛋白蛋白质分分子子结构构设计药物分子物分子与靶与靶标分子相分子相互作用互作用计算机辅助分子建模,分子三维结构可视化。计算机辅助分子建模,分子三维结构可视化。1982年,年,Dock程序程序已成功的有已成功的有HIV蛋白酶抑制剂、二氢叶酸还原蛋白酶抑制剂、二氢叶酸还原酶抑制剂等酶抑制剂等5、计算机辅助药物设计、计算机辅助药物设计 实验发现实验发现2-去氧去氧-2,3-双去氢双去氢-D-N-乙酰神乙酰神经氨酸(经氨酸(Neu5Ac2en)对唾液酸酶有抑对唾液酸酶有抑制作用,但在动物模型中效果不佳。制作用,但在动物模型中效果不佳。通过实验测定了唾液酸酶的晶体结构通过实验测定了唾液酸酶的晶体结构 及酶与抑制剂及酶与抑制剂Neu5Ac2en的晶体结构的晶体结构 抑制活性测定表明抑制活性测定表明4-氨基和氨基和4-胍胍基取代基取代Neu5Ac2en,比其母体比其母体Neu5Ac2en分别提高分别提高20倍倍和和5000倍倍,后者已进入临床,有望成,后者已进入临床,有望成为一种新的抗病毒药物。为一种新的抗病毒药物。(三)、开发阶段:药物基因组学(三)、开发阶段:药物基因组学 减少药物副作用减少药物副作用 避免开发风险避免开发风险73生物信息学研究意义生物信息学研究意义认识生物本生物本质n n了解生物分子信息的了解生物分子信息的了解生物分子信息的了解生物分子信息的组织组织和和和和结结构,破构,破构,破构,破译译基因基因基因基因组组信息,信息,信息,信息,阐阐明生物信息之明生物信息之明生物信息之明生物信息之间间的关系的关系的关系的关系改改变生物学的研究方式生物学的研究方式 n n改改改改变传统变传统研究方式,引研究方式,引研究方式,引研究方式,引进现进现代信息学方法代信息学方法代信息学方法代信息学方法在医学上的重要意在医学上的重要意义n n为为疾病的疾病的疾病的疾病的诊诊断和治断和治断和治断和治疗疗提供依据提供依据提供依据提供依据n n为设计为设计新新新新药药提供依据提供依据提供依据提供依据74How?编编号号号号名称名称名称名称1 1生物信息学生物信息学生物信息学生物信息学绪论绪论2 2核酸序列数据核酸序列数据核酸序列数据核酸序列数据库库3 3生物医生物医生物医生物医药药信息信息信息信息检检索索索索4 4序列比序列比序列比序列比对对5 5核酸序列分析核酸序列分析核酸序列分析核酸序列分析6 6蛋白蛋白蛋白蛋白质质序列分析序列分析序列分析序列分析7 7常用生物信息学工具常用生物信息学工具常用生物信息学工具常用生物信息学工具软软件件件件8 8计计算机算机算机算机辅辅助助助助药药物物物物设计设计学习内容学习内容75通过本门课程的学习,我们将能够:了解生物信息学的一般概念和基本算法学会搜索各种生物信息学资源;能够利用各种工具搜索核酸蛋白质数据库;能够对未知基因及其产物进行初步的生物信息学分析;能够利用数据库进行序列的拼接和电子克隆;6能够进行系统发育树的构建和分析;7了解生物信息学分析软件的使用方法;8.了解计算机辅助药物设计的原理和方法。学习目标:76References郑珩等.药物生物信息学,化学工业出版社,2004张成岗等.生物信息学方法与实践,科学出版社,2002黄韧等.生物信息学网络资源与应用,中山大学出版社,2003钟扬等.简明生物信息学,高等教育出版社,2001孙啸等.生物信息学基础,清华大学出版社,2005其他学习方法多实践,多思考一些论坛:丁香园 生物通 生物谷 小木虫 http:/