生物信息学在蛋白质工程中的应用课件.ppt
《生物信息学在蛋白质工程中的应用课件.ppt》由会员分享,可在线阅读,更多相关《生物信息学在蛋白质工程中的应用课件.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、蛋白质工程蛋白质工程 主讲教师:曹运长主讲教师:曹运长 博士、副教授博士、副教授 马马 云云 副教授副教授 佘美华佘美华 博士、副教授博士、副教授 授课专业:生物技术、生物科学授课专业:生物技术、生物科学Protein Engineering南华大学生化与分子生物学教研室南华大学生化与分子生物学教研室办公室:第办公室:第3教学楼教学楼315室室版权声明:版权声明:本课件版权所有,未经本课件版权所有,未经允许不得转载他处。允许不得转载他处。第六章第六章 生物信息学在蛋白质工生物信息学在蛋白质工程中的应用程中的应用l l第一节、生物信息学与蛋白质工程第一节、生物信息学与蛋白质工程l l第二节、蛋白
2、质常用数据库第二节、蛋白质常用数据库l l第三节、蛋白质结构预测第三节、蛋白质结构预测n n二十一世纪是生命科学的时代,也是信息时代。二十一世纪是生命科学的时代,也是信息时代。二十一世纪是生命科学的时代,也是信息时代。二十一世纪是生命科学的时代,也是信息时代。n n近年来,随着现代分子生物学的发展,特别是人类基组计划的近年来,随着现代分子生物学的发展,特别是人类基组计划的近年来,随着现代分子生物学的发展,特别是人类基组计划的近年来,随着现代分子生物学的发展,特别是人类基组计划的实施,不断产生出巨量的分子生物学数据,这些数据有着数量实施,不断产生出巨量的分子生物学数据,这些数据有着数量实施,不断
3、产生出巨量的分子生物学数据,这些数据有着数量实施,不断产生出巨量的分子生物学数据,这些数据有着数量巨大、关系复杂,以至于不利用计算机根本无法实现数据的存巨大、关系复杂,以至于不利用计算机根本无法实现数据的存巨大、关系复杂,以至于不利用计算机根本无法实现数据的存巨大、关系复杂,以至于不利用计算机根本无法实现数据的存储和分析。这样,生物信息学最终形成一门独立的学科并被推储和分析。这样,生物信息学最终形成一门独立的学科并被推储和分析。这样,生物信息学最终形成一门独立的学科并被推储和分析。这样,生物信息学最终形成一门独立的学科并被推上了生物科学发展的最前沿。上了生物科学发展的最前沿。上了生物科学发展的
4、最前沿。上了生物科学发展的最前沿。前前 言言第一节第一节 生物信息学与蛋白质工程生物信息学与蛋白质工程一、生物信息学概述一、生物信息学概述n n定义:它是一个学科领域,包含着对生物信息的定义:它是一个学科领域,包含着对生物信息的定义:它是一个学科领域,包含着对生物信息的定义:它是一个学科领域,包含着对生物信息的获取、加工、存储、分配获取、加工、存储、分配获取、加工、存储、分配获取、加工、存储、分配 、分析和解释的所有方、分析和解释的所有方、分析和解释的所有方、分析和解释的所有方面,并综合应用数学、计算机科学、物理学、化面,并综合应用数学、计算机科学、物理学、化面,并综合应用数学、计算机科学、物
5、理学、化面,并综合应用数学、计算机科学、物理学、化学和生物学等工具,来阐明和理解大量生物数据学和生物学等工具,来阐明和理解大量生物数据学和生物学等工具,来阐明和理解大量生物数据学和生物学等工具,来阐明和理解大量生物数据所包含的生物学意义。所包含的生物学意义。所包含的生物学意义。所包含的生物学意义。(一)生物信息学发展简史(一)生物信息学发展简史基因组时代:基因组时代:基因组时代:基因组时代:主要是主要是主要是主要是基因的寻找、数据与数据之间的比较基因的寻找、数据与数据之间的比较基因的寻找、数据与数据之间的比较基因的寻找、数据与数据之间的比较、网络网络网络网络相互界面(相互界面(相互界面(相互界
6、面(InterfaceInterface););););生物信息学自诞生以来,经历了三个阶段:生物信息学自诞生以来,经历了三个阶段:前基因组时代:前基因组时代:主要是主要是序列分析、数据库的查询序列分析、数据库的查询、计算机操作和、计算机操作和PC的应用;的应用;后基因组时代:后基因组时代:主要是数据的挖掘、表达、数据多样性的分析、主要是数据的挖掘、表达、数据多样性的分析、相互交叉数据分布的总结与分析。相互交叉数据分布的总结与分析。其研究的内容不仅包括基因其研究的内容不仅包括基因的查寻和同源性分析;而且进一步到基因和基因组的功能分析,的查寻和同源性分析;而且进一步到基因和基因组的功能分析,即所
7、谓的功能基因组学研究。即所谓的功能基因组学研究。生物信息学的诞生生物信息学的诞生生物信息学的诞生生物信息学的诞生(二)生物信息学的主要研究内容(二)生物信息学的主要研究内容l生物信息的收集、存储、管理与提供生物信息的收集、存储、管理与提供 l基因组序列信息的提取和分析基因组序列信息的提取和分析 l功能基因组相关信息分析功能基因组相关信息分析 l生物大分子结构模拟和药物设计生物大分子结构模拟和药物设计 l生物信息分析的技术与方法研究生物信息分析的技术与方法研究 计算机辅助药物筛选计算机辅助药物筛选高通量虚拟筛选方法高通量虚拟筛选方法分子数据库,组合化分子数据库,组合化学化合物库学化合物库,靶标生
8、靶标生物大分子的功能分析物大分子的功能分析.蛋白质蛋白质相互蛋白质蛋白质相互作用识别,信号传导系作用识别,信号传导系统、代谢途径的分子模统、代谢途径的分子模拟拟.图像处理、聚图像处理、聚类分析、表达类分析、表达谱和调控网络谱和调控网络分析分析.计算机辅助先导化合计算机辅助先导化合物设计、药物设计物设计、药物设计生物信息学的内容生物信息学的内容 1.1.生物信息的收集、存储、管理与提供生物信息的收集、存储、管理与提供 包括建立国际基本生物信息库和生物信息传输的包括建立国际基本生物信息库和生物信息传输的国际联网系统;建立生物信息数据质量的评估与国际联网系统;建立生物信息数据质量的评估与检测系统;生
9、物信息的在线服务;生物信息可视检测系统;生物信息的在线服务;生物信息可视化和专家系统。化和专家系统。基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJDDBJEMBLEMBLGenBankGenBankSWISS-PROT SWISS-PROT PDBPDBPIRPIR 生物分子数据的收集与管理生物分子数据的收集与管理2.2.基因组序列信息的提取和分析基因组序列信息的提取和分析 u 基因的发现与鉴定;基因的发现与鉴定;u 基因组中非编码区的信息结构分析,提出理论模型,阐明基因组中非编码区的信息结构分析,提出理论模型,阐明该区域的重要生物学功能
10、;该区域的重要生物学功能;u 进行模式生物完整基因组的信息结构分析和比较研究;进行模式生物完整基因组的信息结构分析和比较研究;u 利用生物信息研究遗传密码起源、基因组结构的演化、基利用生物信息研究遗传密码起源、基因组结构的演化、基因组空间结构与因组空间结构与DNADNA折叠的关系以及基因组信息与生物进化关折叠的关系以及基因组信息与生物进化关系等生物学的重大问题。系等生物学的重大问题。数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻搜索同源序列在一定程度上就是通过序列比较寻搜索同源序列在一定程度上就是通过序列比较寻搜索同
11、源序列在一定程度上就是通过序列比较寻找相似序列。找相似序列。找相似序列。找相似序列。序列比较的一个基本操作就是序列比较的一个基本操作就是序列比较的一个基本操作就是序列比较的一个基本操作就是比对,比对,比对,比对,即将两个序即将两个序即将两个序即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按列的各个字符(代表核苷酸或者氨基酸残基)按列的各个字符(代表核苷酸或者氨基酸残基)按列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果照对应等同或者置换关系进行对比排列,其结果照对应等同或者置换关系进行对比排列,其结果照对应等同或者置换关系进行对比排列,其结果是两个序列共
12、有的排列顺序,这是序列相似程度是两个序列共有的排列顺序,这是序列相似程度是两个序列共有的排列顺序,这是序列相似程度是两个序列共有的排列顺序,这是序列相似程度的一种定性描述。的一种定性描述。的一种定性描述。的一种定性描述。发现同源分子发现同源分子发现同源分子发现同源分子n n下面介绍序列分析的一些基本知识。值得注意的下面介绍序列分析的一些基本知识。值得注意的下面介绍序列分析的一些基本知识。值得注意的下面介绍序列分析的一些基本知识。值得注意的是,在对序列进行分析时,首先应当明确序列的是,在对序列进行分析时,首先应当明确序列的是,在对序列进行分析时,首先应当明确序列的是,在对序列进行分析时,首先应当
13、明确序列的性质性质性质性质,是是是是mRNAmRNAmRNAmRNA序列还是基因组序列?是计算机拼接序列还是基因组序列?是计算机拼接序列还是基因组序列?是计算机拼接序列还是基因组序列?是计算机拼接得到还是经过得到还是经过得到还是经过得到还是经过PCRPCRPCRPCR扩增测序得到?是原核生物还是扩增测序得到?是原核生物还是扩增测序得到?是原核生物还是扩增测序得到?是原核生物还是真核生物?这些决定了分析方法的选择和分析结真核生物?这些决定了分析方法的选择和分析结真核生物?这些决定了分析方法的选择和分析结真核生物?这些决定了分析方法的选择和分析结果的解释。果的解释。果的解释。果的解释。序列分析序列
14、分析序列分析序列分析 核酸核酸蛋白质蛋白质双序列比对双序列比对 多序列比对和进化树多序列比对和进化树 ORF(Open Reading Frame)分析分析 染色体定位染色体定位 基因结构分析基因结构分析 基因上游调控区分析基因上游调控区分析 跨膜区预测跨膜区预测信号肽预测信号肽预测 亚细胞定位预测亚细胞定位预测 核酸序列分析核酸序列分析核酸序列分析核酸序列分析l l双序列比对(双序列比对(双序列比对(双序列比对(pairwisepairwise alignment alignment)l l双序列比对是指用计算机进行序列分析的强大工具,双序列比对是指用计算机进行序列分析的强大工具,双序列比对
15、是指用计算机进行序列分析的强大工具,双序列比对是指用计算机进行序列分析的强大工具,比较两条序列的相似性和寻找相似碱基及氨基酸的比较两条序列的相似性和寻找相似碱基及氨基酸的比较两条序列的相似性和寻找相似碱基及氨基酸的比较两条序列的相似性和寻找相似碱基及氨基酸的对应位置。对应位置。对应位置。对应位置。l lFASTAFASTA(http:/www.ebi.ac.uk/fasta33/http:/www.ebi.ac.uk/fasta33/)和)和)和)和BLASTBLAST(http:/http:/www.ncbi.nlm.nih.govwww.ncbi.nlm.nih.gov/BLAST/BLA
16、ST/)是目前运用较为广泛的相似性搜索工具。)是目前运用较为广泛的相似性搜索工具。)是目前运用较为广泛的相似性搜索工具。)是目前运用较为广泛的相似性搜索工具。l l一般输入所比较的序列即可一般输入所比较的序列即可一般输入所比较的序列即可一般输入所比较的序列即可 。3.3.功能基因组相关信息分析功能基因组相关信息分析 包括与大规模基因表达谱分析相关的算法、软件包括与大规模基因表达谱分析相关的算法、软件研究,基因表达调控网络的研究;与基因组信息研究,基因表达调控网络的研究;与基因组信息相关的核酸、蛋白质空间结构的预测和模拟,以相关的核酸、蛋白质空间结构的预测和模拟,以及蛋白质功能预测的研究。及蛋白
17、质功能预测的研究。4.4.生物大分子结构模拟和药物设计生物大分子结构模拟和药物设计 包括包括RNA(RNA(核糖核酸核糖核酸)的结构模拟和反义的结构模拟和反义RNARNA的分子的分子设计;蛋白质空间结构模拟和分子设计;生物活设计;蛋白质空间结构模拟和分子设计;生物活性分子的电子结构计算和设计;纳米生物材料的性分子的电子结构计算和设计;纳米生物材料的模拟与设计;基于酶和功能蛋白质结构、细胞表模拟与设计;基于酶和功能蛋白质结构、细胞表面受体结构的药物设计;基于面受体结构的药物设计;基于DNADNA结构的药物设结构的药物设计等。计等。5.5.生物信息分析的技术与方法研究生物信息分析的技术与方法研究l
18、包括发展有效的能支持大尺度作图与测序需要的软件、数包括发展有效的能支持大尺度作图与测序需要的软件、数据库以及若干数据库工具;据库以及若干数据库工具;l改进现有的理论分析方法;改进现有的理论分析方法;l创建一切适用于基因组信息分析的新方法、新技术;创建一切适用于基因组信息分析的新方法、新技术;l建立严格的多序列比较方法;建立严格的多序列比较方法;l发展与应用密码学方法以及其他算法和分析技术,用于解发展与应用密码学方法以及其他算法和分析技术,用于解释基因组的信息,探索释基因组的信息,探索DNADNA序列及其空间结构信息的新表征;序列及其空间结构信息的新表征;l发展研究基因组完整信息结构和信息网络的
19、研究方法等;发展研究基因组完整信息结构和信息网络的研究方法等;l发展生物大分子空间结构模拟、电子结构模拟和药物设计发展生物大分子空间结构模拟、电子结构模拟和药物设计的新方法与新技术。的新方法与新技术。生物信息学常用的方法和技术生物信息学常用的方法和技术生物信息学常用的方法和技术生物信息学常用的方法和技术 1.1.1.1.数学统计方法数学统计方法数学统计方法数学统计方法2.2.2.2.动态规划方法动态规划方法动态规划方法动态规划方法3.3.3.3.模式识别技术模式识别技术模式识别技术模式识别技术4.4.4.4.数据库技术数据库技术数据库技术数据库技术5.5.5.5.人工神经网络技术人工神经网络技
20、术人工神经网络技术人工神经网络技术6.6.6.6.分子模型化技术分子模型化技术分子模型化技术分子模型化技术7.7.7.7.分子力学和量子力学计算分子力学和量子力学计算分子力学和量子力学计算分子力学和量子力学计算8.8.8.8.分子动力学模拟分子动力学模拟分子动力学模拟分子动力学模拟9.9.9.9.专家系统专家系统专家系统专家系统 10.Internet10.Internet10.Internet10.Internet技术技术技术技术(三)生物信息学研究现状与展望(三)生物信息学研究现状与展望(三)生物信息学研究现状与展望(三)生物信息学研究现状与展望1.1.1.1.国外生物信息学研究现状国外生
21、物信息学研究现状国外生物信息学研究现状国外生物信息学研究现状2.2.2.2.我国生物信息学研究现状我国生物信息学研究现状我国生物信息学研究现状我国生物信息学研究现状3.3.3.3.生物信息学研究目标生物信息学研究目标生物信息学研究目标生物信息学研究目标国外生物信息学研究现状国外生物信息学研究现状国外生物信息学研究现状国外生物信息学研究现状 各国政府和工业界对生物信息学极为重视,投入了大各国政府和工业界对生物信息学极为重视,投入了大各国政府和工业界对生物信息学极为重视,投入了大各国政府和工业界对生物信息学极为重视,投入了大量资金。欧美各国及日本相继成立了生物信息中心,如美国量资金。欧美各国及日本
22、相继成立了生物信息中心,如美国量资金。欧美各国及日本相继成立了生物信息中心,如美国量资金。欧美各国及日本相继成立了生物信息中心,如美国的国家生物技术信息中心(的国家生物技术信息中心(的国家生物技术信息中心(的国家生物技术信息中心(NCBINCBINCBINCBI)、欧洲生物信息学研究所)、欧洲生物信息学研究所)、欧洲生物信息学研究所)、欧洲生物信息学研究所 (EBI)(EBI)(EBI)(EBI)、日本信息生物学中心(、日本信息生物学中心(、日本信息生物学中心(、日本信息生物学中心(CIBCIBCIBCIB)等。)等。)等。)等。NCBINCBINCBINCBI、EBIEBIEBIEBI和和和
23、和CIBCIBCIBCIB相相相相互合作,共同维护着互合作,共同维护着互合作,共同维护着互合作,共同维护着GenBankGenBankGenBankGenBank、EMBLEMBLEMBLEMBL、DDBJDDBJDDBJDDBJ三大基因序列数三大基因序列数三大基因序列数三大基因序列数据库。它们每天通过计算机网络互相交换数据,使得三个数据库。它们每天通过计算机网络互相交换数据,使得三个数据库。它们每天通过计算机网络互相交换数据,使得三个数据库。它们每天通过计算机网络互相交换数据,使得三个数据库能同时获得最新数据。此外,他们每年召开两个年会讨据库能同时获得最新数据。此外,他们每年召开两个年会讨据
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 蛋白质 工程 中的 应用 课件
限制150内