生物信息学简介.ppt
《生物信息学简介.ppt》由会员分享,可在线阅读,更多相关《生物信息学简介.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、揭开生命奥秘的新兴交叉学科揭开生命奥秘的新兴交叉学科第七章第七章 生物信息学生物信息学内内 容容n生物信息学概念 n生物信息学的内容n生物信息学的研究方法和技术n生物信息学软件和数据库一、生物信息学的概念(p199)生物信息学是用生物信息学是用数理数理和信息科学和信息科学的观点、理的观点、理论和方法,以论和方法,以计算机计算机为为工具对工具对生物信息生物信息进行收进行收集、加工、储存、传播、集、加工、储存、传播、检索和分析的科学。检索和分析的科学。研究材料和结果是各研究材料和结果是各种各样的生物学数据种各样的生物学数据n人基因组海量信息n23对=46条染色体n30亿碱基对(base pairs
2、)n35万个基因基因组学n3万种以上蛋白质 蛋白质组学n基因表达、作用、调控网络已经或即将完成的生物全基因组n几百种原核生物n酵母菌n拟南芥(1-2亿bp)n水稻n人类(32亿bp)n小鼠n大鼠n猪n鸡.等生物信息学的概念生物信息学的概念n后基因组时代的到来后基因组时代的到来n人类首次了解了自身的基因序列,了解人类首次了解了自身的基因序列,了解了很多远亲生物的基因序列了很多远亲生物的基因序列n正在面对指数扩增的基因序列和各种数正在面对指数扩增的基因序列和各种数据库据库n面临如何将基因序列资料转变为有用的面临如何将基因序列资料转变为有用的知识,进而服务于人类,造福人类健康知识,进而服务于人类,造
3、福人类健康的挑战的挑战n人类功能基因组学必须多学科协作人类功能基因组学必须多学科协作n生物信息学技术生物信息学技术n生物芯片技术生物芯片技术n蛋白质组学技术蛋白质组学技术n高通量细胞筛选技术等高通量细胞筛选技术等n生物信息学是人类功能基因组学研生物信息学是人类功能基因组学研究的必要工具究的必要工具实验实验生物学生物学计算计算生物学生物学理论理论生物学生物学生物信息的开发和应用生物信息的开发和应用n以核酸蛋白质等生物大分子为主要研究对象n以信息、数理、计算机科学为主要研究手段n以计算机网络为主要研究环境n以计算机软件为主要研究工具n对序列数据进行存储、管理、注释、加工n对各种数据库进行查询、搜索
4、、比较、分析n构建各种类型的专用数据库信息系统n研究开发面向生物学家的新一代计算机软件生物信息学的概念生物信息学的概念 计算机学、计算机网络医学生物学、分子生物学生物信息学数学、统计学生物信息学和其它学科的关系生物信息学和其它学科的关系生物信息学是一门边生物信息学是一门边缘学科,它位于生物、缘学科,它位于生物、医学、计算机、数学医学、计算机、数学等多个领域的交叉点等多个领域的交叉点上上生物信息学的概念生物信息学的概念计算机辅助药物筛选高通量虚拟筛选方法分子数据库,组合化学化合物库,靶标生物大分子的功能分析.蛋白质蛋白质相互作用识别,信号传导系统、代谢途径的分子模拟.图像处理、聚类分析、表达谱和
5、调控网络分析.计算机辅助先导化合物设计、药物设计二、生物信息学的内容(二、生物信息学的内容(p200)1.1.基因与基因组分析基因与基因组分析 可读框预测和可读框预测和基因标注基因标注序列拼接序列拼接与组装与组装结果上传到数结果上传到数据库据库碱基读取载体标识与去除载体标识与去除测序仪中原始数测序仪中原始数据的采样与分析据的采样与分析大大规模基因序列模基因序列测定定生物信息学的内容生物信息学的内容基因基因预测DNADNA序列中编码区的鉴定序列中编码区的鉴定 预测方法的依据预测方法的依据:编码统计学:编码区序列同非编码区序列相比,有编码统计学:编码区序列同非编码区序列相比,有不同的特点,存在一些
6、非随机的特点不同的特点,存在一些非随机的特点 GC GC 含量含量 密码子偏倚性密码子偏倚性 (CODON FREQUENCY)(CODON FREQUENCY)第三个碱基组成第三个碱基组成 基因结构基因结构/统计学方法统计学方法 比较比较/同源性同源性生物信息学的内容生物信息学的内容原核生物基因结构原核生物基因结构编码区启动子转录起始位点非翻译区转录区起始密码子终止密码子53转录终止位点RBS生物信息学的内容生物信息学的内容5启动子转录起始位点非翻译区转录区起始密码子 终止密码子3转录终止位点外显子 切除和拼接位点GTAG内含子真核生物基因结构生物信息学的内容生物信息学的内容lHMM?lHM
7、M 描述了模型中各隐含状态的转换概率基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隐含状态隐含状态用于基因预测的隐马尔可夫模型HiddenMarkovModels,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因组序列基因组序列生物信息学的内容生物信息学的内容特定状态碱基对的概率取决于它前面碱基对的状态 向另一种状态的转换概率取决于转换信号的出现(剪切位点)和/或 在特定隐藏状态的碱基对平均数量(即内含子或外显子大小).IntronsExonP=0.5P=0.8基因组序列基因组序列ATGCGTGCAGTCACCAGCAGTCAG
8、TCG用于基因用于基因预测的的隐马尔可夫模型可夫模型生物信息学的内容生物信息学的内容n研究主要集中在核苷酸序列的存储、分类、检索和分析等方面n新基因的发现n非蛋白编码区生物学意义的分析n基因组整体功能及其调节网络的系统把握n基因组演化与物种演化基因基因组分析分析生物信息学的内容生物信息学的内容n蛋白质结构蛋白质结构n新蛋白的完整、精确和动态新蛋白的完整、精确和动态的三维结构的三维结构n计算机辅助结构模拟计算机辅助结构模拟n理解蛋白质的氨基酸序列理解蛋白质的氨基酸序列和三维结构之间的关系和三维结构之间的关系n蛋白质序列及特性分析蛋白质序列及特性分析n蛋白质组学蛋白质组学2.2.蛋白蛋白质与蛋白与
9、蛋白质组分析分析生物信息学的内容生物信息学的内容 相当数量的蛋白质、核酸、多糖的三维结构获得精确测定,基于生物大分子结构知识的药物设计成为热点;根据靶标分子与药物分子相结合的活性部位的几何形状和化学特征,设计出与其相匹配的具有新颖结构的药物分子。33新新药设计三、生物信息学的研究方法和技术 n数学统计方法n在分析DNA语言中的语义、分析密码子使用频率、利用马尔可夫模型进行基因识别n动态规划(Dynamic Programming)方法n一种通用的优化方法:在状态空间中,根据目标函数,通过递推,求出一条从状态起点到状态终点的最优路径(代价最小的路径)。nDNA序列或者蛋白质序列的两两对比排列n模
10、式识别技术n两种方法n根据统计特征进行识别n根据对象的结构特征进行识别,常用句法识别。nDNA序列上功能位点和特征信号的识别n数据库技术n生物分子信息的存储、管理、查询等功能建立在数据库管理系统之上n人工神经网络技术n在功能上、结构上模拟大脑神经网络n神经网络计算速度快,更具有分析智能n应用:神经网络计算在优化和模式识别方面具有非常强的能力n基因识别、蛋白质结构预测上神经网络都取得了比其它方法更为准确的结果n分子模型化技术n利用计算机分析分子结构。通过交互操作平移、旋转和缩放分子的三维结构,从不同的角度观察分子构象和形状n分子力学和量子力学计算n主要基于半经验势函数的分子力学方法研究生物大分子
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 简介
限制150内