生物信息学概论A-课件.ppt
《生物信息学概论A-课件.ppt》由会员分享,可在线阅读,更多相关《生物信息学概论A-课件.ppt(67页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物信息学生物信息学Bioinformatics4/15/20231理论课讲授内容理论课讲授内容第一讲第一讲 生物信息学概论生物信息学概论第二讲第二讲 医学信息学基础医学信息学基础第三讲第三讲 信息学基本技术信息学基本技术第四讲第四讲 生物信息学中的分子生物学基础生物信息学中的分子生物学基础第五讲第五讲 生物信息检索工具生物信息检索工具第六讲第六讲 生物信息浏览工具生物信息浏览工具4/15/20232第七讲第七讲 生物信息中心生物信息中心第八讲第八讲 生物信息重要数据库生物信息重要数据库第九讲第九讲 生物医学文献生物医学文献第十讲第十讲 生物信息与药学生物信息与药学第十一讲第十一讲 生物信息与
2、生物信息与PCR第十二讲第十二讲 生物信息学与基因芯片生物信息学与基因芯片4/15/20233生物生物信息信息学概论学概论4/15/20234三大自然科学之谜三大自然科学之谜宇宙的起源宇宙的起源生命的诞生生命的诞生思维的奥秘思维的奥秘4/15/202364/15/20237Whatisbioinformatics?fromBioinformaticsandcomputational biologyinvolvetheuseoftechniquesincludingappliedmathematics,informatics,statistics,computerscience,artifici
3、alintelligence,chemistry,andbiochemistrytosolvebiologicalproblemsusuallyonthemolecularlevel.Researchincomputationalbiologyoftenoverlapswithsystemsbiology.Majorresearcheffortsinthefieldincludesequencealignment,genefinding,genomeassembly,proteinstructurealignment,proteinstructureprediction,predictiono
4、fgeneexpressionandprotein-proteininteractions,andthemodelingofevolution.4/15/20238 生物学数据的收集、存储、管理与提供生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析基因组序列信息的提取和分析 功能基因组相关信息分析功能基因组相关信息分析 生物大分子结构模拟和药物设计生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究生物信息分析的技术与方法研究 应用与发展研究应用与发展研究生物信息学的主要研究内容生物信息学的主要研究内容4/15/202310生物学家生物学家(生物学问题生物学问题)数学物理学
5、家数学物理学家计算机科学家计算机科学家(基础理论问题基础理论问题)工程师工程师(技术应用)(技术应用)计算生物学计算生物学/生物信息学:生物信息学:三种科学文化的融合三种科学文化的融合4/15/202311生命信息系统生命信息系统生物所处的时空系统生物所处的时空系统 物质系统,信息传递与控制,能量物质系统,信息传递与控制,能量4/15/202313广义概念图示4/15/202315狭义概念图示狭义概念图示4/15/202316生物学基础速递生物学基础速递分子水平分子水平细胞细胞个体生命个体生命生命之树生命之树4/15/202318生命的分子基础生命的分子基础细胞细胞/分子水平分子水平DNA/R
6、NA蛋白质蛋白质糖糖脂类脂类 4/15/202319DNA结构和碱基互补原理结构和碱基互补原理4/15/202320中心法则中心法则4/15/202321中心法则的发展中心法则的发展遗传信息遗传信息DNA、RNA核苷酸序列核苷酸序列氨基酸氨基酸病毒病毒/肽肽表观遗传学表观遗传学4/15/202322曼哈顿原子弹计划曼哈顿原子弹计划阿波罗登月计划阿波罗登月计划人类基因组计划人类基因组计划4/15/20232460年代初,美国总统年代初,美国总统Kennedy提出两个科学计划:提出两个科学计划:登月计划登月计划攻克肿瘤计划攻克肿瘤计划 人类遗传信息的复杂性人类遗传信息的复杂性人类基因组计划人类基因
7、组计划(HGP,Human Genome Project)目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘目标:整体上破解人类遗传信息的奥秘为什么提出为什么提出为什么提出为什么提出HGPHGP?4/15/202325 DNA:遗传物质遗传物质(遗传信息的载体遗传信息的载体)双螺旋结构双螺旋结构 A,C,G,T四种基本字符的复杂文本四种基本字符的复杂文本 基因基因(Gene):具有遗传效应的具有遗传效应的DNA分子片段分子片段DNADNA、基因、基因组、基因、基因组、基因、基因组、基因、基因组4/15/202326尽管比之于人类登月,尽管比之
8、于人类登月,HGP的投入资金的投入资金要少得多,但要少得多,但HGP对人类生活的影响要对人类生活的影响要更为深远更为深远。因为随着这个计划的完成,。因为随着这个计划的完成,DNA分子中编码的分子中编码的遗传信息将对人类存遗传信息将对人类存在的化学基础作出最终的回答在的化学基础作出最终的回答。这将不。这将不仅帮助我们理解我们是如何作为健康的仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危早老痴呆症、精神分裂症等一些严重危害人类健康的疾病中
9、的作用。毕竟害人类健康的疾病中的作用。毕竟对人对人类自身更深入的了解是人类活动中最重类自身更深入的了解是人类活动中最重要的一个部分。要的一个部分。Watson,1990,Science4/15/202328HGP的历史回顾的历史回顾1984.12 犹他州阿尔塔组织会议,初步研讨测定人类整个基犹他州阿尔塔组织会议,初步研讨测定人类整个基 因组因组DNA序列的意义序列的意义1985 Dulbecco在在Science撰文撰文“肿瘤研究的转折点肿瘤研究的转折点:人人 类基因组的测序类基因组的测序”美国能源部美国能源部(DOE)提出提出“人类基因组计划人类基因组计划”草案草案1987 美国能源部和国家
10、卫生研究院(美国能源部和国家卫生研究院(NIH)联合为)联合为“人类人类 基因组计划基因组计划”下拨启动经费约下拨启动经费约550万美元万美元1989 美国成立美国成立“国家人类基因组研究中心国家人类基因组研究中心”,Watson担担任任 第一任主任第一任主任1990.10 经美国国会批准,人类基因组计划正式启动经美国国会批准,人类基因组计划正式启动4/15/2023291997 大肠杆菌大肠杆菌(E.coli)全基因组测序完成全基因组测序完成1998 完成人类基因组计划的物理作图完成人类基因组计划的物理作图 开始人类基因组的大规模测序开始人类基因组的大规模测序 Celera公司加入,与公共领
11、域竞争公司加入,与公共领域竞争 启动水稻基因组计划启动水稻基因组计划1999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组大肠杆菌及其全基因组水稻基因组计划水稻基因组计划4/15/2023311999.7 第第5届国际公共领域人类基因组测序会议,加快测序速度届国际公共领域人类基因组测序会议,加快测序速度2000 Celera公司宣布完成果蝇基因组测序公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组国际公共领域宣布完成第一个植物基因组拟南芥全基拟南芥全基 因组的测序工作因组的测序工作Drosophila
12、 melanogaster果蝇果蝇Arabidopsis thaliana拟南芥拟南芥4/15/2023322001年年2月月15日日Nature封面封面2001年年2月月16日日Science封面封面2000.6.26 公共领域和公共领域和Celera公司同时宣布完成人类基因组工作草图公司同时宣布完成人类基因组工作草图2001.2.15 Nature刊文发表国际公共领域结果刊文发表国际公共领域结果2001.2.16 Science刊文发表刊文发表Celera公司及其合作者结果公司及其合作者结果4/15/202333我国对人类基因组计划的贡献我国对人类基因组计划的贡献4/15/202334HG
13、PHGP带来的科学挑战带来的科学挑战带来的科学挑战带来的科学挑战随着实验数据和可利用信息急剧增加,信息的管理和随着实验数据和可利用信息急剧增加,信息的管理和分析成为分析成为HGP的一项重要的工作的一项重要的工作 发现生物学发现生物学规律规律解读生物解读生物遗传密码遗传密码认识生命的本质认识生命的本质研究基因组数据研究基因组数据之间的关系之间的关系分析现有的分析现有的基因组数据基因组数据利用数学模型利用数学模型和计算技术和计算技术4/15/202335 各学科参与、协作:生命科学、数学、物理学、化学、计算机各学科参与、协作:生命科学、数学、物理学、化学、计算机 科学、材料科学以及伦理、法律等社会
14、科学科学、材料科学以及伦理、法律等社会科学 首要科学问题首要科学问题 如何找到记载在基因组如何找到记载在基因组DNA一维结构上控制生命时间、空间一维结构上控制生命时间、空间 的调控信息的编码方式和调节规律。的调控信息的编码方式和调节规律。应用数学、复杂系统理论、信息论、非线性科学应用数学、复杂系统理论、信息论、非线性科学 催生催生生物信息学生物信息学、计算生物学计算生物学 芯片技术芯片技术 交叉性技术领域:物理学、微电子信息技术、生化技术、信交叉性技术领域:物理学、微电子信息技术、生化技术、信 息技术、自动化、材料科学息技术、自动化、材料科学 结构生物学结构生物学 前沿领域之一:生物物理学、生
15、物化学、晶体学、波谱学、前沿领域之一:生物物理学、生物化学、晶体学、波谱学、光谱学以及光谱学以及X射线晶体衍射技术、核磁共振技术射线晶体衍射技术、核磁共振技术4/15/202336系统生物学系统生物学(Systems Biology):由分析为主走向分析与综合并举的系统方法由分析为主走向分析与综合并举的系统方法 微观微观还原论还原论 整体整体系统论系统论统一生物学统一生物学(General Biology):探索生命活动本质,产生统一的生命观和统一的生物学探索生命活动本质,产生统一的生命观和统一的生物学实验、理论、计算生物学实验、理论、计算生物学:(Experimental,Theoretic
16、al,Computational Biology)生命科学与数、理、化、计算机等学科的大综合、大交叉生命科学与数、理、化、计算机等学科的大综合、大交叉生物技术的产业化生物技术的产业化(Biotechnology):基础研究转化为生产力基础研究转化为生产力 生物工程技术生物工程技术农、林、医药农、林、医药现代生命科学发展趋势现代生命科学发展趋势4/15/202337生物大分子的结构与功能研究生物大分子的结构与功能研究基因组与细胞的研究基因组与细胞的研究基因组比较研究基因组比较研究关于遗传、发育、分化、进化的综合理论研究关于遗传、发育、分化、进化的综合理论研究脑科学和神经科学研究脑科学和神经科学研
17、究行为科学研究行为科学研究生态学研究生态学研究人体功能研究人体功能研究研究手段:研究手段:实验、理论、计算相结合实验、理论、计算相结合现代生命科学发展热点现代生命科学发展热点4/15/202338基因组基因组数据库数据库 蛋白质蛋白质序列序列数据库数据库 蛋白质蛋白质结构结构数据库数据库 DDBJEMBLGenBankSWISS-PROT PDBPIR生物分子数据的收集与管理4/15/202339数据库搜索及序列比较数据库搜索及序列比较 搜索同源序列在一定程度上就是通过序列比较寻找相搜索同源序列在一定程度上就是通过序列比较寻找相似序列似序列 序列比较序列比较的一个基本操作就是的一个基本操作就是
18、比对比对(Alignment),即将),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种两个序列共有的排列顺序,这是序列相似程度的一种定性描述定性描述多重序列比对多重序列比对研究的是多个序列的共性。序列的多重研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。究一组蛋白质之间的进化关系。4/15/202340基
19、因组序列分析基因组序列分析 遗传语言分析遗传语言分析天书天书 基因组结构分析基因组结构分析基因识别基因识别基因功能注释基因功能注释基因调控信息分析基因调控信息分析基因组比较基因组比较4/15/202341基因表达数据的分析与处理基因表达数据的分析与处理基因表达数据分析基因表达数据分析是目前生物信息学研究的热是目前生物信息学研究的热 点和重点点和重点 目前对基因表达数据的处理主要是进行目前对基因表达数据的处理主要是进行聚类分聚类分 析析,将表达模式相似的基因聚为一类,在此基将表达模式相似的基因聚为一类,在此基 础上寻找相关基因,分析基因的功能础上寻找相关基因,分析基因的功能 所用方法所用方法主要
20、有:相关分析方法、模式识别技主要有:相关分析方法、模式识别技术中的层次式聚类方法、人工智能中的自组织术中的层次式聚类方法、人工智能中的自组织映射神经网络、主元分析方法映射神经网络、主元分析方法 等等表达数据表达数据缺点缺点:仅反映仅反映mRNA丰度,噪声,丰度,噪声,4/15/202342蛋白质结构预测蛋白质结构预测 蛋白质的生物蛋白质的生物功能功能由蛋白质的由蛋白质的结构结构所决定,蛋所决定,蛋白质结构预测成为了解蛋白质功能的重要途径白质结构预测成为了解蛋白质功能的重要途径蛋白质结构预测分为蛋白质结构预测分为:二级结构预测二级结构预测空间结构预测空间结构预测 蛋白质折叠蛋白质折叠4/15/2
21、02343二级结构预测二级结构预测在一定程度上二级结构的预测可以归结为模式识别问题在一定程度上二级结构的预测可以归结为模式识别问题 在二级结构预测方面主要方法有:在二级结构预测方面主要方法有:立体化学方法立体化学方法图论方法图论方法统计方法统计方法最邻近决策方法最邻近决策方法基于规则的专家系统方法基于规则的专家系统方法分子动力学方法分子动力学方法人工神经网络方法人工神经网络方法 预测准确率超过预测准确率超过70%的第一个软件是基于神经网络的的第一个软件是基于神经网络的PHD系统系统4/15/202344空间结构预测空间结构预测在空间结构预测方面,比较成功的理论方法是在空间结构预测方面,比较成功
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 概论 课件
限制150内