生物信息学专题培训市公开课一等奖百校联赛特等奖课件.pptx
《生物信息学专题培训市公开课一等奖百校联赛特等奖课件.pptx》由会员分享,可在线阅读,更多相关《生物信息学专题培训市公开课一等奖百校联赛特等奖课件.pptx(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物信息学生物信息学生物信息学主讲教师:主讲教师:刘刘吉吉平平E-MAIL:L艺术设计学院蚕桑分子生物学研究艺术设计学院蚕桑分子生物学研究室室亚太地域蚕桑培训中心亚太地域蚕桑培训中心年年2月月第1页生物信息学一、概述一、概述二十一世纪是生命科学时代,也是信息时代二十一世纪是生命科学时代,也是信息时代 近近年年来来,伴伴随随当当代代分分子子生生物物学学发发展展,尤尤其其是是人人类类基基组组计计划划实实施施,不不停停产产生生出出巨巨量量分分子子生生物物学学数数据据,这这些些数数据据有有着着数数量量巨巨大大、关关系系复复杂杂,以以至至于于不不利利用用计计算算机机根根本本无无法法实实现现数数据据存存放
2、放和和分分析析。这这么么,生生物物信信息息学学最最终终形形成成一一门门独独立立学学科科并被推上了生物科学发展最前沿。并被推上了生物科学发展最前沿。第2页生物信息学Bioinformatics:科技界一颗刺眼新星 在在BIOINFORMATICS没没有有诞诞生生之之前前,一一个个新新药药问问世世需需要要十十年年时时间间,数数亿亿美美元元R&D,而而BIOINFORMATICS已已将将这这个个过过程程降降低低三三分分之之二二,R&D费费用用也也对对应应大大大大降降低低。许许多多中中小小BIOTECH企企业业也也看看到到了了BIOINFORMATICS巨巨大大作作用用和和潜潜在在商商机机,纷纷纷纷投
3、投资资BIOINFORMATICS研究项目。研究项目。第3页生物信息学美国电脑执照美国电脑执照-高薪阶层高薪阶层“BIOINFORMATICS CERTIFICATION”,这这是是当当前前最最新新一一门门生生物物化化学学工工程程与与电电脑脑技技术术相相结结合合课程。课程。VisualBasic-$1195VisualC+-$1295BioInformatics-$2500MIT(MassachusettesInstituteofTechnology)(美美国国)麻麻省省理理工工学学院院:Course:20.01s Date:June24-28,Tuition:$2,500第4页生物信息学第第
4、二二讲讲生生物物信信息息学学现现实实状状况况和和研研究方向究方向刘吉平刘吉平第5页生物信息学主要内容主要内容1、背景、背景2、定义、定义3、现实状况、现实状况1)生物数据库发展)生物数据库发展2)人类基因组计划逐步完成)人类基因组计划逐步完成3)科研文件增加)科研文件增加4、研究目标、研究目标第6页生物信息学一一.什么是生物信息学?什么是生物信息学?Genomeinformaticsisascientificdisciplinethatencompassesallaspectsofgenomeinformationacquisition,processing,storage,distribut
5、ion,analysis,andinterpretation.它它是是一一个个学学科科领领域域,包包含含着着基基因因组组信信息息获获取取、处处理理、存存放放、分分配配、分析和解释全部方面分析和解释全部方面。(TheU.S.HumanGenomeProject:TheFirstFiveYearsFY1991-1995,byNIHandDOE)从从美美国国三三个个国国家家计计划划说说起起:曼曼哈哈顿顿计计划划;阿阿婆婆罗罗计计划划;人人类基因组计划。类基因组计划。破破译译人人类类遗遗传传密密码码就就要要读读懂懂由由30亿亿符符号号组组成成100万万页页“天书天书”第7页生物信息学生物信息学发展历程
6、生物信息学发展历程生物信息学自诞生以来,经历了三个阶段:生物信息学自诞生以来,经历了三个阶段:基基因因组组前前期期生生物物信信息息学学:主主要要是是序序列列分分析析、数数据库查询、计算机操作和据库查询、计算机操作和PC应用;应用;基基因因组组年年代代生生物物信信息息学学:主主要要是是基基因因寻寻找找、数数据据 与与 数数 据据 之之 间间 比比 较较、网网 络络 相相 互互 界界 面面(Interface););后后基基因因组组年年代代生生物物信信息息学学:主主要要是是数数据据挖挖掘掘、表表示示、数数据据多多样样性性分分析析、相相互互交交叉叉数数据据分分布布总总结结与与分分析析。其其研研究究内
7、内容容不不但但包包含含基基因因查查寻寻和和同同源源性性分分析析;而而且且深深入入到到基基因因和和基基因因组组功功效效分分析析,即所谓功效基因组学研究。即所谓功效基因组学研究。第8页生物信息学二、生物信息学及其发展二、生物信息学及其发展生生物物信信息息学学(Bioinformatics)-采采取取信信息息科科学学、计计算算机机科科学学、生生物物数数学学、比比较较生生物物学学等等学学科科观观点点和和方方法法对对生生命命现现象象及及其其组组成成份份子子(核核酸酸、蛋蛋白白等等)进进行行研研究究。主主要要硕硕士士命命中中物物质质组组成成、进进化化、结结构构与与功功效效规规律律、以以及及这这些些物物质质
8、在在生生命命体体中中能能量量和和信信息息交交换换或或传传递递。该该学学科科以以计计算算机机和和生生物物电电子子设设备备为为工工具具,对对生生物物信信息息进进行行提提取取、储储存存、加加工工和和分分析析,用用信信息息理理论论技技术术及及生生物物数数学学方方法法去去了了解解和和阐阐述述生生物物大大分分子子存存在在和和生生命命价价值值,最最终终对对它它们们进进行行各各种种处处理理与与应应用用。经经过过这这些些处处理理和和应应用用,科科学学家家不不但但能能了了解解已已经经有有核核酸酸和和蛋蛋白白质质序序列列及及其其功功效效,而且能更加好地着手研究新基因和蛋白序列及其功效。而且能更加好地着手研究新基因和
9、蛋白序列及其功效。第9页生物信息学计算机运算速度计算机运算速度:18个月增加一倍个月增加一倍;DNA序列数据序列数据:14个月增加一倍个月增加一倍;第10页生物信息学近近年年来来GenBank中中DNA碱碱基基数数目目呈呈指指数数增增加加,大大约约每每14个个月月增增加加一一倍倍。到到1999年年12月月其其数数目目已已达达30亿亿,它它们们来来自自47000种种生生物物。年年4月月DNA碱碱基基数数目目是是60亿亿。现现在在,20初初 这这 一一 数数 目目 已已 达达 110亿亿。各各种种生生物物EST序序列列已已达达600多多万万条条,其其中中人人类类EST序序列列已已超超出出300万万
10、条条,预预计计覆覆盖盖人人类类基基因因90以以上上;自自 全全 长长 1.8Mb嗜嗜 血血 流流 感感 杆杆 菌菌(HaemophilusinfluenzaeRd)基基 因因 组组 序序 列列 于于 1995年年 发发 表表(Fleischmannetal.,1995)以以来来,已已经经有有54个个模模式式生生物物完完整整基基因因组组被被测测序序完完成成,它它们们中中有有9个个古古细细菌菌、31个个原原核核真真细细菌菌、14个个真真核核生生物物完完整整基基因因组组或或它它们们完完整整染染色色体体,其其中中包包含含酿酿酒酒酵酵母母和和线线虫虫。还还有有另另外外70余余个个微微生生物物基基因因组组
11、正正在在测测试当中。试当中。第11页生物信息学美美国国核核酸酸数数据据库库GenBank从从1979年年开开始始建建设设,1982年正式运行;年正式运行;欧欧洲洲分分子子生生物物学学试试验验室室EMBL数数据据库库也也于于1982年年开始服务;开始服务;日日本本于于1984年年开开始始建建立立国国家家级级核核酸酸数数据据库库DDBJ,并并于于1987年年正正式式服服务务。从从那那个个时时候候以以来来,DNA序序列列数数据据已已经经从从80年年代代早早期期百百把把条条序序列列,几几十十万万碱碱基基上上升升至至现现在在110亿亿碱碱基基!这这就就是是说说,在在短短短短约约间,数据量增加了近十万倍。
12、间,数据量增加了近十万倍。第12页生物信息学 DbcatDbcat统计生物信息数据库数目统计生物信息数据库数目分类分类 数据库数目数据库数目分类分类 数据库数目数据库数目DNADNA 87 87RNARNA 30 30蛋白质蛋白质 94 94基因组基因组 58 58基因图谱基因图谱3030蛋白质结构蛋白质结构 18 18文件文件4343其它其它 153第13页生物信息学果果蝇蝇基基因因组组包包含含1.2亿亿碱碱基基正正确确编编码码区区已于年已于年2月测序并组装完成;月测序并组装完成;人人类类基基因因组组研研究究标标志志性性工工作作,包包含含3300万万碱碱基基正正确确人人第第22号号染染色色体
13、体已已于于1999年年11月月完完成成测测序序,结结果果发发表表在在1999年年12月月2日日Nature上上。从从第第22号号染染色色体体已已判判定定出出679个个基基因因,其其中中55基基因因是是未未知知。有有35种种疾疾病病与与该该染染色色体体突突变变相相关关,像像免免疫疫系系统统疾疾病病、先先天天性性心心脏病和精神分裂症。脏病和精神分裂症。作作为为人人类类基基因因组组研研究究里里程程碑碑性性工工作作,覆覆盖盖率率为为90人人完完整整基基因因组组“工工作作草草图图”已已经经在在年年4月月底底完完成成,到到20将将取取得得覆覆盖盖率率为为99人人类类基基因因组组全全部部序序列列。对人大约对
14、人大约3万个基因。万个基因。到到当当前前为为止止已已定定位位在在染染色色体体上上基基因因数数目目有有14015个个(见见http:/www.ncbi.nlm.nih.gov)第14页生物信息学Howmanycharactersareinthe“HeavenBook”?3*10910,000books1book100pages1page3,000characters CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACA
15、GACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGAGGGAATGG
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 专题 培训 公开 一等奖 联赛 特等奖 课件
限制150内