生物信息学B复习要点(共6页).doc
《生物信息学B复习要点(共6页).doc》由会员分享,可在线阅读,更多相关《生物信息学B复习要点(共6页).doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上知识点:1.生物信息学:生物信息学是一门(交叉)学科,它包含了生物信息的获取、处理、存储、分发、分析和解释在内的所有方面。他综合的应用(数学)、(计算机科学)和(生物学)的各种工具,来阐明和理解大量数据中包含的生物学意义。2. 人类基因组计划 :(human genome project,HGP)是一个国际合作项目,由美国/德国/法国/英国/日本和中国科学家共同参与。其旨在测定组成人类(指)中所包含的30亿个序列的组成,从而绘制图谱,辨识并呈现其上的所有及其序列,进而破译人类遗传信息。人类基因组计划是人类为了解自身的奥秘所迈出的重要一步,是继和之后,人类科学史上的又一
2、个伟大工程。 3. 一级数据库数据库: 直接来源于实验获得的原始数据,只经过简单的归类整理和注释。包括:基因组数据库,序列数据库(核酸和蛋白质)以及结构数据库。 4. 二级数据库:在一级数据库、实验数据和理论分析的基础上针对特定目标衍生而来,是对生物学知识和信息的进一步的整理。5公共序列数据库 :1988 年3个数据库达成协议,组成合作联合体。它们每天交换信息,并对数据库 DNA 序列记录的统一标准达成一致。每个机构负责收集来自不同地理分布的数据 (EMBL 负责欧洲, GenBank 负责美洲, DDBJ负责亚洲等) ,将所有信息汇总在一起,共同享有并向世界开放,故这 3 个数据库又被称为公
3、共序列数据库。6主要核酸序列数据库: GenBank、EMBL、 DDBJ 7主要蛋白质序列数据库:Swissprot, PIR8. 蛋白质结构分类数据库包括:SCOP和CATH。9.FASTA格式,又称Pearson 格式。特点:最常用、最简单的序列注释格式 命名规则:(理解即可)1、以大于号“起始 2、 标题行( a single-line description) 位于文件的第一行,(中英均可) 3、 序列行随后,序列行中不允许有空间,每行文字不超 过80个字符4、组成序列信息字符串的符号应为IUB/IUPAC(International Union Of Pure And Applie
4、d Chemistry)核苷酸或氨基酸的符号 5、核苷酸字符大小写均可,氨基酸字符应大写6、-单个连字符表示一个空位 “gap”7、序列中不允许有数字、不明确的核苷酸用N表示,氨基酸用X表示 8、 氨基酸序列中“*”表示终止 9、常保存为.txt文档10. GBFF序列格式:是GenBank 数据库的基本信息单位,是最为广泛的生物信息学序列格式之一。该文件格式按域划分为3个部分:第一部分包含整个记录的信息(描述符);第二部分包含特征表,包含了注释这一记录的特性;第三部分是核苷酸序列本身,以“/”结尾。11. 信息检索(informal retrieval):是将无序的数据有序化,形成信息集合,
5、并根据需要从信息集合中提取特定信息的过程。12. Entrez检索系统:是NCBI开发的核心检索系统,集成了NCBI的各种数据库,具有链接的数据库多,使用方便,能够进行交叉索引等特点。13.PUBMUD: 是一个免费的生物医学文摘数据库,提供部分论文的摘要及指向全文的链接.14. 同源性(homology):指从一些数据中推断出的两个基因或蛋白质序列具而共同祖先的结论,属于质的判断。就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80都是不科学的。15. 相似性(similarity):是指一种很直接的数量关系,比如部分相同或相似的百分比或其它一些合适的度量。
6、比如说,A序列和B序列的相似性是80,或者4/5。这是个量化的关系。当然可进行自身局部比较。16.BLAST:“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。17.E值:是随机产生一个比所得分值高的对位排列的概率,即分值可靠性的测度。 E值越(小), 所命中序列越可靠,越能反映序列之间真实的生物学意义。 18.低复杂度序列:指序列中包含的重复度高的区域,如poly(A)。BLAST搜索首先将低复杂度序列过滤,然后再进行搜索。19.主要的BLAS
7、T程序: 基因组BLAST, 基本BLAST,特殊类型数据库的BLAST.20.基本BALST:21. GenBank中序列提交的工具为: 、。其中 为在线提交工具,为本地机生成要提交的序列,以邮件的形式发送至GenBank。22. 生物进化又称有机体进化(organism evolution):指生物从共同祖先由低级到高级,由简单到复杂逐步分化演变的过程。23. 现代生物进化理论的主要思想: 生物进化的单位是种群; 生物进化过程的三个环节突变和基因重组产生进化的原材料; 2.自然选择决定生物进化方向;隔离导致物种的形成 生物进化实质:种群基因频率的改变.24.基因频率:在一个种群里,某一等位
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 信息学 复习 要点
限制150内