genbank数据库检索及其应用.ppt





《genbank数据库检索及其应用.ppt》由会员分享,可在线阅读,更多相关《genbank数据库检索及其应用.ppt(118页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、GenBank数据库检索及其应用数据库检索及其应用Entrez检索功能检索功能重庆医科大学图书馆重庆医科大学图书馆李李 轶轶简介简介 GenBank数据库是由美国国立生物技术信息数据库是由美国国立生物技术信息中心(中心(NCBI)维护的一级核酸序列数据库。)维护的一级核酸序列数据库。GenBank数据库的数据来源有三种:数据库的数据来源有三种:1、直接来源于测序工作者提交的序列;、直接来源于测序工作者提交的序列;2、与其它数据机构协作交换的数据;、与其它数据机构协作交换的数据;3、美国专利局提供的专利数据。、美国专利局提供的专利数据。NCBI网站网址:网站网址:http:/GenBank和和P
2、ubMed(序列数据序列数据)检索的比较检索的比较:1 1、GenBank的检索结果是序列及其注释信息;的检索结果是序列及其注释信息;PubMed的检索结果是与序列数据相关的文献信息。的检索结果是与序列数据相关的文献信息。2、GenBank数据更新早于数据更新早于PubMed,GenBank数据库的数据库的检全率高于检全率高于PubMed。3、GenBank可对序列数据进行限制检索,而可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于数据库的检准率也高于PubMed。检索界面检索界面简介
3、简介基本检索输入框基本检索界面:基本检索界面:执行检索按钮基本检索输入框基本检索界面:基本检索界面:rasGENE点击进入跨库检索跨库检索界面:跨库检索界面:rasGENE执行检索按钮跨库检索界面:跨库检索界面:点击进入GenBank数据库GenBank数据库界面:数据库界面:GenBank数据库界面:数据库界面:点击进入核苷酸序列数据库检索界面GenBank数据库界面:数据库界面:特征栏提供辅助检索功能核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑
4、运算(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索(二)特殊标志符检索(五)范围检索(五)范围检索(三)序列长度检索(三)序列长度检索(四)分子重量检索(四)分子重量检索简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算(一)名称、作者姓名、截词检索、布尔逻辑运算检索限定词:检索限定词:1、基因名称的检索限定词:、基因名称的检索限定词:GENE2、生物体名称的检索限定词:、生物体名称的检索限定词:ORGN3、作者姓名的检索限定词:、作者姓名的检索限定词:AUTH简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词
5、检索、布尔逻辑运算(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索(二)特殊标志符检索特殊标志符的格式特殊标志符的格式(核酸序列)(核酸序列):l2、GenBank/EMBL/DDBJ序列接受号:序列接受号:l (1)1个字母个字母+5个阿拉伯数字个阿拉伯数字l e.g.:U12345l (2)2个字母个字母+6个阿拉伯数字个阿拉伯数字l e.g.:AY123456,Af123456l1、序列辨认号(、序列辨认号(GI):):一串阿拉伯数字一串阿拉伯数字l e.g.:6995995(1 1)mRNA mRNA 记录(记录(NM_*NM_*):e.g.:NM_000492e.g.
6、:NM_000492(2 2)基因组)基因组DNADNA重叠群(重叠群(NT_*NT_*):e.g.:NT_000347e.g.:NT_000347(3 3)完整的基因组或染色体()完整的基因组或染色体(NC_*NC_*):e.g.:NC_000907e.g.:NC_000907(4 4)基因组的局部区域()基因组的局部区域(NG_*NG_*):e.g.:NG_000019e.g.:NG_000019(5 5)从人类基因组序列注释、加工得到的序列模型记录()从人类基因组序列注释、加工得到的序列模型记录(XMXM,XPXP,or XR_*or XR_*):):e.g.:XM_000483e.g.
7、:XM_000483特殊标志符的格式特殊标志符的格式(核酸序列):(核酸序列):3 3、RefSeqRefSeq(Reference SequenceReference Sequence)序列接受号序列接受号:特殊标志符的格式特殊标志符的格式(核酸序列):(核酸序列):4、PDB序列接受号:个阿拉伯数字个字母序列接受号:个阿拉伯数字个字母 e.g.:TUP序列接受号的检索限定词为序列接受号的检索限定词为 ACCNorACCESSIONAF123456ACCN简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算(一)名称、作者姓名、截词检索、布尔逻辑运算(
8、二)特殊标志符检索(二)特殊标志符检索(三)序列长度检索(三)序列长度检索1510SLEN序列长度的检索限定词:序列长度的检索限定词:SLEN简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算(一)名称、作者姓名、截词检索、布尔逻辑运算(二)特殊标志符检索(二)特殊标志符检索(三)序列长度检索(三)序列长度检索(四)分子重量检索(四)分子重量检索2009MOLWT分子重量的检索限定词:分子重量的检索限定词:MOLWT简介简介检索界面检索界面基本检索功能基本检索功能(一)名称、作者姓名、截词检索、布尔逻辑运算(一)名称、作者姓名、截词检索、布尔逻辑运算(
9、二)特殊标志符检索(二)特殊标志符检索(五)范围检索(五)范围检索(三)序列长度检索(三)序列长度检索(四)分子重量检索(四)分子重量检索范围检索:范围检索:中间用冒号连接中间用冒号连接中间用冒号连接中间用冒号连接l1、序列接受号范围检索:、序列接受号范围检索:l AF114696:AF114714ACCNl2、序列长度范围检索:、序列长度范围检索:l 3000:4000SLENl3、分子重量范围检索:、分子重量范围检索:l 2002:2009MOLWTl4、日期范围检索:、日期范围检索:l 2005/01:2006/09/26MDATorPDAT简介简介检索界面检索界面基本检索功能基本检索功
10、能特征栏辅助检索特征栏辅助检索限制检索(限制检索(Limits)预检索预检索/索引检索(索引检索(Preview/Index)检索史管理(检索史管理(History)剪贴板管理(剪贴板管理(Clipboard)详细匹配过程(详细匹配过程(Details)限制检索限制检索预检索预检索/索引检索索引检索检索史管理检索史管理剪贴板管理剪贴板管理详细匹配过程详细匹配过程简介简介检索界面检索界面基本检索功能基本检索功能特征栏辅助检索特征栏辅助检索限制检索(限制检索(Limits)限制检索界面:限制检索界面:限制检索界面:限制检索界面:核苷酸序列数据库分为三个子数据库:核苷酸序列数据库分为三个子数据库:l
11、EST:表达序列标记数表达序列标记数据库据库lGSS:基因组测序序列基因组测序序列数据库数据库lCoreNucleotide:包含所包含所有未被以上两个子数据有未被以上两个子数据库收录的核苷酸序列库收录的核苷酸序列核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:核苷酸序列数据库检索界面:限制检索界面:限制检索界面:限制检索界面:限制检索界面:检索结果显示界面:检索结果显示界面:限制检索范围限制检索(限制检索(Limits):):限制检索范围ras排除某种类型的序列限制分子类型限制分子类型 限制基因位点 限制基因位点限制序列片段的显示限制序列片段的显示限制数据来源限
12、制数据来源限制数据修订日期限制数据修订日期简介简介检索入口检索入口基本检索功能基本检索功能特征栏辅助检索特征栏辅助检索限制检索(限制检索(Limits)预检索预检索/索引检索(索引检索(Preview/Index)预检索预检索/索引检索界面:索引检索界面:hepatitis b索引检索输入框索引检索按钮索引检索按钮序列特性关键词索引rasGENE序列特性关键词索引简介简介检索界面检索界面基本检索功能基本检索功能特征栏辅助检索特征栏辅助检索限制检索(限制检索(Limits)预检索预检索/索引检索(索引检索(Preview/Index)检索史管理(检索史管理(History)剪贴板管理(剪贴板管理
13、(Clipboard)详细匹配过程(详细匹配过程(Details)penicillin-bindingmycobacterium tuberculosis#8 AND#4penicillin-binding AND mycobacterium tuberculosisORGN简介简介检索入口检索入口基本检索功能基本检索功能特征栏辅助检索特征栏辅助检索检索结果的显示检索结果的显示检索结果显示界面:检索结果显示界面:选择检索结果的显示格式选择检索结果的显示格式选择检索结果的显示格式摘要格式:摘要格式:联接Genbank 格式:格式:Genbank 格式:格式:Genbank 格式:格式:Genba
14、nk 格式:格式:Genbank 格式:格式:Genbank 格式:格式:Genbank 格式:格式:Genbank 格式:格式:GenBankGenBank记录中特性表中的主要关键词记录中特性表中的主要关键词记录中特性表中的主要关键词记录中特性表中的主要关键词:关键词关键词解解 释释关键词关键词解解 释释misc_feature生物学特性无法用特性表生物学特性无法用特性表关键词描述的序列关键词描述的序列promoter转录起始区转录起始区misc_difference序列特性无法用特性表关序列特性无法用特性表关键词描述的序列键词描述的序列CAAT_signal真核启动子上游的真核启动子上游的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- genbank 数据库 检索 及其 应用

限制150内