中国科技大学课件系列:《生物信息学》02教学文案.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《中国科技大学课件系列:《生物信息学》02教学文案.ppt》由会员分享,可在线阅读,更多相关《中国科技大学课件系列:《生物信息学》02教学文案.ppt(63页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、中国科技大学课件系列:生物信息学02中心法则DNA:Deoxyribonucleic acid,脱氧核糖核酸;,脱氧核糖核酸;RNA:RiboNucleic Acid,核糖核酸;,核糖核酸;双脱氧核糖核苷酸DideoxyribonucleotideDNA的结构RNA的结构氨基酸的结构氨基酸的性质及分类氨基酸周期表标准密码子本章内容提要r1.DNA测序测序r2.序列数据的存储序列数据的存储核酸序列数据库核酸序列数据库蛋白质序列数据库蛋白质序列数据库基因组数据库基因组数据库r3.序列数据的文件格式序列数据的文件格式1.DNA测序rDNA一次连续测序的长度约为一次连续测序的长度约为500bp;rES
2、T(Expressed sequence tag)测序:细胞测序:细胞中中mRNA反转录成反转录成cDNA,方向不定测序,方向不定测序;rGSS(Genome Survey Sequences,基因组,基因组勘测序列勘测序列):类似于:类似于ESTs,来源基因组,来源基因组;rHTG(High-throughput genome sequences,高通量基因组序列,高通量基因组序列):高通量、:高通量、尚未完工的尚未完工的DNA序列序列;DNA 测序的实验方法(末端终止法)CATddGTPddTTPddATP(D)使用寡核苷酸引物连续测序基因组测序:两种方案策略r1.基因图谱法:基因图谱法:
3、DNA片段在染色体上的位片段在染色体上的位置、方向已知。首先染色体被打断成置、方向已知。首先染色体被打断成150200kbp左右的大片段,然后克隆到左右的大片段,然后克隆到BACs(Bacterial Artificial Chromosome)中,再进一步随机打断,克隆,测序,依中,再进一步随机打断,克隆,测序,依靠计算机组装成长的序列靠计算机组装成长的序列(contig)。r2.“鸟鸟枪枪法法”(shotgun):DNA片片段段在在染染色色体体上上的的位位置置和和方方向向未未知知。全全基基因因组组随随机机打打断断成成小小片片段段,克克隆隆,双双向向测测序序,计计算算机机组装成长的序列。组装
4、成长的序列。人类基因组计划r 基因组图谱:遗传图谱,物理图谱基因组图谱:遗传图谱,物理图谱r 遗传图谱遗传图谱(genetic map):连锁图谱,显示:连锁图谱,显示所知的基因和所知的基因和/或遗传标记的相对距离位置与或遗传标记的相对距离位置与次序。次序。r物理图谱物理图谱(physical map):表示某些基因和表示某些基因和/或遗传标记之间在基因组上的精确位置和距或遗传标记之间在基因组上的精确位置和距离(如间隔的离(如间隔的bp数目)的图谱。数目)的图谱。大规模测序方法2.序列数据的存储r核酸序列数据库核酸序列数据库国际三大核酸序列数据库:国际三大核酸序列数据库:GenBank,EBM
5、L,DDBJRefSeq:The Reference Sequence DatabasedbEST:Expressed Sequences Tags数据库数据库UniGene等等r蛋白质序列数据库蛋白质序列数据库UniProtSwiss-prot&TrEMBL,PIRr基因组数据库基因组数据库:Ensembl核酸数据库数据的增长GenBankr由美国国立卫生研究院由美国国立卫生研究院NIH下属国立生物技下属国立生物技术信息中心术信息中心NCBI建立。建立。r汇集并注释了所有公开的核酸以及蛋白质序汇集并注释了所有公开的核酸以及蛋白质序列。每个记录代表了一个单独的、连续的、列。每个记录代表了一个单
6、独的、连续的、带有注释的带有注释的DNA或或RNA片段。片段。GenBank中测序最多的20个物种161.0版,2007EMBL核酸序列数据库rEMBL-EBI(European Bioinformatics Institute)维护维护;rhttp:/www.ebi.ac.uk/embl/rNIG(National Institute of Genetics)rCIB(Center for Information Biology)rhttp:/www.ddbj.nig.ac.jp/index-e.htmlDDBJINSDCr1998年,年,GenBank、EMBL和和DDBJ共同成共同成立了
7、国际核酸序列数据库协会立了国际核酸序列数据库协会(International Nucleotide Sequence Database Collaboration,INSDC)r三大核酸数据库之间每天将新测定或更新的三大核酸数据库之间每天将新测定或更新的数据进行交换共享,保证数据信息的完整与数据进行交换共享,保证数据信息的完整与同步,每两个月更新一次版本。同步,每两个月更新一次版本。rhttp:/www.insdc.org/三大数据库之间的联系RefSeq数据库r1.提供非冗余的,高质量的,经检验校正的提供非冗余的,高质量的,经检验校正的序列信息;序列信息;r2.包括染色体、基因组(细胞器、病
8、毒、质包括染色体、基因组(细胞器、病毒、质粒)、蛋白质、粒)、蛋白质、RNA等;等;r 序列文件的标识符:序列文件的标识符:mRNA序列:序列:NM_123456非编码非编码RNA:NR_123456蛋白质序列:蛋白质序列:NP_123456r http:/www.ncbi.nlm.nih.gov/RefSeqRefSeq记录的特征r截然不同的截然不同的Accession号区别于其它号区别于其它GenBank命名格式命名格式的序列,前缀是两个字的序列,前缀是两个字母加下划线母加下划线 _;r在在Comment区域显示来源区域显示来源;r使用正式命名使用正式命名;r包括包括dbxrefs的特征的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物信息学 中国科技大学 课件 系列 生物 信息学 02 教学 文案
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内