2021年分子生物学考点整理分生期末考试.docx
《2021年分子生物学考点整理分生期末考试.docx》由会员分享,可在线阅读,更多相关《2021年分子生物学考点整理分生期末考试.docx(207页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2.韩斌老师基因组学本文档由孙雯整理,希望各位同学都能取得好成绩!基因组学Genomics韩斌 基因组(Genome: Gene+chromosome)细胞或生物体中一套完整的单倍体遗传物 ,质 基因组学(Genomics)最早Thomas Roderick在1986年提出,包括基因组作图、测 序和分析。可分为结构基因组学和功能基因组学。、结构基因组学基因组、基因、转录组、蛋白质组抗病基因处性雌点遗传图RFLPSTS SNP SSR行版IIII序列及序列组装基因组序列基因结构转录谱蛋白质组基因表达芯片联分析,罔hi七dJ鉴定軸、強分化相关基因、二 1RNA-seqGATCGTCAGATCAGC
2、AT CAGCATCAGCGACT CAGCATCATATCATCAGCAC GATCACGACGACTACTA CGACTACAG(基因预测!遗传图谱基于重组自交系丨轴、粮稻组群体物理图二, 二-二一质位 用 性量定 作 白子互 蛋分细功组相r-r-i-M 表达序列标签遗传图谱基于 自然群体聚类组装二匸单个基因 1 . 遗传图(Genetic Mapping Genomes) : Based on the calculation of recombination frequency by linkage analysis .通过亲本的杂交,分析后代的基因间重组率,并用重组率来表示两个 基因之
3、间距离的线形连锁图谱每条染色体组成一个连锁群,所有染色体的连锁群组成的图谱即构成基因组遗传图。重组率代表基因位点之间的相对距离。在遗传作图中,人们把个作图单位定义为!厘摩 (cM), IcM等于1%的重组率。提高遗传作图的分辨率:选用不同的杂交群体:增加杂交群体的数目;增加分子标记的数目: 扩大分子标记的来源分子标记:绘制基因组遗传图需要的坐标点。分子标记的主要来源是染色体上存在的大量等位基因。在DNA水平上,两个基因间个碱 基的差异就足以形成等位基因。2 .物理图_ (physical map):指DNA序列上两点的实际距离,它是以DNA的限制酶片段或 克隆的大片段的基因组DNA分子为基本单
4、位,以连续的重叠群为基本框架,通过遗传 标记将重叠群或基因组DNA分子有序排列于染色体上。物理图的绘制:Based on molecular hybridization analysis and PCR techniques 杂交法;指纹法;荧光原位杂交技术。3 . 基因组序列测定:Sequencing methods: the chain termination procedure;Map-based clone by clone strategy;Whole genome shotgun (WGS) strategy;Sequence assembly; 传统基因组测序的方法:克隆步移法(
5、BAC-by-BAC Strategy)和全基因组鸟抢法(Whole Genome Shotgun Strategy) 基因组测序战略:基于物理图的克隆连克隆法、随机挑选BAC克隆测序、逐步步 移法(Lee Hood)、全基因组鸟枪法(Craig Venter)DNA测序技术更新DNA测序能够真实反映生物体基因组DNA上的遗传信息,因此在生 命科学结构基因组学和功能基因组学研究中具有举足轻重的地位。第一代测技术Sanger测序1975 年 准确率高读取长(lOOObp)缺点成本髙人类基因组计划 13年30亿美元L/師及冰高通量测序(NGS)2005年1一454刑字SOUD测序J$olexa 测
6、序优点成:低 速度快 Jlfl缺点准确率低读长短(75-150bp)第三代测序技术单分子测序2009 年 I-HeliscopePacBioSMRT 技术Nanopore优点成本低读长长 速履快(3000bp)Jlfig 点错误率速发慢 通小(100kb)4 .基因组序列解析(Annotating Genome Sequence):其目标是建立高密度的遗传图、高分 辨率的物理图和转录图,最终完成全基因组序列测定和注解,是功能基因组学的基础 基因组注解异常复杂,它是个繁杂的复合体,既包含了进化历史上原封未动的部分, 也有大量的进化史上重要历史事件的遗迹。基因组有它自身的规律,但是一些不和谐的韵律
7、”,如从病毒或者原核生物感染或寄生 得到的基因组片段、转座元件、假基因以及重复序列的存在,构成了理解基因组结构的四大 陷阱。.基因组序列注释的三个层次:“Where,即在基因组序列中,基因在哪里?它是 何转录我拼接的?每个外显子的具体边界在哪里?IWhat,即这个基因编码的蛋白质是什么?它有什 祥的级、二级甚至是三级结构?代谢调控过程层次“How,即这个蛋吗!如行使功能?它参与了什么 样的代谢或调控过程?心法则在真核生物中,遗传信息从基因组DNA转录成pre-rnRNA ,后者经过拼接、戴帽、加尾等加工变成成熟的mRNA, mRNA从细胞核进入细胞质中,在这里被翻译成蛋白质, 然后该蛋白质到达
8、它的靶位点行使相应的生物学功能。核件險水平上的分析:基因预测软件以及全长cDNA和E5T数据的分析;重复序列、假基因及其他;蛋门质水水平的分析:核昔酸水平的序列分析给出了每 个基因的准确结构,随后的工作就是命名每个基因所编码 的蛋白质,并预测每种蛋白质的可能功能,最终得到一张 明确的基因组成清单。求因家族的分析:Orthologous (直向同源)基因,指共同祖先的I工接后代( 没有发生基因复制事件)之间的同源基因,具有相近甚至 相同的功能,由相似的途径调控,在不同的物种中扮演相 似甚至相同的角色;Paralogous (共生同源)基因,指两个物种的同源基因分 同祖冼基因组中由复制事件生的丕同
9、拷贝的后基因家族的基因通常属f共生同源基因的范畴Annotating a Genome Sequence(1) . Gene prediction by software;RiDB!EMBL(Genbank)Gene fiding: Find genes and gene structures from genomic sequencesProblemsFinding the parts:收集可靠的信息,并识别信号或传感器作为整个基因的一部分。可能是 些程序的端点,例如Splice Predictor, MZEF用于找寻外显子。Puding parts together:使用适当和有效的算法将
10、部分组合在起,产生完整的基因模型。许 多程序目前可用于全基因预测(GenScan, GeneMark.hmm, Grail, Glimmer等),这些程序 基于动态规划和基于HMM (隐马尔可夫算法),将部分组合成整体。Three types of information:Signals (signal sensors):短子序列例如剪接位点,poly A信号和其他基序。信号传感器可以 表示为模式或权重矩阵。它们可以通过序列比对,统计方法或神经网络获得。.Content statistics (content sensors):描述了编码区的非随机性质,例如密码子偏好和反密码 子偏好性。Sim
11、ilarity:与已知基因的相似性可有助于提高signal sensor和contenst statistics的准确性。(2) . Gene identification:expressed sequence tags (ESTs),homology analysis, mutations,直系同源物:由共同的祖先基因进化而来的不同生物的同源基因 旁系同源物:个物种中通过基因复制而演化形成的同源基因 (类似基因:非来自相同祖先的基因,但通过会聚进化而具有相似的功能特征的个实 例是糜蛋白酶和枯草杆菌蛋白酶的类似催化位点)gene duplication-TamaZVSpecies IraT14
12、anSpecies IIal and a2 are paralogy while al in species I and alin species II are ortholoes (so are a2 in species I and s2 in species II)homologsparalogsfrog a chickOt mouseOt mousep chickB frog|3X XXa-chain genep-chain genegene duplication /early globin geneHow to measure similarityIdentity: Two pro
13、teins that have a certain number of amino-acids in common at aligned positions are said to be identical to that degree, (i.e. if they have 43 residues out of a total of 100 in common they are 43% identical).Similarity: Often a number of residues will be replaced by ones of similar physico-chemical p
14、roperties. Such mutations may be termed conservative and one may define various scoring matrices to quantify how similar the two sequences are, taking into account conservative mutations. Such scores will be measures of similarity.Homology: If and on/y/f two proteins are evolutionarily related and d
15、escend from a common ancestor, they are called homologous. Similarity and homology are two different concepts and must not be parative analysis between genomes;Pair-wise sequence alignment is a foundational operation unit for much of the bioinformatics analysis(3) .Transcriptome & Proteome;Synthetic
16、 biologyBiological systems(organisms)Reductionistic approach (Experimental)Data generationData analysisSynthetic approach (In-silico bioinformatics)Analysis of molecules, interactions.and networksBuild knowledgePairs of moleculesPathwaysCellular processes BrainReconstruction of organismBuilding bloc
17、ks(genes, molecules)二、功能基因组学1、定义:利用结构基因组提供的信息,在基因组或系统水平上全面分析基因的功能,使生 物学研究从对单基因或蛋白质研究转向对多个基因或蛋白质同时进行的系统研究,是在基 因组静态(碱基序列)清楚后转入对基因组动态(生物学功能)的研究。应用高通量的方法 来平行研究大量基因。2、任务:进行基因组功能注释(Genome annotation), 了解基因的功能,掌握基因的产物 及其在生命活动中的作用。从基因组的整体水平上来理解基因的功能与进化。3、功能基因组研究内容:突变体库的构建、全长cDNA克隆与测序、获得DNA芯片等基因 转录图谱、高通量测序(N
18、GS)转录组、植物全基因组关联分析(GWAS)、高通量的遗传转化鉴定系统、生物信息技术平台与相应数据库的构建(1)突变体库的构建变异是功能分析的基础。突变体是功能基因组学研究的重要材料。植物突变可在分子、细胞、组织、器官和个体等不同的水平上表现。一般分3种方法:1 .按突变方法分自然突变、物理化学诱变、DNA插入突变:2 .按遗传背景分为普通突变体库、近等基因系突变体库和等基因系突变体库;3 .按引起突变的分子机制分功能丧失突变和功能获得性突变(2)基因克隆的一般方法植物的生长发育是在多个代谢和生理过程基础上所发生的基因在时空上表达的综合现 象,分离潜在的各种有价值的基因,对植物特别是作物品种
19、改良具有重要意义。因此,对基因的克隆并发展与之相关的技术非常重要。(3)高通量测序转录组技术转录组测序亦称RNA-Seq (RNA Sequencing),是指利用第二代高通量测序技术进行cDNA测序,全面快速地获取某一物种特定器官或组织在某状态下的几乎所有转录本 RNA-seqI双链均能被随机测序以致不能确定转录本方向1ST J ATOLCBaTOWMCTOOW3THTBCOMOCAO JCAiUMZMAS4HBA73末端加adapter-5,复磷酸5加adapter来识别 转录本方向RNANGS在转录组学研究中应用:转录组学:在整体水平上研究细胞中基因转录的情况及转录调 控规律的学科,研究
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2021 年分 生物学 考点 整理 期末考试
限制150内