欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    生物信息名词解释法律婚姻法法律婚姻法.pdf

    • 资源ID:95961768       资源大小:419.40KB        全文页数:4页
    • 资源格式: PDF        下载积分:4.3金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要4.3金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物信息名词解释法律婚姻法法律婚姻法.pdf

    逐个克隆法:对连续克隆系中排定的 BAC 克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)。全基因组鸟枪法:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装。单核苷酸多态性(SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的 DNA 序列多态性。遗传图谱又称连锁图谱,它是以具有遗传多态性(在一个遗传位点上具有一个以上的等位基因,在群体中的出现频率皆高于 1%)的遗传标记为“路标”,以遗传学距离(在减数分裂事件中两个位点之间进行交换、重组的百分率,1%的重组率称为 1cM)为图距的基因组图。遗传图谱的建立为基因识别和完成基因定位创造了条件。物理图谱是指有关构成基因组的全部基因的排列和间距的信息,它是通过对构成基因组的 DNA 分子进行测定而绘制的。绘制物理图谱的目的是把有关基因的遗传信息及其在每条染色体上的相对位置线性而系统地排列出来。转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列、位置及表达模式等信息的图谱。比较基因组学:全基因组核苷酸序列的整体比较的研究。特点是在整个基因组的层次上比较基因组的大小及基因数目、位置、顺序、特定基因的缺失等。环境基因组学:研究基因多态性与环境之间的关系,建立环境反应基因多态性的目录,确定引起人类疾病的环境因素的科学。宏基因组是特定环境全部生物遗传物质总和,决定生物群体生命现象。转录组即一个活细胞所能转录出来的所有 mRNA。研究转录组的一个重要方法就是利用 DNA 芯片技术检测有机体基因组中基因的表达。而研究生物细胞中转录组的发生和变化规律的科学就称为转录组学。蛋白质组学:研究不同时相细胞内蛋白质的变化,揭示正常和疾病状态下,蛋白质表达的规律,从而研究疾病发生机理并发现新药。蛋白组:基因组表达的全部蛋白质,是一个动态的概念,指的是某种细胞或组织中,基因组表达的所有蛋白质。代谢组是指是指某个时间点上一个细胞所有代谢物的集合,尤其指在不同代谢过程中充当底物和产物的小分子物质,如脂质,糖,氨基酸等,可以揭示取样时该细胞的生理状态。代谢物行为更密切地反映出细胞所处的环境,该环境依赖于细胞所摄取的营养状况,所接触的药物和污染物以及其它影响细胞健康的外在因子情况。代谢物组学是在后基因组学时代兴起的一门跨领域学科,其主要目标是定量的研究生命体对外界刺激、病理生理变化、以及本身基因突变而产生的其体内代谢物水平的多元动态反应。代谢组学通过现代化学的仪器分析技术测机体整个代谢产物谱的变化,并通过多元统计分析方法研究整体的生物学功能状况。一个细胞内,基因、RNA、代谢物与蛋白质之间存在着大量的相互作用,构成细胞的相互作用组,及信号转导网络或调控网络。这些令人无法想象的复杂图谱,用系统生物学的术语来描述就是相互作用组学。蛋白质相互作用组学研究的重要方法:酵母双杂交、噬茵体展示技术、等离子共振技术、荧光能量转移技术、蛋白质阵列技术、免疫共沉淀技术、pull-down 技术等。结构基因组学主要目的是试图在生物体的整体水平上(如全基因组、全细胞或完整的生物体)测定出(以实验为主、包括理论预测)全部蛋白质分子、蛋白质蛋白质、蛋白质核酸、蛋白质多糖、蛋白质蛋白质核酸多糖、蛋白质与其他生物分子复合体的精细三维结构,以获得一幅完整的、能够在细胞中定位以及在各种生物学代谢途径、生理途径、信号传导途径中全部蛋白质在原子水平的三维结构全息图。生物信息学的主要研究内容:生物学数据的收集、存储、管理与提供,基因组序列信息的提取和分析,功能基因组相关信息分析,生物大分子结构模拟和药物设计,生物信息分析的技术与方法研究,应用与发展研究。计算生物学/生物信息学的主要理论方法:基于数据挖掘(知识发现)的方法,基于模拟分析的方法。系统生物学 是一个试图整合不同层次信息以理解生物系统如何行使功能的学术领域。通过研究某生物系统各不同部分之间的相互关系和相互作用(例如,与细胞信号传导,代谢通路,细胞器,细胞,生理系统与生物等相关的基因和蛋白网络),系统生物学期望最终能够建立整个系统的可理解模型。合成生物学是一门建立在系统生物学、生物信息学等学科基础之上,并以基因组技术为核心的现代生物科学。生物信息学常用方法:Database Search,Multiple Sequence Alignment,Algorithms。生物学数据库应满足 5 个方面的主要需求(1)时间性(2)注释(3)支撑数据(4)数据质量(5)集成性 生物学数据库几个明显的特征:(1)数据库的更新速度不断加快,数据量呈指数增长趋势(2)数据库使用频率增长更快(3)数据库的复杂程度不断增加(4)数据库网络化(5)面向应用(6)先进的软硬件配置。一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释。二级数据库:对原始生物分子数据进行整理、分类的结果,是在一级数据库、实验数据和理论分析的基础上针对特定的应用目标而建立的二次数据库。分子生物信息数据库,归纳起来,大体可以分为 4 个大类,即基因组数据库、核酸和蛋白质一级结构数据库、生物大分子(主要是蛋白质)三维空间结构数据库,以及由上述 3 类数据库和文献资料为基础构建的二次数据库。基因组数据库来自基因组作图,序列数据库来自序列测定,结构数据库来自 X 射线衍射和核磁共振等结构测定。这些数据库是分子生物学的基本数据资源,通常称为基本数据库、初始数据库,也称一次数据库。序列数据库是分子生物信息数据库中最基本的数据库,包括核酸和蛋白质两类,以核苷酸碱基顺序或氨基酸残基顺序为基本内容,并附有注释信息。国际著名的生物信息中心 NCBI National Center for Biotechnology Information(US)EBI European Bioinformatics Institute(EU)HGMP Human Genome Mapping Project Resource Centre (UK)ExPASy Expert of Protein Analysis System(Switzerland)国际上“权威”的核酸序列数据库:欧洲分子生物学实验室的 EMBL,美国生物技术信息中心的 GenBank ,日本遗传研究所的 DDBJ。三个数据库中的数据基本一致,仅在数据格式上有所差别,对于特定的查询,三个数据库的响应结果一样。这三个数据库是综合性的DNA 和 RNA 序列数据库,每条记录代表一个单独、连续、附有注释的 DNA 或 RNA 片段。蛋白质序列数据库:SWISS PROT(欧洲),PIR(美国)蛋白质结构数据库:PDB(protein data bank),美国,目前最主要的蛋白质分子结构数据库 蛋白质结构分类数据库:SCOP(Structural Classification of Proteins),英国医学研究委员会分子生物学实验室和蛋白质工程中心,CATH(Class,Architecture,Topology,Homology)作图信息基础上绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序利用超级计算机进行组装单核苷酸多态性主要是指在基因组水平上由单个核苷酸的变异所引起的序列多态性遗传图谱又称连锁图谱它是以具有遗传减数分裂事件中两个位点之间进行交换重组的百分率的重组率称为为图距的基因组图遗传图谱的建为基因识别和完成基因定位创造了条件物理图谱是指有关构成基因组的全部基因的排列和间距的信息它是通过对构成基因组的分子进出来转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列位置及表达模式等信息的图谱比较基因组学全基因组核苷酸序列的整体比较的研究特点是在整个基因组的层次上比较基因组的大小及基因数目英国伦敦大学 基因组信息二级数据库:TransFac(真核生物基因转录调控因子数据库),德国 蛋白质序列二级数据库:Prosite(蛋白质序列功能位点数据库),瑞典 蛋白质二级结构数据库:DSSP(Definition of Secondary Structure of Proteins)蛋白质二级结构构象参数数据库,FSSP(Families of Structural Similar Proteins)蛋白质家族数据库,HSSP(Homology Derived Secondary Structure of Proteins)同源蛋白质数据库 酶的分类数据库 Enzyme 不同数据库的序列格式:1 GenBank 中 DNA 序列格式,2 EMBL 序列格式,3 SwissProt序列格式,4 FASTA 序列格式,5 NBRF 序列格式,6 Intelligenetics 序列格式,7 GCG 序列格式,8 PIR/CODATA 序列格式,9 Plain/ASCII.Staden 序列格式,10 ASN.1 序列格式,11 GDE格式。冗余数据至少可能导致以下 3个潜在的错误:如果一组 DNA 或氨基酸序列包含了大量非常相关序列族,则相应的统计分析将偏向这些族,在分析结果中,这些族的特性被夸大;序列间不同部分的显著相关可能是在数据样本抽样时是有偏的和不正确的;如果这些数据是被用于预测,则这些序列将使预测方法如人工智能方法发生偏离。序列数据的偏差或人为假象主要来自实验过程,这与其它科学数据的情况相同。这些人为假象主要来自以下几个方面:载体序列污染:在测序列等实验过程中,载体序列可能造成污染,致使序列记录数据中包含了载体序列;异源序列污染:有研究表明一些人类 cDNA测序结果在实验过程中被酵母和细菌序列污染;序列的重排和缺失;重复因子污染:cDNA克隆方法有时会受到逆转录因子(如 Alus)的影响;测序误差和自然多态性:测序过程存在一定的误差概率。解决方法:选择合适的数据库;一个聪明的略策是用可能污染数据记录的序列(如载体)去估计误差程度;一些去除污染的专门软件系统已被研制出来,如 EBI 网站便提供了去除载体污染的在线服务。BLAST 是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。BLAST 是“局部相似性基本查询工具”(Basic Local Alignment Search Tool)的 缩写。一个序列模体是一段局部保守的区域或由一组序列共有的短的序列模式。模体指用于预测分子功能、结构特征或家族关系的模式。3 main methods of alignment:Automatic,Manual,Combined。状态空间搜索,就是将问题求解过程表现为从初始状态到目标状态寻找这个路径的过程。常用的状态空间搜索有深度优先和广度优先。广度优先是从初始状态一层一层向下找,直到找到目标为止。深度优先是按照一定的顺序前查找完一个分支,再查找另一个分支,以至找到目标为止。系统发生学:(Phylogenetic systematics 系统分类学、cladistics 遗传分类学)是基于生物进化史的生物分类方法。系统发生树构建步骤:(1)序列比对(2)确定替换模型(3)构建系统发生树(4)评价所建立的树。名词解释:基序:英文 motif 的缩写。也翻译为“模序”,“模体”,DNA,蛋白质等生物大分子中的保守序列。数据库:数据库是存储在一起的相关数据的集合,这些数据是结构化的,无有害的或不必要的冗余,并为多种应用服务;数据的存储独立于使用它的程序;对数据库插入新数据,修改作图信息基础上绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序利用超级计算机进行组装单核苷酸多态性主要是指在基因组水平上由单个核苷酸的变异所引起的序列多态性遗传图谱又称连锁图谱它是以具有遗传减数分裂事件中两个位点之间进行交换重组的百分率的重组率称为为图距的基因组图遗传图谱的建为基因识别和完成基因定位创造了条件物理图谱是指有关构成基因组的全部基因的排列和间距的信息它是通过对构成基因组的分子进出来转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列位置及表达模式等信息的图谱比较基因组学全基因组核苷酸序列的整体比较的研究特点是在整个基因组的层次上比较基因组的大小及基因数目和检索原有数据均能按一种公用的和可控制的方式进行。当某个系统中存在结构上完全分开的若干个数据库时,则该系统包含一个“数据库集合”。Entrez:美国国家生物技术信息中心所提供的在线资源检索器。该资源将 GenBank 序列与其原始文献出处链接在一起。Entrez 是由 NCBI 主持的一个数据库检索系统,它包括核酸,蛋白以及 Medline 文摘数据库,在这三个数据库中建立了非常完善的联系。因此,可以从一个 DNA 序列查询到蛋白产物以及相关文献,而且,每个条目均有一个类邻(neighboring)信息,给出与查询条目接近的信息。Entrez 中的数据库包括:Entrez中核酸数据库为:GenBank,EMBL,DDBJ 蛋白质数据库为:Swiss-Prot,PIR,PFR,PDB ORF:开放阅读框(ORF)是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。编码一个蛋白质的外显子连接成为一个连续的 ORF。当一个新基因被识别,其 DNA 序列被解读,人们仍旧无法搞清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA 序列可以按六种框架阅读和翻译(每条链三种,对应三种不同的起始密码子)。ORF 识别包括检测这六个阅读框架并决定哪一个包含以启动子和终止子为界限的 DNA序列而其内部不包含启动子或终止子,符合这些条件的序列有可能对应一个真正的单一的基因产物。ORF 的识别是证明一个新的 DNA 序列为特定的蛋白质编码基因的部分或全部的先决条件。BLAST:BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或 DNA 数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST 结果中的得分是对一种对相似性的统计说明。BLAST 的功能:BLAST 对一条或多条序列(可以是任何形式的序列)在一个或多个核酸或蛋白序列库中进行比对。BLAST 还能发现具有缺口的能比对上的序列。基因组注释:基因组注释(Genome annotation)是利用生物信息学方法和工具,对基因组所有基因的生物学功能进行高通量注释,是当前功能基因组学研究的一个热点。基因组注释的研究内容包括基因识别和基因功能注释两个方面。基因家族;同一物种中结构与功能相似,进化起源上密切相关的一组基因。什么是生物信息学?研究的内容包括哪几个方面?生物信息学:为拓展生物学、医学、行为学和卫生学数据的用途,而进行有关计算机方法手段的研究、开发与应用,包括此类数据的采集、存贮、整理、归档、分析与可视化。主要包括:生物学数据的收集、存储、管理与提供 基因组序列信息的提取和分析 功能基因组相关信息分析 生物大分子结构模拟和药物设计 生物信息分析的技术与方法研究 应用与发展研究 非编码 RNA:迄今为止,细胞中的 rRNA、tRNA、snRNA(小核 RNA)、asRNA(反义RNA)、snoRNA(核仁小分子 RNA)、miRNA、piRNA 都是非编码“垃圾”DNA合成的。它们参与到基因活化、基因沉默、基因印记、剂量补偿、蛋白合成与功能调节、代谢调控等众多生物学过程中。作图信息基础上绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序利用超级计算机进行组装单核苷酸多态性主要是指在基因组水平上由单个核苷酸的变异所引起的序列多态性遗传图谱又称连锁图谱它是以具有遗传减数分裂事件中两个位点之间进行交换重组的百分率的重组率称为为图距的基因组图遗传图谱的建为基因识别和完成基因定位创造了条件物理图谱是指有关构成基因组的全部基因的排列和间距的信息它是通过对构成基因组的分子进出来转录图谱是在识别基因组所包含的蛋白质编码序列的基础上绘制的结合有关基因序列位置及表达模式等信息的图谱比较基因组学全基因组核苷酸序列的整体比较的研究特点是在整个基因组的层次上比较基因组的大小及基因数目

    注意事项

    本文(生物信息名词解释法律婚姻法法律婚姻法.pdf)为本站会员(Q****o)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开