基因表达及功能分析基本策略.ppt
目目 录录第二十六章第二十六章 基因表达及功能分析的基因表达及功能分析的基本策略基本策略STRATEGIES FOR ANALYZING GENE EXPRESSION AND FUNCTION目目 录录第一节第一节 基因表达的分析策略基因表达的分析策略Strategies for Analyzing Gene Expression目目 录录一、通过检测一、通过检测mRNA揭示基因转录水平的表达特征揭示基因转录水平的表达特征根据分析方法的原理和功能特性,可将基因表达分析分为根据分析方法的原理和功能特性,可将基因表达分析分为:封闭性系统研究方法封闭性系统研究方法:例如例如DNA微阵列、微阵列、Northern印迹、实印迹、实时时RT-PCR等方法,其应用范围仅限于已测序的物种,只能等方法,其应用范围仅限于已测序的物种,只能研究已知的基因。研究已知的基因。开放性系统研究方法开放性系统研究方法:如差异显示如差异显示PCR、双向基因表达指纹、双向基因表达指纹图谱、分子索引法、随机引物图谱、分子索引法、随机引物PCR指纹分析等,可以发现指纹分析等,可以发现和分析未知的基因。和分析未知的基因。这里主要针对已知基因的常用表达分析方法做一介绍。这里主要针对已知基因的常用表达分析方法做一介绍。目目 录录(一)基于杂交原理的方法可检测(一)基于杂交原理的方法可检测mRNAmRNA表达水平表达水平1Northern印迹印迹(Northern blot)既可分析既可分析mRNA表达又可验证表达又可验证cDNA新序列新序列 是一种基于是一种基于RNA-DNA杂交原理建立的一种杂交原理建立的一种RNA分析分析技术技术目目 录录Northern印印迹迹分分析析原原理理示示意意图图目目 录录2核糖核酸酶保护实验核糖核酸酶保护实验(ribonuclease protection assay,RPA)可用于可用于mRNA定量和定量和RNA剪接分析剪接分析 是是一一种种基基于于杂杂交交原原理理分分析析mRNA的的方方法法,既既可可对对mRNA进进行行定定量量分分析析又又可可研研究究其其结结构构特特征征,灵灵敏敏度和特异性都很高。度和特异性都很高。目目 录录核糖核酸酶保护实验原理示意图核糖核酸酶保护实验原理示意图目目 录录可对可对mRNA进行区域定位进行区域定位 是是利利用用杂杂交交原原理理建建立立的的组组织织原原位位mRNA检检测测技技术术,可可对对细细胞胞或或组组织织中中原原位位表表达达的的mRNA进进行行区区域域定定位位。同同时也可作为定量分析的补充。时也可作为定量分析的补充。通通过过设设计计与与目目标标mRNA碱碱基基序序列列互互补补的的寡寡核核苷苷酸酸序序列列,标标记记后后作作为为探探针针;该该探探针针能能够够特特异异性性地地与与目目标标靶靶序序列列杂杂交交,检检测测标标记记信信号号来来确确定定基基因因在在组组织织和和细细胞胞内内表表达达的区位信息。的区位信息。虽虽然然原原位位杂杂交交在在功功能能性性方方面面提提供供的的信信息息较较少少,但但是是该该技技术术还还是是被被广广泛泛用用于于组组织织中中的的基基因因表表达达分分析析,这这是是因因为其较高的稳定性、较广泛的靶点和组织适用性。为其较高的稳定性、较广泛的靶点和组织适用性。3原位杂交(原位杂交(in situ hybridization,ISH)目目 录录(二)两种变换的聚合酶链式反应是常用的(二)两种变换的聚合酶链式反应是常用的mRNA检测方法检测方法1反转录反转录PCR可用于可用于mRNA的半定量分析的半定量分析 反反转转录录PCR(reverse transcription-PCR,RT-PCR)是是一一种种简简单单、快快捷捷地地对对RNA进进行行定定性性、定定量量分分析析的的方方法法。它它是是以以mRNA为为模模板板,体体外外扩扩增增cDNA,再再以以cDNA为为模模板板进进行行特特定定基基因因转转录录产产物物的的PCR扩扩增增。RT-PCR技技术术一一般般用用于于RNA的的定定性性分分析析;如如果果设设置置阳阳性性参参照,则可对待测照,则可对待测RNA样品进行半定量分析。样品进行半定量分析。该该方方法法适适合合对对待待测测样样品品进进行行初初步步筛筛选选,目目前前已已广广泛泛被被实实时定量时定量PCR替代。替代。目目 录录常用于常用于mRNA的定量分析的定量分析 实实时时定定量量PCR(Real-time Quantitative Polymerase chain Reaction,RQ-PCR)是是定定量量分分析析mRNA的的最最通通用用、最最快快速速、最最简简便便的的方方法法,该该方方法法是是对对PCR反反应应进进行行实实时时监监测测,具具有很高的灵敏度和特异性。有很高的灵敏度和特异性。2实时定量实时定量PCR目目 录录目前有目前有5种技术用于实时定量种技术用于实时定量PCR:其其中中最最经经济济、简简便便的的技技术术是是利利用用荧荧光光染染料料(如如SYBR Green)与与双双链链DNA分分子子结结合合发发光光的的特特性性,指指示示扩扩增增产产物的增加;物的增加;其其他他4种种方方法法都都是是以以荧荧光光染染料料标标记记的的寡寡核核苷苷酸酸为为探探针针与与正正确确的的扩扩增增子子杂杂交交,包包括括5核核酸酸酶酶法法(即即人人们们熟熟知知的的TaqManTM)、分分子子信信标标、ScropionsTM和和探探针针杂杂交交法法,它它们们拥拥有有更更强强的的特特异异性性,可可以以避避免免对对PCR后后溶溶解解曲曲线线的的需需求求,以以及及后后续续的的Southern杂杂交交或或对对扩扩增增子子的的测测序序鉴鉴定定,但是成本较高。但是成本较高。目目 录录SYBR Green实实时时定定量量PCR分分析析原原理理示示意意图图 目目 录录二、通过蛋白质检测揭示基因二、通过蛋白质检测揭示基因 翻译水平的表达特征翻译水平的表达特征 Western印印迹迹(Western blot)是是一一种种免免疫疫印印迹迹技技术术,其其基基本本原原理理与与核核酸酸分分子子杂杂交交相相似似,只只是是以以偶偶联联标标记记物物的的抗抗体体分分子子作作为为探探针针,检检测测转转移移到到固固相相支支持持物物上上的的蛋蛋白白质质/多多肽肽分分子子。当当在在蛋蛋白白质质水水平平上上检检测测特特定定基基因因的的表表达达活活性性时时,最最常常用用的的方方法法就就是是利利用用Western印印迹迹对对细细胞胞或或组组织织的的总总蛋蛋白白质质中的特异蛋白质进行定性和半定量分析。中的特异蛋白质进行定性和半定量分析。(一)采用特异抗体经(一)采用特异抗体经Western印迹可直接印迹可直接 测定基因编码多肽测定基因编码多肽目目 录录1.蛋白质样品的制备蛋白质样品的制备2.SDS-PAGE分离分离3.蛋白质转膜蛋白质转膜4.特特异异抗抗体体(即即第第一一抗抗体体)与与膜膜上上的的蛋蛋白白质质(抗抗原原)印印迹杂交迹杂交5.再再经经偶偶联联了了可可检检测测标标记记信信号号的的第第二二抗抗体体(即即抗抗抗抗体体,商品试剂盒中多采用偶联辣根过氧化物酶的商品试剂盒中多采用偶联辣根过氧化物酶的Ig)6.最最后后经经与与酶酶的的底底物物反反应应而而显显影影、成成像像,经经扫扫描描后后获获取取免疫印迹信息免疫印迹信息Western blot基本程序基本程序目目 录录 酶联免疫吸附分析(酶联免疫吸附分析(Enzyme-linked immunosorbent assay,ELISA)也是一种建立在抗原也是一种建立在抗原-抗体反应基础上的蛋白抗体反应基础上的蛋白质分析基本方法。质分析基本方法。该方法不需经电泳分离待检样品蛋白质,而是预先将样品该方法不需经电泳分离待检样品蛋白质,而是预先将样品包被在支持体上,以后反应过程与包被在支持体上,以后反应过程与Western印迹大致相同印迹大致相同顺序结合(即顺序结合(即“吸附吸附”)特异抗体(一抗)及与酶连接的第二)特异抗体(一抗)及与酶连接的第二抗体(也可预先包被抗体,抗体(也可预先包被抗体,“吸附吸附”抗原),再进行酶抗原),再进行酶-底物底物反应。反应后通过专门的酶标仪测定、记录数据。反应。反应后通过专门的酶标仪测定、记录数据。(二)酶联免疫吸附分析与(二)酶联免疫吸附分析与Western印迹原理印迹原理相似但形式不同相似但形式不同目目 录录特点:特点:具有特异性;具有特异性;灵敏度很高;灵敏度很高;稳稳定定、操操作作简简便便,标标本本用用量量少少,适适于于大大规规模模筛筛查查,尤其适用于检测体液中微量的特异性抗体或抗原;尤其适用于检测体液中微量的特异性抗体或抗原;既可以做定性试验也可以做定量分析。既可以做定性试验也可以做定量分析。被被广广泛泛应应用用于于微微生生物物学学、寄寄生生虫虫学学、肿肿瘤瘤学学和和免疫学等领域。免疫学等领域。酶联免疫吸附分析酶联免疫吸附分析目目 录录 免免疫疫组组织织化化学学(immunohistochemistry)与与免免疫疫细细胞胞化化学学(immunocytochemistry)原原理理相相同同,都都是是利利用用标标记记的的特特异异性性抗抗体体通通过过抗抗原原-抗抗体体反反应应和和显显色色反反应应,在在组组织织或或细细胞胞原原位位检检测测特特定定抗抗原原(即即目目标标蛋蛋白白质质)的的方方法法,简简称称为为免免疫疫组组化化实实验验。近近年年来来由由于于荧荧光光标标记记抗抗体的广泛应用,这两种方法又被统称为体的广泛应用,这两种方法又被统称为免疫荧光法。免疫荧光法。(三)免疫组化实验可对组织(三)免疫组化实验可对组织/细胞细胞 表达的蛋白质进行原位检测表达的蛋白质进行原位检测目目 录录(immunofluorescence),可可应应用用荧荧光光(倒倒置置)显显微微镜镜或或激激光光共共聚聚焦焦显显微微镜镜(confocal microscopy)对对靶靶分分子子进进行行定定性性、定定量量和和定定位位分分析析,激激光光共共聚聚焦焦显显微微镜镜还还可可进进行行断断层层成像,是在蛋白质水平分析基因表达的直观方法。成像,是在蛋白质水平分析基因表达的直观方法。其其中中抗抗体体对对于于蛋蛋白白质质靶靶点点的的特特异异性性、种种间间交交叉叉反反应应、检检测测系系统统的的灵灵敏敏性性以以及及细细胞胞或或组组织织的的固固定定类类型型是是该该方方法法的的关关键键因素。因素。运运用用双双重重着着色色或或多多重重着着色色程程序序同同时时对对多多个个感感兴兴趣趣的的靶靶分分子子进进行行检检测测,是是一一种种揭揭示示更更多多有有关关细细胞胞群群的的功功能能和和它它们们之之间间相互作用信息的有效方法。相互作用信息的有效方法。免免疫疫组组化化主主要要是是作作为为定定性性、定定位位的的技技术术,若若结结合合密密度度计计量量系统、图像分析系统等测量工具也可以得到定量的数据。系统、图像分析系统等测量工具也可以得到定量的数据。目目 录录 流流式式细细胞胞术术(flow cytometry)在在细细胞胞水水平平分分析析特特定定蛋蛋白白质质的的基基本本原原理理也也是是抗抗原原-抗抗体体反反应应,它它利利用用荧荧光光标标记记抗抗体体与与抗抗原原的的特特异异性性结结合合,经经过过流流式式细细胞胞仪仪分分析析荧荧光光信信号号,从从而而根根据据细细胞胞表表达达特特定定蛋蛋白白质质的的水水平平对对某某种种蛋蛋白白质质阳阳性性细细胞(即特异基因表达的细胞)作出判断。胞(即特异基因表达的细胞)作出判断。(四)流式细胞术用于分析(四)流式细胞术用于分析 表达特异蛋白质的阳性细胞表达特异蛋白质的阳性细胞目目 录录流流式式细细胞胞术术可可以以检检测测活活细细胞胞,也也可可以以检检测测用用甲甲醛醛固固定定的的细胞。细胞。广广泛泛应应用用于于细细胞胞表表面面和和细细胞胞内内分分子子表表达达水水平平的的定定量量分分析析,并能够根据各种蛋白质的表达模式区分细胞亚群。并能够根据各种蛋白质的表达模式区分细胞亚群。此此外外,流流式式细细胞胞术术可可以以使使用用多多个个荧荧光光标标记记的的抗抗体体同同时时对对多多个个基基因因产产物物进进行行标标记记和和监监测测,是是对对细细胞胞进进行行快快速速分分析析、分选、特征鉴定的一种有效方法。分选、特征鉴定的一种有效方法。目目 录录三、高通量检测技术成为基因表达三、高通量检测技术成为基因表达研究的有力工具研究的有力工具 高高通通量量筛筛选选(High throughput screening,HTS)技技术术是是在在大大量量核核酸酸、多多肽肽信信息息累累计计(即即资资料料库库)基基础础上上,采采用用微微板板作作为为分分子子载载体体,制制作作集集成成“芯芯片片”,以以自自动动化化操操作系统进行分子杂交的试验过程。作系统进行分子杂交的试验过程。因因为为快快捷捷、灵灵敏敏、信信息息量量大大,适适合合大大规规模模操操作作,故故称称“高通量高通量”。高高通通量量检检测测技技术术适适合合“组组学学”(omics)研研究究,更更适适合生命活动过程相关的基因表达谱分析。合生命活动过程相关的基因表达谱分析。目目 录录1.1.基因芯片已成为基因表达谱分析的常用方法基因芯片已成为基因表达谱分析的常用方法 基基因因芯芯片片(gene chip)又又称称DNA微微阵阵列列(DNA microarray)、DNA芯芯片片(DNA chip),是是将将大大量量已已知知序序列列的的核核酸酸片片段段(包包括括寡寡核核苷苷酸酸、cDNA、基基因因组组DNA、microRNA等等)集集成成在在同同一一基基片片上上,组组成成密密集集分分子子排排列列,通通过过与与标标记记样样品品进进行行杂杂交交,检测、获取细胞或组织的基因信息。检测、获取细胞或组织的基因信息。其其中中基基因因表表达达谱谱(expression prifile)分分析析是是目目前前基基因因芯芯片片应应用用最最多多的的一一个个方方面面,主主要要采采用用cDNA芯芯片片,基基因因表表达达谱谱芯芯片片便便于于对对不不同同状状态态(如如生生理理和和病病理理条条件件)下下的的基基因因表表达达谱谱进进行行比比较较,揭揭示示转转录录组组(transcriptome)差差异异表表达达的的规规律律,对对探探索索发发病病机机制制、评评价价治治疗疗效效果果、筛筛选选药药物物靶靶标标具具有有重重要要意意义。义。(一)基因芯片和高通量测序技术可在基因(一)基因芯片和高通量测序技术可在基因水平高通量地分析基因表达水平高通量地分析基因表达目目 录录2.2.高通量测序技术是新一代基因表达谱高通量测序技术是新一代基因表达谱分析方法分析方法 高高通通量量测测序序技技术术可可以以一一次次对对几几十十万万到到几几百百万万个个DNA分分子子片片段段进进行行序序列列测测定定,从从而而快快速速获获得得转转录录组组或或基因组的全貌基因组的全貌,又被称为又被称为深度测序深度测序(deep sequencing)。目目 录录 在在DNA水水平平上上,可可以以大大规规模模地地分分析析基基因因组组甲甲基基化化、筛筛选选突突变变基基因因、检测基因多态性;检测基因多态性;在在RNA水水平平上上,可可以以对对RNA片片段段进进行行扫扫描描、定定量量与与鉴鉴定定,对对全全基因组进行广谱表达研究。基因组进行广谱表达研究。1)目前,高通量测序技术不仅仅在)目前,高通量测序技术不仅仅在DNA测序中起到重测序中起到重要的作用,并且已经应用于基因组分析的各个方面:要的作用,并且已经应用于基因组分析的各个方面:2)高高通通量量测测序序另另一一个个被被广广泛泛应应用用的的领领域域是是小小分分子子RNA或或非非编编码码RNA(ncRNA)研研究究。测测序序方方法法能能轻轻易易地地解解决决芯芯片片技技术术在在检检测测小小分分子子时时遇遇到到的的技技术术难难题题(短短序序列列,高高度度同同源源),而而且且小小分分子子RNA的的短短序序列列正正好好配配合合了了高高通通量量测测序序的的长长度度,同时测序方法还能在实验中发现新的小分子同时测序方法还能在实验中发现新的小分子RNA。目目 录录基因芯片的缺点基因芯片的缺点:在在于于它它是是一一个个“封封闭闭系系统统”,它它只只能能检检测测人人们们已已知知序列的特征序列的特征(或有限的变异或有限的变异)。高通量测序的优势高通量测序的优势:在在于于它它是是一一个个“开开放放系系统统”,它它的的发发现现能能力力和和寻寻找找新信息的能力从本质上高于芯片技术。新信息的能力从本质上高于芯片技术。目目 录录(二)蛋白质芯片和双向电泳可在蛋白质水平(二)蛋白质芯片和双向电泳可在蛋白质水平高通量地分析基因表达高通量地分析基因表达 蛋蛋白白质质芯芯片片(protein chip)是是一一种种对对蛋蛋白白质质的的表表达达和和功能进行高通量分析的技术。功能进行高通量分析的技术。是是将将具具有有高高度度亲亲和和特特异异性性的的探探针针分分子子(如如单单克克隆隆抗抗体体)固固定定在在基基片片上上,用用以以识识别别复复杂杂生生物物样样品品溶溶液液中中的的目目标标多多肽肽;蛋蛋白白质质功功能能芯芯片片可可用用来来研研究究蛋蛋白白质质修修饰饰、蛋蛋白白质质-蛋蛋白白质质/DNA-蛋蛋白白质质/RNA-蛋蛋白白质质,以以及及蛋蛋白白质质与与脂脂质质、蛋蛋白白质质与药物、酶与底物、小分子与药物、酶与底物、小分子-蛋白质等的相互作用。蛋白质等的相互作用。1 1蛋白质芯片有多种形式和用途蛋白质芯片有多种形式和用途目目 录录蛋白质检测芯片包括蛋白质检测芯片包括:1.1.抗体芯片抗体芯片2.2.抗原芯片抗原芯片3.3.配体芯片配体芯片4.4.碳水化合物芯片等碳水化合物芯片等根据蛋白质芯片制作方法和用途不同,可将其分为根据蛋白质芯片制作方法和用途不同,可将其分为1.1.蛋白质检测芯片蛋白质检测芯片2.2.蛋白质功能芯片两大类蛋白质功能芯片两大类目目 录录 目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰目前比较和鉴定蛋白质表达谱更多采用双向聚丙烯酰胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术胺凝胶电泳结合质谱技术。双向聚丙烯酰胺凝胶电泳技术又称又称二维电泳(二维电泳(two-dimensional electrophoresis,简称简称2-D电泳)。电泳)。原理原理:根据蛋白质分子的两个属性根据蛋白质分子的两个属性等电点和分子质等电点和分子质量量将蛋白质混合物进行分离。电泳结果经染色后,即将蛋白质混合物进行分离。电泳结果经染色后,即可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中可对不同样品中蛋白质的表达谱进行比较;还可从凝胶中将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段,将特定的蛋白质点切下,经胰蛋白酶消化后得到短肽片段,利用利用质谱(质谱(mass spectrum)技术进行定性分析,对差异表)技术进行定性分析,对差异表达的蛋白质进行鉴定。达的蛋白质进行鉴定。可同时分离数成百上千的蛋白质。可同时分离数成百上千的蛋白质。2 2双向电泳结合质谱普遍用于蛋白质表达双向电泳结合质谱普遍用于蛋白质表达谱的分析和鉴定谱的分析和鉴定目目 录录第二节第二节 生物信息学在预测基因生物信息学在预测基因功能中的应用功能中的应用 Bioinformatics Application in Predicting Gene Function目目 录录一、利用生物信息学方法进行基因功能一、利用生物信息学方法进行基因功能注释注释(一)通过序列比对预测基因功能一)通过序列比对预测基因功能 序序列列比比对对是是生生物物信信息息学学最最基基本本的的分分析析技技术术之之一一,最最常常用用的的方方法法是是将将目目的的DNA或或蛋蛋白白质质序序列列与与已已知知的的DNA和和蛋蛋白白质质序序列列数数据据库库进进行行比比对对,搜搜索索到到与与目目的的序序列列高高度度同同源源的的功功能能已已知知的的基基因因或或蛋蛋白白质质,用用这这些些基基因因和和蛋蛋白白质质预预测测目目的的基基因因和和蛋蛋白白质质的的功功能能。局局部部比比对对搜搜索索工工具具BLAST是是进进行行序序列列比比对对的的基基本本工工具具,它它允允许许用用户户选选择择一一条条查查询询序序列列与与一一个个数数据据库库进进行行比比对对,找找到到数数据据库库中中与与输输入入的的查查询询序序列列相相匹匹配配的的项项。BLAST是是一一个个序序列列数数据据库库搜搜索索程程序序家家族族,其其中中包包括括许许多有特定用途的程序。多有特定用途的程序。目目 录录程序程序查询查询序列序列类类型型数据数据库类库类型型注注BLASTNDNADNABLASTP蛋白蛋白质质蛋白蛋白质质BLASTXDNA蛋白蛋白质质将待搜索的核酸序列按将待搜索的核酸序列按6个个阅读阅读框翻框翻译译成蛋白成蛋白质质序列,然后与数据序列,然后与数据库库中的蛋白中的蛋白质质序列比序列比对对TBLASTN蛋白蛋白质质DNA将数据将数据库库中的核酸序列按中的核酸序列按6个个阅读阅读框翻框翻译译成蛋成蛋白白质质序列,然后与待搜索的蛋白序列,然后与待搜索的蛋白质质序列比序列比对对TBLASTXDNADNA无无论论是待搜索的核酸序列是待搜索的核酸序列还还是数据是数据库库中的核中的核酸序列都按酸序列都按6个个阅读阅读框翻框翻译译成蛋白成蛋白质质序列,然序列,然后比后比对对BLAST序列数据库搜索程序家族序列数据库搜索程序家族目目 录录(二)利用生物信息学方法分析基因芯片数据(二)利用生物信息学方法分析基因芯片数据最常用的方法有:最常用的方法有:差异表达分析(又称基因表达差异分析)差异表达分析(又称基因表达差异分析)聚类分析聚类分析差异表达分析的目的:差异表达分析的目的:识识别别两两个个条条件件下下表表达达差差异异显显著著的的基基因因,即即一一个个基基因因在在两两个个条条件件中中的的表表达达水水平平,在在排排除除各各种种偏偏差差后后,其其差差异异具有统计学意义具有统计学意义目目 录录1.1.倍数分析:倍数分析:计算每个基因在两个条件下的表达比值;计算每个基因在两个条件下的表达比值;2.2.统统计计分分析析中中的的t t检检验验和和方方差差分分析析:通通过过计计算算表表达达差差异异的的置信度来分析差异是否具有统计学意义;置信度来分析差异是否具有统计学意义;3.3.建建模模的的方方法法:通通过过确确定定两两个个条条件件下下的的模模型型参参数数是是否否相相同来判断表达差异的显著性。同来判断表达差异的显著性。差异表达分析常用的分析方法有差异表达分析常用的分析方法有3类:类:目目 录录聚类分析所依据的基本假设:聚类分析所依据的基本假设:若若组组内内基基因因具具有有相相似似的的表表达达模模式式,则则它它们们可可能能具具有有相相似似的的功功能能,例例如如受受共共同同的的转转录录因因子子调调控控的的基基因因,或或者者产产物物构构成成同同一一个个蛋蛋白白复复合合体体的的基基因因,或或者者参参与与相相同同调调控控路径的基因。路径的基因。在在具具体体应应用用中中可可按按照照相相似似的的表表达达谱谱对对基基因因进进行行聚聚类类,从而预测组内未知基因的功能。从而预测组内未知基因的功能。目目前前已已经经有有很很多多种种聚聚类类的的方方法法应应用用到到基基因因芯芯片片的的研研究究当当中中,如如层层次次聚聚类类(Hierarchical clustering)、K 均均值值聚聚类类(K-means clustering)、自自组组织织映映射射(self organizing map)、PCA(principlecomponet analysis)等。等。目目 录录 在在氨氨基基酸酸序序列列整整体体同同源源性性不不明明显显的的情情况况下下,对对蛋蛋白白质质的的功功能能域域进进行行分分析析将将对对预预测测基基因因功功能能提提供供极极其其有有价价值值的的信信息息。目目前前已已通通过过多多序序列列比比对对将将蛋蛋白白质质的的同同源源序序列列收收集集在在一一起起,确确定定了了大大量量蕴蕴藏藏于于蛋蛋白白质质结结构构中中的的保保守守区区域域或或序序列列,如如结结构构域域(domain)和和模模体体(motif),这这些些共共享享结结构构域域和和保保守守模模体体通通常常与与特特定定的的生生物物学学活活性性相相关关,反反映映了了蛋蛋白白质质分分子子的的一一些些重要功能。重要功能。(三)通过生物信息学方法分析蛋白质(三)通过生物信息学方法分析蛋白质结构来预测蛋白质功能结构来预测蛋白质功能目目 录录运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:运用蛋白质序列模体搜索工具预测蛋白质功能的方法是:首先收集现有的蛋白质家族,构造模体数据库;首先收集现有的蛋白质家族,构造模体数据库;而后通过搜索该数据库确定查询序列是否具有可能的序而后通过搜索该数据库确定查询序列是否具有可能的序 列模体,判断该序列是否属于一个已知的蛋白质家族;列模体,判断该序列是否属于一个已知的蛋白质家族;然后根据该蛋白质家族的已知功能预测未知蛋白质的功然后根据该蛋白质家族的已知功能预测未知蛋白质的功能。能。常用的模体数据库有常用的模体数据库有INTERPROSCAN、PROSITE、SMART等。等。目目 录录基因基因组组功能注功能注释释常用数据常用数据库库数据数据库库网址网址描述描述AAThttp:/genome.cs.mtu.edu/aat基因基因组组分析和注分析和注释释工具工具COGhttp:/www.ncbi.nlm.nih.gov/COG/直系同源体簇分析数据直系同源体簇分析数据库库EcoCychttp:/ 录录 现现在在人人们们已已经经越越来来越越清清楚楚地地认认识识到到,生生物物功功能能大大多多不不是是只只由由一一个个或或几几个个基基因因控控制制的的,而而是是通通过过生生物物体体内内众众多多的的分分子子(如如DNADNA、RNARNA、蛋蛋白白质质和和其其他他小小分分子子物物质质)共共同同构构成成的的复复杂杂生生物物网网络络实实现现的的。当当前前生生物物学学面面临临的的巨巨大大挑挑战战之之一一就就是是,了了解解生生物物体体内内复复杂杂的的相相互互作作用用网网络络以以及及它它们们的的动动态态特特征征。要要想想全全面面系系统统地地解解析析这这些些复复杂杂的的生生物物网网络络需需要要大大量量相相关关数数据据的的积积累累,现现代代基基因因芯芯片片、蛋蛋白白质质芯芯片片等等大大规规模模数数据据采采集集技技术术大大大大加加快快了了这这一一进进程程。目目前前人人们们已已经经利利用用生生物物技技术术和和信信息息技技术术建建立立了了各各种种生生物物网网络络数数据据库库和和网网站站,可可为为研研究究者者提提供供基基因因调调控控、信信号号转转导导、代谢途径、蛋白质相互作用等方面的信息。代谢途径、蛋白质相互作用等方面的信息。二、利用生物网络全面系统地了解二、利用生物网络全面系统地了解基因的功能基因的功能 目目 录录 生生物物体体任任何何细细胞胞的的遗遗传传信信息息、基基因因都都是是相相同同的的,但但同同一一个个基基因因在在不不同同组组织织、不不同同细细胞胞中中的的表表达达却却不不相相同同。一一个个基基因因的的表表达达既既影影响响其其他他的的基基因因,又又受受其其他他基基因因的的影影响响,基基因因之之间间相相互互促促进进、相相互互抑抑制制,构构成成一一个个复杂的基因调控网络。复杂的基因调控网络。基基因因调调控控网网络络研研究究就就是是:利利用用生生物物芯芯片片等等高高通通量量技技术术所所产产生生的的大大量量基基因因表表达达谱谱数数据据,以以及及蛋蛋白白质质-DNADNA间间的的相相互互作作用用等等信信息息,结结合合实实验验室室研研究究结结果果,用用生生物物信信息息学学方方法法构构建建基基因因调调控控模模型型,对对某某一一物物种种或或组组织织的的基基因因表表达达关关系系进进行行整整体体性性研研究究,从从而而推推断断基基因因之之间的调控关系,揭示支配基因表达和功能的基本规律。间的调控关系,揭示支配基因表达和功能的基本规律。(一)利用生物网络研究基因调控(一)利用生物网络研究基因调控目目 录录常用基因常用基因转录调转录调控数据控数据库库数据数据库库网址网址描述描述EPD真核生物启真核生物启动动子数据子数据库库http:/www.epd.idb-sib.ch包包含含已已被被实实验验证证明明的的转转录录起起始始位位点点和和组织组织特异性等启特异性等启动动子的一般信息子的一般信息TFD转录转录因子数据因子数据库库http:/www.ifti.org/是是转转录录因因子子及及其其特特性性的的专专门门数数据据库库,收集有关多收集有关多肽肽相互作用信息相互作用信息TRANSFAC数据数据库库http:/www.gene- 录录 信信号号转转导导是是生生物物系系统统的的重重要要生生命命活活动动过过程程,机机体体通通过过信信号号转转导导通通路路中中分分子子之之间间的的相相互互识识别别、联联络络和和相相互互作作用用,实实现现整整体体功功能能上上的的协协调调统统一一。由由于于细细胞胞内内各各种种信信号号通通路路之之间间存存在在着着紧紧密密的的联联系系和和交交叉叉调调控控,形形成成了了非非常常复复杂杂的的信信号号转转导导网网络络。信信号号转转导导网网络络研研究究的的目目的的是是期期望望通通过过建建立立细细胞胞信信号号传传导导过过程程的的模模型型,找找出出参参与与此此过过程程的的各各个个蛋蛋白白质质间间的的相相互互作作用用关关系系,阐阐明明其其在在基基因因调控、疾病发生中的作用。调控、疾病发生中的作用。生生物物信信息息学学方方法法利利用用已已知知数数据据和和生生物物学学知知识识进进行行通通路路推推断断,可可以以帮帮助助阐阐释释信信号号分分子子作作用用机机制制,辅辅助助实实验验设设计计,节节省省大大量量的的人人力力物物力力。有有关关信信号号转转导导通通路路的的网网上上数数据库资源较多据库资源较多 。(二)利用生物网络研究信号转导(二)利用生物网络研究信号转导目目 录录常用信号通路数据常用信号通路数据库库数据数据库库网址网址描述描述Biocartahttp:/信号通路信号通路图图片及注片及注释释数据数据库库Reactomehttp:/www.reactome.org 生物核心通路及反生物核心通路及反应应的挖掘知的挖掘知识库识库 PIDhttp:/pid.nci.nih.gov 从其他数据从其他数据库导库导入及文献挖掘的人入及文献挖掘的人信号通路数据信号通路数据库库 STKEhttp:/stke.sciencemag.org 参与信号参与信号转导转导的分子及其相互作用的分子及其相互作用关系的信息关系的信息 AfCShttp:/www.signaling-gateway.org 参与信号通路的蛋白参与信号通路的蛋白质质相互作用和相互作用和信号通路信号通路图图 DOQCShttp:/doqcs.ncbs.res.in 细细胞信号通路的量化数据胞信号通路的量化数据库库,提供提供反反应应参数及注参数及注释释信息信息 SigPathhttp:/sigpath.org 提供提供细细胞信号通路的量化信息胞信号通路的量化信息 目目 录录 代代谢谢网网络络处处于于生生物物体体的的功功能能执执行行阶阶段段,其其结结构构组组成成方方式式反反映映了了生生物物体体的的功功能能构构成成。代代谢谢网网络络把把细细胞胞内内所所有有生生化化反反应应表表示示为为网网络络形形式式,反反映映了了代代谢谢活活动动中中所所有化合物及酶之间的相互作用。有化合物及酶之间的相互作用。通通过过基基因因组组注注释释信信息息可可以以识识别别出出编编码码催催化化生生物物体体内内生生化化反反应应的的酶酶的的基基因因,结结合合相相关关的的酶酶反反应应数数据据库库就就可可以以预预测测物物种种特特异异的的酶酶基基因因、酶酶以以及及酶酶催催化化反反应应,由由此此产产生生了了许许多多优优秀秀的的代代谢谢数数据据库库,可可以以方方便便地地检检索索某某一一生生物代谢网络中的代谢反应。物代谢网络中的代谢反应。(三)利用生物网络研究代谢途径(三)利用生物网络研究代谢途径目目 录录常用代常用代谢谢网网络络数据数据库库数据数据库库网址网址描述描述KEGGhttp:/www.genome.ad.jp/kegg/包括了包括了700个以上物种的代个以上物种的代谢谢、信号、信号转导转导、基因、基因调调控、控、细细胞胞过过程的通路程的通路BioCychttp:/www.biocyc.org/包括了包括了260个物种的代个物种的代谢谢通路及基因通路及基因组组数据数据PUMA2http:/compbio.mcs.anl.gov/puma2/存放了存放了预预先先计计算的超算的超过过200个物种的个物种的代代谢谢通路信息通路信息BioSilicohttp:/biosilico.kaist.ac.kr:8017/biochemdb/index.jsp整合信息的数据整合信息的数据库库,提供,提供对对多个代多个代谢谢数据数据库库的的访问访问目目 录录(四)利用生物网络研究蛋白质相互作用(四)利用生物网络研究蛋白质相互作用 从从某某种种程程度度上上可可以以说说,细细胞胞进进行行的的生生命命活活动动,是是蛋蛋白白质质在在一一定定条条件件下下相相互互作作用用的的结结果果,若若蛋蛋白白质质相相互互作作用用网网络络被被破破坏坏或或稳稳定定性性丢丢失失,会会引引起起细细胞胞的的功功能能性性障障碍碍。阐阐明明蛋蛋白白质质相相互互作作用用的的完完整整网网络络结结构构,有有助助于于从系统的角度加深对细胞结构和功能的认识。从系统的角度加深对细胞结构和功能的认识。近近年年来来各各种种预预测测蛋蛋白白质质相相互互作作用用的的计计算算方方法法被被不不断断提提出出,将将这这些些方方法法与与实实验验方方法法结结合合,挖挖掘掘出出了了蛋蛋白白质质相相互互作作用用网网络络中中更更多多的的相相互互作作用用节节点点,目目前前已已有有多多个个蛋蛋白白质质相相互互作作用用的的数数据据库库应应运运而而生生,可可用用来来研研究究蛋蛋白质相互作用的生物学过程白质相互作用的生物学过程 。目目 录录常用蛋白常用蛋白质质互作网互作网络络数据数据库库数据数据库库网址网址描述描述BINDhttp:/www.bind.ca 提供参与通路的分子的序列和相互作用信息提供参与通路的分子的序列和相互作用信息 DIPhttp:/dip.doe-mbi.ucla.edu专门专门存放存放实验实验确定的蛋白确定的蛋白质质之之间间相互作用的相互作用的数据数据,既包括既包括经经典典实验实验手段也包括高通量手段也包括高通量实验实验手段确定的蛋白手段确定的蛋白质质相互作用数据相互作用数据STRINGhttp:/string.embl.de存存储实验储实验确定的和确定的和预测预测得到的蛋白得到的蛋白质质相互作相互作用数据,并用数据,并对对各种各种预测预测方法得到的方法得到的结结果的准果的准确性确性给给出了相出了相应应的的权权重重MIPShttp:/mips.gsf.de包括酵母和哺乳包括酵母和哺乳动动物的物的PPI,可靠性很高可靠性很高,被作被作为为准金准金标标准使用准使用Yeast Interactomehttp:/structure.bu.edu/rakesh/myindex.html综综合多种来源的由酵母双合多种来源的由酵母双杂杂交技交技术术确定的酵确定的酵母母PPI数据集数据集,利用基因表达信息、蛋白利用基因表达信息、蛋白亚细亚细胞定位信息以及已知的各种知胞定位信息以及已知的各种知识对识对其其进进行行验验证证形成高可信度的相互作用数据形成高可信度的相互作用数据目目 录录三、复杂疾病的生物信息学研究策略三、复杂疾病的生物信息学研究策略 包括信息提取、分析和建模包括信息提取、分析和建模 癌癌症症、糖糖尿尿病病、高高血血压压等等复复杂杂疾疾病病对对人人类类健健康康影影响响巨巨大大,这这类类疾疾病病的的发发病病机机制制一一般般与与多多种种遗遗传传或或非非遗遗传传因因素素,以以及及它它们们之之间间的的相相互互作作用用有有关关,不不能能通通