《生物芯片分析》PPT课件.ppt
Bioinformatics,2010-2011 Bioinformatics,2010-2011 生物芯片生物芯片生物芯片生物芯片(BiochipBiochip)武汉大学生物医学工程系武汉大学生物医学工程系赵赵 旻旻Bioinformatics,2010-2011Bioinformatics,2010-2011本章提纲本章提纲r生物芯片简介与沿革r生物芯片的分类r基因芯片基本原理、流程与应用r蛋白质芯片及应用r其它芯片技术Bioinformatics,2010-2011Bioinformatics,2010-2011第一节 生物芯片简介与沿革什么是生物芯片?生物芯片(Biochip)主要指通过平面微细加工技术,在固体芯片表面等载体上的微型生物化学分析系统,以实现对细胞、蛋白质、核酸以及其他生物组分的准确、快速、大信息量的检测。Bioinformatics,2010-2011Bioinformatics,2010-2011 芯片上每平方厘米可密集排列成千上万个生物分子(Microarray),能快速准确地检测细胞、蛋白质、DNA及其他生物组分,并获取样品中的有关信息,其效率是传统检测方法的成百上千倍。Bioinformatics,2010-2011Bioinformatics,2010-2011生物芯片分析基本流程试样处理试样处理点阵固定点阵固定反应或杂交芯片制作标记洗涤检测扫描检测扫描光刻合成微量点样喷墨纯化、标记光化学检测电化学检测计算处理Bioinformatics,2010-2011Bioinformatics,2010-2011建立建立r1996年美国Affymetrix公司成功地制作出世界上首批用于药物筛选和实验室试验用的生物芯片,并制作出相应的芯片系统。此外,美国的Hyseq公司、Aurora公司、Nanogen公司、Incyte公司等也在积极开展DNA芯片研究工作。近二年,摩托罗拉、惠普、IBM等跨国公司也相继投以巨资加入生物芯片的研究开发。Bioinformatics,2010-2011Bioinformatics,2010-2011r中国在生物芯片领域起步较晚,我国是从一九九七年才开始对生物芯片研究,而国外从八十年代起就开始研制生物芯片。r中国医药生物技术协会生物芯片分会国际生物芯片领域的第一个行业性组织2006在北京成立。r中国在北京、上海、陕西、天津、南京建立了五大生物芯片研发和产业化基地。r我国生物芯片产业尚未形成统一的技术标准,不规范。在产品认证认可方面也存在与国际惯例不接轨的情况。Bioinformatics,2010-2011 Bioinformatics,2010-2011 第二节第二节 生物芯片的分类生物芯片的分类Bioinformatics,2010-2011Bioinformatics,2010-2011一般分类一般分类Bioinformatics,2010-2011Bioinformatics,2010-2011根据用途还可以把生物芯片分为两类:根据用途还可以把生物芯片分为两类:信息生物芯片信息生物芯片和和功能生物芯片功能生物芯片Bioinformatics,2010-2011 Bioinformatics,2010-2011 第三节第三节第三节第三节 基因芯片基因芯片基因芯片基因芯片 基本原理、流程与应用基本原理、流程与应用Bioinformatics,2010-2011Bioinformatics,2010-2011本本节节内容提要内容提要1.简介简介2.图像处理与数据标准化图像处理与数据标准化3.基因芯片的数据分析基因芯片的数据分析4.芯片芯片工具工具&数据库数据库Bioinformatics,2010-2011Bioinformatics,2010-2011简介简介基因芯片基因芯片(Gene chip)技技术术是指通是指通过过微微阵阵列列(Microarray)技技术术将高密度将高密度DNA片段片段阵阵列通列通过过高速机器人或原位合成方式以一定的高速机器人或原位合成方式以一定的顺顺序序或排列方式使其附着在如玻璃片等固相表面,或排列方式使其附着在如玻璃片等固相表面,以以荧荧光光标记标记的的DNA探探针针,借助碱基互,借助碱基互补杂补杂交交原理,原理,进进行大量的基因表达及行大量的基因表达及检测检测等研究的等研究的技技术术。Bioinformatics,2010-2011Bioinformatics,2010-2011基因芯片发展历史基因芯片发展历史Southern&Northern Southern&Northern BlotBlotDot Dot BlotBlotMacroarrayMacroarrayMicroarrayMicroarrayBioinformatics,2010-2011Bioinformatics,2010-2011基因芯片基因芯片1.根据免疫测定的根据免疫测定的(immunoassay)的方法的方法 予以改进予以改进2.高通量、点阵以及高通量、点阵以及Northern杂交杂交3.同时测定细胞内数千个基因的表达情况同时测定细胞内数千个基因的表达情况4.芯片的体积非常小:微量样品的检测芯片的体积非常小:微量样品的检测5.基因表达情况的定量分析基因表达情况的定量分析Bioinformatics,2010-2011Bioinformatics,2010-2011基因芯片的原理基因芯片的原理 依据双螺旋原理,核酸分子依据双螺旋原理,核酸分子杂杂交技交技术术,在靶在靶标样标样品与探品与探针针之之间进间进行行选择选择性反性反应应,将反将反应应一方一方(探探针针)固定在芯片上,另一方固定在芯片上,另一方(荧荧光光标记标记,即制即制备备好的好的cDNA,分,分别标记绿别标记绿色的色的Cy3和和红红色的色的Cy5)通通过过流路或加至芯流路或加至芯片上。片上。Bioinformatics,2010-2011Bioinformatics,2010-2011核酸杂交核酸杂交RNADNA1DNA2ProbeSouthernhybridizationNorthernhybridizationJuang RH(2004)BCbasicsBioinformatics,2010-2011Bioinformatics,2010-2011基因芯片的密度:基因芯片的密度:基因芯片的密度:基因芯片的密度:100-1 million DNA 100-1 million DNA 探针探针探针探针/1cm/1cm2 2将样品中的将样品中的DNA/RNA表上荧表上荧光标记,则可以定量检验基光标记,则可以定量检验基因的表达水平因的表达水平碱基互补碱基互补Bioinformatics,2010-2011Bioinformatics,2010-2011基因芯片流程基因芯片流程样品制备样品制备芯片制备芯片制备杂交杂交杂交信号检测杂交信号检测数据分析数据分析Bioinformatics,2010-2011Bioinformatics,2010-2011实验流程实验流程Bioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011基因表达情况的定量测定基因表达情况的定量测定1.发现在特定生长时期,或者随着环境变化,那些发现在特定生长时期,或者随着环境变化,那些基因的表达收到诱导或者抑制基因的表达收到诱导或者抑制2.在相同条件下,上调或者下调变化规律相似的基在相同条件下,上调或者下调变化规律相似的基因,可能具有功能上的关联因,可能具有功能上的关联3.可以从共表达的基因中寻找调控模体可以从共表达的基因中寻找调控模体4.基因表达的模式可以用来表征异常的细胞调控,基因表达的模式可以用来表征异常的细胞调控,例如,癌症的诊断例如,癌症的诊断Bioinformatics,2010-2011Bioinformatics,2010-2011基因芯片分类基因芯片分类r按芯片制备方法分类按芯片制备方法分类 原位合成芯片(原位合成芯片(synthetic genechip)DNA微阵列芯片(微阵列芯片(DNA microarray)r按探针分类按探针分类 寡核苷酸阵列(芯片)寡核苷酸阵列(芯片)DNA阵列阵列 基因芯片基因芯片 cDNA芯片芯片 RNA芯片芯片Bioinformatics,2010-2011Bioinformatics,2010-2011Comparison of DNA Chip Technologies Sensitivity of DNA chip based assays is a function of:|Probe and target DNA/RNA(Complexity)|Chip surface(autofluorescence&non-spec.bkg)|Attachment chemistry/methodology(hyb.efficiency&crosshyb.)|Hybridization efficiency(lots of factors)|Detection technology(signal type,efficiency,noise)Oligo-Chip Oligo-Chip cDNA-Chip cDNA-Chip Genomic Chip Genomic Chip 8 n or 20 n 8 n or 20 n 50,000 n 50,000 nsequencingsequencingexpressionexpressionexpressionexpressiongenomic analysisgenomic analysisBioinformatics,2010-2011Bioinformatics,2010-2011基因芯片技术的类型基因芯片技术的类型按技术手段、探针类型分类按技术手段、探针类型分类1.Short oligonucleotide arrays(Affymetrix)2.cDNA arrays(Brown/Botstein)3.Long oligo arrays(Agilent)4.Serial analysis of gene expression(SAGE)按实验要求分类按实验要求分类1.单通道单通道(Single Channel):一次检验一种状态一次检验一种状态 2.双通道双通道(Dual Channel):差异表达基因的筛选差异表达基因的筛选Bioinformatics,2010-2011Bioinformatics,2010-20111 片上原位合成寡核苷酸点阵芯片(片上原位合成寡核苷酸点阵芯片(ONA)2 微量点样技术制作的微量点样技术制作的CDNA 点阵芯片(点阵芯片(CDA)ONA特点特点:(1)易寻址,易寻址,利用组合化学的原理安排各寡核苷酸利用组合化学的原理安排各寡核苷酸的位点,芯片反应后易寻址;的位点,芯片反应后易寻址;(2)点位牢固,)点位牢固,用表面化学方法处理基片用表面化学方法处理基片(玻璃、玻璃、硅片、尼龙片硅片、尼龙片),使核苷酸固定在基片上;,使核苷酸固定在基片上;(3)定点合成,)定点合成,光导向平板印刷技术,芯片表面可光导向平板印刷技术,芯片表面可用屏蔽物屏蔽,光照选择性脱保护,有利于定点用屏蔽物屏蔽,光照选择性脱保护,有利于定点合成寡核苷酸中的各个碱基;目前技术:合成寡核苷酸中的各个碱基;目前技术:1.6cm2;40万个点;万个点;20个个核苷酸;核苷酸;Bioinformatics,2010-2011Bioinformatics,2010-2011两类主流的两类主流的DNA芯片芯片1.cDNA microarrays:将将5005,000bp的的cDNA固固载到介质上载到介质上(例如玻璃例如玻璃),Stanford开发设计,通开发设计,通常为双通道常为双通道2.DNA chips:将寡核苷酸探针将寡核苷酸探针(2080-mer)合成合成到芯片上,到芯片上,Affymetrix开发设计,通常为单通道开发设计,通常为单通道Bioinformatics,2010-2011Bioinformatics,2010-2011(1)cDNA microarrayscDNA clonesBioinformatics,2010-2011Bioinformatics,2010-2011Robot spotter普通的盖玻片普通的盖玻片cDNA microarrays的制备的制备Bioinformatics,2010-2011Bioinformatics,2010-2011差异表达基因的筛选差异表达基因的筛选Treatment/controlNormal/tumor tissueBrain/liverBioinformatics,2010-2011Bioinformatics,2010-2011点样后的点样后的cDNA MicroarraysBioinformatics,2010-2011Bioinformatics,2010-2011GenesmRNA samplesGene expression level of gene i in mRNA sample j=Log(Red intensity/Green intensity)Log(Avg.PM-Avg.MM)sample1 sample2 sample3 sample4 sample5 1 0.46 0.30 0.80 1.51 0.90.2-0.10 0.49 0.24 0.06 0.46.3 0.15 0.74 0.04 0.10 0.20.4-0.45-1.03-0.79-0.56-0.32.5-0.06 1.06 1.35 1.09-1.09.基因表达的数据基因表达的数据Bioinformatics,2010-2011Bioinformatics,2010-2011(1)DNA chipsBioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011Bioinformatics,2010-2011DNA chipsDNA chips的制备:的制备:的制备:的制备:Affymetrix photolitographyAffymetrix photolitographyr探针长度:探针长度:25 bpr每个基因:每个基因:22-40个探针个探针rPerfect Match(PM)vs.MisMatch(MM)probesBioinformatics,2010-2011Bioinformatics,2010-2011点样后的点样后的Gene chipBioinformatics,2010-2011Bioinformatics,2010-2011总结总结Bioinformatics,2010-2011Bioinformatics,2010-2011基因芯片的实验流程基因芯片的实验流程Bioinformatics,2010-2011Bioinformatics,2010-20112.图像处理与数据标准化图像处理与数据标准化单单通道基因芯片通道基因芯片 white(very high)red(high)Yellow(a little high)green(medium)blue(low)black(no)Bioinformatics,2010-2011Bioinformatics,2010-2011图像处理图像处理植根区域生长法植根区域生长法(SRG)Fixed Circle1.栅格化:确定点的位置栅格化:确定点的位置2.图象分割图象分割(Segmentation):将点从背景中分离出来。:将点从背景中分离出来。3.抽提亮度:各个像素亮度的平均值抽提亮度:各个像素亮度的平均值(mean)或中位数或中位数(median)4.背景校正:局部或全局背景校正:局部或全局Bioinformatics,2010-2011Bioinformatics,2010-2011基因表达量的定量基因表达量的定量对于每个点,我们可以计算对于每个点,我们可以计算 Red intensity =Rfg-Rbgfg=foreground,bg=background,and Green intensity=Gfg-Gbgand combine them in the log(base 2)ratio Log2(Red intensity/Green intensity)Green intensity(medium):1Bioinformatics,2010-2011Bioinformatics,2010-2011Microarray:误差的来源误差的来源r系统的系统的r随机的随机的 log signal intensity log RNA abundanceBioinformatics,2010-2011Bioinformatics,2010-2011Microarray:误差的来源误差的来源1.图图像分析像分析2.扫扫描描3.DNA杂杂交交过过程程,温度、温度、时间时间、混合均匀程度等、混合均匀程度等4.探探针针的的标记标记5.RNA的抽提的抽提6.加加样样7.其他其他Bioinformatics,2010-2011Bioinformatics,2010-2011Red/green 比值比值存在亮度的倾向存在亮度的倾向M=log2R/G =log2R-log2G=(log2R+log2G)/2Values should scatter about zero.Bioinformatics,2010-2011Bioinformatics,2010-2011数据标准化数据标准化beforeafterBioinformatics,2010-2011Bioinformatics,2010-20113.基因芯片的数据分析基因芯片的数据分析(1)差异表达基因的分析差异表达基因的分析(2)基因共表达分析基因共表达分析(3)基因表达数据的聚类基因表达数据的聚类(4)基因表达数据的分类基因表达数据的分类(5)Map to GO(6)Gene regulatory networkBioinformatics,2010-2011Bioinformatics,2010-2011(1)差异表达基因的分析差异表达基因的分析1.差异表达基因的分析差异表达基因的分析:寻找处理前后表达上调或者寻找处理前后表达上调或者下调的基因下调的基因2.Are the treatments different?3.使用标准的统计学方法检验使用标准的统计学方法检验(t-test or f-test),发,发现统计显著性差异表达的基因,现统计显著性差异表达的基因,4.如果处理本身并不显著,则结果无意义如果处理本身并不显著,则结果无意义Bioinformatics,2010-2011Bioinformatics,2010-2011统计学分析统计学分析r1.Fold change,一般一般2-fold increase or decrease(平行实验的样本较少平行实验的样本较少)r2.p-value(平行实验的样本较多平行实验的样本较多)under-expressedover-expressed/2/2Bioinformatics,2010-2011Bioinformatics,2010-2011P-value:学生分布学生分布r1.T-test:学生分布学生分布r2.Excel函数:函数:TTEST(array1,array2,tails,type)|Array1为第一个数据集为第一个数据集|Array2为第二个数据集为第二个数据集|Tails指示分布曲线的尾数。如果指示分布曲线的尾数。如果 tails=1,函数,函数 TTEST 使用单尾分布。如果使用单尾分布。如果 tails=2,函数,函数 TTEST 使使用双尾分布用双尾分布|Type为为 t 检验的类型检验的类型1 成对成对 2 等方差双样本检验等方差双样本检验 3 异方差双样本检验异方差双样本检验 Bioinformatics,2010-2011Bioinformatics,2010-2011P-value:学生分布学生分布r1.一般选择双尾分布一般选择双尾分布r2.异方差双样本检验异方差双样本检验r3.Excel函数:函数:=TTEST(B2:D2,E2:G2,2,3)r4.C:对照组;:对照组;T:实验组:实验组Bioinformatics,2010-2011Bioinformatics,2010-2011Multiple Comparisons1.在基因芯片的实验中,每一个基因在基因芯片的实验中,每一个基因/探针,都是一个探针,都是一个独立的实验独立的实验2.基因芯片:高通量,基因芯片:高通量,1,000个基因个基因/探针探针3.因此,无论怎么比较,总会有一些基因会是统计显因此,无论怎么比较,总会有一些基因会是统计显著性差异表的著性差异表的 可能是随机产生的可能是随机产生的4.如何评估表达差异基因预测的有效性?如何评估表达差异基因预测的有效性?5.例:例:1,000个探针的双通道芯片,以个探针的双通道芯片,以p-value 0.01为域值,发现为域值,发现7个上调基因,个上调基因,5个下调基因,分析结个下调基因,分析结果是否具有统计学意义?果是否具有统计学意义?Bioinformatics,2010-2011Bioinformatics,2010-2011False Discovery Rate(FDR)1.False positive prediction:“Type 1 error or False Discovery2.False Discovey Rate(FDR)=p-value*No.of Genes上例:上例:FDR=0.01*1,000=10(随机随机)7个上调基因,个上调基因,5个下调基因个下调基因 10因此上例计算的结果无统计学意义因此上例计算的结果无统计学意义3.FDR必须远小于发现的差异表达基因数目必须远小于发现的差异表达基因数目实验的有效性实验的有效性p-value的选择的选择Bioinformatics,2010-2011Bioinformatics,2010-2011(2)基因共表达分析基因共表达分析1.在在N个不同的条件下个不同的条件下(时间序列的芯片数据时间序列的芯片数据),考察基,考察基因因X和和Y的表达是否相似的表达是否相似2.Gene 1#是否与是否与Gene 2#、Gene 3#和和Gene 4#共表共表达?达?3.共表达:共表达:正相关:相似的表达谱,可能存在正关联正相关:相似的表达谱,可能存在正关联负相关:相反的表达谱,可能存在负调控负相关:相反的表达谱,可能存在负调控Eisen MB,et al.,(1998)PNAS 95:14863-14868Bioinformatics,2010-2011Bioinformatics,2010-2011没有相关性?没有相关性?Bioinformatics,2010-2011Bioinformatics,2010-2011基因相关性分析基因相关性分析r1.Spearman rank correlationr2.Kendalls taur3.Euclidean distancer4.Pearson correlation coefficient:-1 1rExcel函数:函数:=PEARSON(array1,array2)Eisen MB,et al.,(1998)PNAS 95:14863-14868Bioinformatics,2010-2011Bioinformatics,2010-2011Pearson相关系数相关系数r1.r -1,1|r 1,正相关,正相关|r-1,负相关,负相关r结论:Gene 1#与Gene 2#表达正相关,与Gene 3#表达负相关,与Gene 4#无关联Bioinformatics,2010-2011Bioinformatics,2010-2011(3)基因表达数据的聚类基因表达数据的聚类r1.将表达谱相似的基因聚类在一起将表达谱相似的基因聚类在一起r2.无督导学习无督导学习(unsupervised learning)r3.Pattern finding:发现新的模式发现新的模式r4.聚类方法:聚类方法:|A.Hierarchical clustering|B.K-means clusteringHierarchical ClusteringBioinformatics,2010-2011Bioinformatics,2010-2011Hierarchical clusteringr1.用树状结构来表征基因表用树状结构来表征基因表达之间的相似性达之间的相似性/相关性相关性r2.优点:不需要指定结果有优点:不需要指定结果有多少类多少类Distance matrixBioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr1.对数据进行聚类对数据进行聚类r2.必须给定结果分成必须给定结果分成多少类!多少类!r3.假设,该例中,指假设,该例中,指定为聚成定为聚成5类类Bioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr1.随便选取随便选取5个点,个点,作为每一个类的中作为每一个类的中心点心点Bioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr2.计算其他点与这计算其他点与这5个中心点的个中心点的距离距离r距离:距离:|欧氏距离欧氏距离|马氏距离马氏距离|皮尔孙相关系数皮尔孙相关系数r点的归类:离哪个中点的归类:离哪个中心点近,归哪个类心点近,归哪个类Bioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr3.针对每一类中的每针对每一类中的每一个点,计算其与其一个点,计算其与其他点的距离,加和,他点的距离,加和,除以该类点的数目;除以该类点的数目;r找到新的中心点,即找到新的中心点,即改点到该类中其他点改点到该类中其他点的平均值最小;的平均值最小;r确定新的确定新的5个中心点!个中心点!Bioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr4.重复重复2,3,直到结,直到结果收敛果收敛r实际操作时,因结果实际操作时,因结果完全收敛时间过长,完全收敛时间过长,一般指定迭代的次数,一般指定迭代的次数,如如1,000次次Bioinformatics,2010-2011Bioinformatics,2010-2011K-means clusteringr5.最终结果:所有基最终结果:所有基因芯片数据被聚成因芯片数据被聚成5类类r软件:软件:Cluster 3.0,Michael Eissen,StanfordBioinformatics,2010-2011Bioinformatics,2010-2011(4)基因表达数据的分类基因表达数据的分类r1.根据基因表达的数据将样本分成两类或多类;根据基因表达的数据将样本分成两类或多类;r2.督导学习督导学习(supervised learning):根据发现:根据发现的的pattern进行预测进行预测r3.应用:应用:|癌症癌症 vs.正常组织正常组织|癌症的亚型、不同阶段癌症的亚型、不同阶段(良性的良性的 vs.恶性的恶性的)|对药物的敏感性对药物的敏感性(tamoxifen for breast cancer)Bioinformatics,2010-2011Bioinformatics,2010-2011Diffuse large B-cell lymphoma(DLBCL)1.通过聚类发现各种亚型之通过聚类发现各种亚型之间的关系间的关系2.根据基因表达模式,能够根据基因表达模式,能够预测新的基因表达样本预测新的基因表达样本Bioinformatics,2010-2011Bioinformatics,2010-2011(5)Map to GOr1.通过基因芯片,找到了一批通过基因芯片,找到了一批“interesting”的基因的基因r2.生物学功能上是否存在关联?生物学功能上是否存在关联?|某种功能是否显著?某种功能是否显著?r3.Gene Ontology+超几何分布超几何分布Bioinformatics,2010-2011Bioinformatics,2010-2011GOToolBoxBioinformatics,2010-2011Bioinformatics,2010-2011(6)Gene regulatory networkr1.早期观点:表达谱相似的基因可能存在早期观点:表达谱相似的基因可能存在功能上的关联,可能相互作用功能上的关联,可能相互作用(直接作用直接作用)r2.当前的观点:表达谱相似的基因可能具当前的观点:表达谱相似的基因可能具有共同的调控元件有共同的调控元件(基因基因UTR区域存在共同区域存在共同的的Promotor),能够被同一个上游因子所调能够被同一个上游因子所调控控Bioinformatics,2010-2011Bioinformatics,2010-2011相关系数:基因共表达网络相关系数:基因共表达网络ERL2SKP1UnknownChS1Wild-typeMutantr1.与光合效率和气孔发育相关的基因:与光合效率和气孔发育相关的基因:ERL2|A.在在Wild-type中与之显著相关,但在中与之显著相关,但在Mutant中显著不中显著不相关的基因相关的基因Bioinformatics,2010-2011Bioinformatics,2010-2011相关系数:基因共表达网络相关系数:基因共表达网络Bioinformatics,2010-2011Bioinformatics,2010-20114.Microarray:工具工具&数据库数据库Bioinformatics,2010-2011Bioinformatics,2010-2011GEO-NCBIBioinformatics,2010-2011Bioinformatics,2010-2011Array Express-EMBLBioinformatics,2010-2011Bioinformatics,2010-2011SMD-StanfordBioinformatics,2010-2011Bioinformatics,2010-2011芯片技术的应用芯片技术的应用1 基因表达分析:基因表达分析:分析基因表达时空特征分析基因表达时空特征 检测基因差异表达检测基因差异表达 发现新基因发现新基因 大规模测序大规模测序Bioinformatics,2010-2011Bioinformatics,2010-2011DNA序列测定:序列测定:杂交测序:杂交测序:sequencing by hybridization,SBH 建立在特定序列的建立在特定序列的DNA与特定长度的寡核苷与特定长度的寡核苷酸集合的杂交的基础之上。未知酸集合的杂交的基础之上。未知DNA序列可以通序列可以通过鉴定与靶过鉴定与靶DNA序列形成完整的双链体寡核苷酸序列形成完整的双链体寡核苷酸的重叠区域来确定;的重叠区域来确定;65536个八核苷酸点阵可测个八核苷酸点阵可测定约定约200个核苷酸的序列;一百万个十二核苷酸个核苷酸的序列;一百万个十二核苷酸点阵可测定约点阵可测定约1000个碱基对。个碱基对。Bioinformatics,2010-2011Bioinformatics,2010-20112 基因型、基因突变和多态性分析基因型、基因突变和多态性分析 分析基因组中不同基因与性状或疾病的关系分析基因组中不同基因与性状或疾病的关系 3 疾病的诊断与治疗疾病的诊断与治疗 遗传病相关基因的定位遗传病相关基因的定位:产前筛查与诊断产前筛查与诊断 肿瘤诊断肿瘤诊断 感染性疾病的诊断感染性疾病的诊断 基因突变检测与遗传病和肿瘤诊断基因突变检测与遗传病和肿瘤诊断大量平行测定。大量平行测定。Bioinformatics,2010-2011Bioinformatics,2010-2011 4.药物研究中的应用药物研究中的应用 r 新药开发新药开发 r 发现药物的新功能发现药物的新功能 r 调查药物处理细胞后基因的表达情况调查药物处理细胞后基因的表达情况 r 对药物进行毒性评价对药物进行毒性评价 r 在基因水平上寻找药物靶标,毒性对基因在基因水平上寻找药物靶标,毒性对基因的影响。的影响。Bioinformatics,2010-2011Bioinformatics,2010-2011其它:其它:病原体的检出病原体的检出肿瘤相关基因表达谱肿瘤相关基因表达谱 位点突变位点突变 耐药基因检测耐药基因检测 疾病的分子分型疾病的分子分型 HLA分型分型Bioinformatics,2010-2011Bioinformatics,2010-2011细胞凋亡PCR芯片细胞周期PCR芯片血管生成PCR芯片肿瘤转移PCR芯片癌通路发现者PCR芯片DNA损伤信号通路PCR芯片氧化应激与抗氧化PCR芯片应激和毒性通路发现者PCR芯片肿瘤药物耐受和代谢PCR芯片细胞因子PCR芯片乳腺癌和雌激素受体信号通 路PCR芯片药物代谢PCR芯片内皮细胞生物学功能研PCR芯片骨再生PCR芯片干细胞PCR芯片动脉粥样硬化PCR芯片糖尿病PCR芯片趋化因子与受体PCR芯片Bioinformatics,2010-2011Bioinformatics,2010-2011r生生长长因子因子PCR芯片芯片r炎症炎症细细胞因子与受体胞因子与受体PCR芯片芯片r干干扰扰素及其受体素及其受体PCR芯片芯片rTh1-Th2-Th3PCR芯片芯片rToll样样蛋白受体信号蛋白受体信号转导转导PCR芯片芯片r细细胞外基胞外基质质与粘与粘连连分子分子PCR芯片芯片r神神经营经营养素与受体养素与受体PCR芯片芯片r低氧信号通路低氧信号通路PCR芯片芯片Bioinformatics,2010-2011Bioinformatics,2010-2011r胰胰岛岛素信号通路素信号通路PCR芯片芯片rJAK/STAT信号通路信号通路PCR芯片芯片rMAPK信号信号转导转导通路通路PCR芯片芯片rNF-kB信号通路信号通路PCR芯片芯片r一氧化氮一氧化氮PCR芯片芯片rNotch信号通路信号通路PCR芯片芯片r信号信号转导转导通路通路发现发现者者PCR芯片芯片rTGFb/BMP信号通路信号通路PCR芯片芯片rTNF配体及受体配体及受体PCR芯片芯片rWnt信号通路信号通路PCR芯片芯片r管家管家PCR芯片芯片Bioinformatics,2010-2011 Bioinformatics,2010-2011 第四节第四节第四节第四节 蛋白质芯片蛋白质芯片蛋白质芯片蛋白质芯片Bioinformatics,2010-2011Bioinformatics,2010-2011r蛋白蛋白质质芯片芯片:又称:又称为为蛋白蛋白质阵质阵列列或或蛋白蛋白质质微微阵阵列列(protein microarray)蛋白质芯片是指在固相支持物上有序排列的蛋白质芯片是指在固相支持物上有序排列的各自独立的多肽、蛋白或相应配体,利用蛋白质各自独立的多肽、蛋白或相应配体,利用蛋白质与蛋白质、蛋白质与与蛋白质、蛋白质与DNADNA、蛋白质与