免疫学检测中的曲线拟合.ppt
免疫测定中的数据处理与免疫测定中的数据处理与曲线拟合曲线拟合n免疫测定中的数据处理n数据处理与科学作图免疫测定中的数据处理与曲线拟合免疫测定中的数据处理与曲线拟合免疫测定的数据处理及结果报告免疫测定的数据处理及结果报告l临床免疫检测技术临床免疫检测技术:RIA和EIA等;l数据处理的意义和目标数据处理的意义和目标:只有在测定结果以一种有意义的方式报告时,测定结果才有用;免疫测定结果的客观评价,对改善免疫测定的重复性以及免疫测定的标准化都有重要意义。l数据处理报告的要求数据处理报告的要求:通俗易懂;定性结果明确,定量范围明确;处理后得到的数据要具有可重复性;试验的评价不能建立在假定的正态分布上;结果具有用于进一步分析处理(如流行病学)的充分性。l免疫测定以其测定结果的表达方式免疫测定以其测定结果的表达方式:定性,定量两类。定性测定定性测定-“有有”或或“无无”l判定结果判定结果:阴性,阳性。l判定依据判定依据:cut-off值,S/N or P/N比值。l判断依据确立原则判断依据确立原则:尽可能避免假阳性和假阴性结果的出现。l应用应用:传染性病原体的血清标志物检测。定性测定数据处理-cut-off值的确定相关概念:ELISAELISA测定的测定的“灰区灰区”-阳性判断值的确定就是要使以其得到的测定结果的假阳性和假阴性的发生率最低,处于阳性判断值定值域中的测定结果可归为可疑,亦即ELISA测定的“灰区”。定性测定数据处理-cut-off值的确定Cut-off Cut-off 值设定的一般方法:值设定的一般方法:1.1.标准差比率标准差比率 standard deviation ratio,SDR2.2.测定标本对阴性比值测定标本对阴性比值(P/N or S/N)test to negative ratio,TNR3.3.以阴性对照均值以阴性对照均值+2+2或或3 3SD作为作为cut-off值值4.4.综合阴性对照均值综合阴性对照均值+2+2或或3 3SD及阳性对照及阳性对照-2-2或或3 3SD建立建立cut-off值值5.5.综合阴性对照均值综合阴性对照均值+2+2或或3 3SD及阳性对照及阳性对照-2-2或或3 3SD和转化血清结果建立和转化血清结果建立cutoff值值6.6.百分位数法百分位数法7.7.相对单位相对单位(relative units,EIU):标本标本EIU=8.8.双质控双质控(double control,2C):0.18X0.18X(阴性质控物中值(阴性质控物中值+阳性质控物中值)阳性质控物中值)9.9.使用使用ROC曲线设定曲线设定cut-off值值 标本测定值参考样本(弱阳性质控)测定值使用使用ROC曲线设定曲线设定cut-off 值:值:lROC曲线曲线:横坐标为假阳性率FPR=假阳性数/(假阳性+真阴性)纵坐标为真阳性率TPR=真阳性数/(真阳性+假阴性)根据这种关系确定区分正常与异常的分界点究竟在何处最合适,也就是说此时的假阳性和假阴性率最低或比例最适当或最为符合使用目的,该分界点即可作为ELISA cut-off值。ROC曲线的含义:曲线的含义:阳性人群的测定值与阴性人群的测定值重叠程度越小,即测定的识别能力越高,ROC曲线越偏向上,曲线下面积越大。定量测定定量测定-测定待测物的含量测定待测物的含量l判定结果判定结果:浓度(U/L,g/L)。l判断依据判断依据:测定未知标本的同时,以系列浓度标准品测得的剂量反应曲线(即标准曲线)以此推算未知标本的浓度。l剂量反应曲线剂量反应曲线:一般均为非线性的,不同的数学模式可以用来改善上述剂量反应曲线绘制的精密度,从而以较少的数据和计算获得较为准确的结果。l应用应用:非传染性血清学指标。免疫测定中的剂量反应曲线(相对于定量生化):非线性非线性测定反应和待测物浓度之间的关系不一定是一条简单的直线;可能存在与系列标准品的测定数据拟合的多条曲多条曲线线可能因曲线的选择而造成偏差;具有相对大的且方差不齐的测定误差测定误差,且在标准曲线的不同位置、在不同批的测定之间这种误差亦不同。单纯线性回归往往不能反应真实情况单纯线性回归往往不能反应真实情况Figure 1 Falsely low and falsely elevated assay values resulting from drawing a straight line for the calibration curve.数据处理与科学作图数据处理与科学作图问题:问题:给定一批离散的数据点,需确定满足特定要求的曲线或 曲面,从而获取整体的规律。目标目标:用一个解析函数描述一组(二维)数据(通常是测量值)。方法方法:u插值法插值法-数据假定是正确的,要求以某种方法描述数据点之间所发生的情况;u曲线拟合或回归曲线拟合或回归-设法找出某条光滑曲线,使它最佳 地拟合数据,但不必要经过任何数据点。曲线及相应数学公式表明数据对(如标准品浓度与测定信号)之间的比例关系。拟合拟合 与与 插值插值 的的 比比 较较数据拟合:数据拟合:又称曲线拟合或曲面拟合,不要求曲线(面)通过所有数据点,而是要求它反映对象整体的变化趋势时应用。插值:插值:要求所求曲线(面)通过所给所有数据点时应用;从几何意义上看,拟合拟合是给定了空间中的一些点,找到一个已知形式的连续曲面来最大限度地逼近这些点;而插值插值是找到一个(或几个分片光滑的)连续曲面来穿过这些点。线性内插与2阶曲线拟合u插值法插值法 interpolative methodsl假设假设:反应变量的已知绝对精密;l曲线构建曲线构建:以观察到的数据构建曲线;l方法方法:l点对点(线性插值)l样条插值 spline functionl点对点(线性插值)n假设假设:中间值落在数据点之间的直线上;n当数据点个数数据点个数增加和它们之间距离减小时,线性插值就更精确;n适用范围适用范围:线性范围大或数据点多且相互紧密相连;n处理处理:为使数据更具有线性关系,可对数据进行某些方式的转换(如对数转换),然后在转换数据上进行线性插值。X将临近的校准点以点对点的方式用一条直线连起来。将临近的校准点以点对点的方式用一条直线连起来。线性插值在免疫检测中的应用:线性插值在免疫检测中的应用:n采用某些更光滑的曲线光滑的曲线来拟合数据点;n最常用的方法是3阶多项式,对相继数据点之间的各段建模,这种类型的插值被称为3 3次样条次样条或简称为样条;样条;n处理处理:为将每一个短曲线相互之间平滑地连起来,需对其进行修饰(smoothing),这需要反复重新计算所有的曲线直至每一片段与其数据点的拟合间的连接可以接受。n结点结点(knots,校准物的浓度值)越多意味着数据处理工作量的增大;n适用范围适用范围:当希望曲线密切遵循单个的校准物数据点时,或数据非常精密并有多个校准物时可选用,否则应避免使用;l样条插值 spline functionX将临近的校准点以一条曲线连起来,对整个标准曲线上各点间的短片段进行将临近的校准点以一条曲线连起来,对整个标准曲线上各点间的短片段进行数学计算得到一条曲线,所获得的合成数学函数称为样条函数。数学计算得到一条曲线,所获得的合成数学函数称为样条函数。线性插值 样条插值两种插值结果完全不同,因为插值是一个估计或猜测的过程,其意义在于,应用不同的估计规则导致不同的结果。样条插值与线性插值:样条插值与线性插值:n特点特点:完全拟合试验数据;每一片段基本上与其他部分无关;n问题问题:对数据点的精密度和准确性依赖大;每一个片段都应有一个质控样本,而这往往是做不到的;无法完全解决hooks出现引起的不准确;有时较其他“复杂”模式更费时。n影响因素影响因素:确定某部分曲线的两个校准点的准确度和精密度。插值法插值法interpolative methods及其应用及其应用l曲线构建曲线构建:以符合数据点规律的经验模式构建曲线;l目标目标:反映对象整体的变化趋势;l达到最佳拟合最佳拟合的方法线性最小二乘准则;l拟合模式拟合模式:l双曲线模式 hyperbolic modell多项式模式 polynomial modellLog-Logit转换lLogistic公式(两参数,四参数)u曲线拟合与回归曲线拟合与回归 curve fitting曲线拟合问题的提法:已知一组(二维)数据,即平面上已知一组(二维)数据,即平面上 n n个点(个点(xi,yixi,yi)i=1,n,i=1,n,寻求一个函数(曲线)寻求一个函数(曲线)y=y=f(xf(x),),使使 f(xf(x)在某种准则下与所有在某种准则下与所有数据点最为接近,即曲线拟合得最好。数据点最为接近,即曲线拟合得最好。+f=a1+a2x+f=a1+a2x+a3x2+f=a1+a2x+a3x2+f=a1+a2/x+f=aebx+f=ae-bx1.1.通过机理分析建立数学模型来确定通过机理分析建立数学模型来确定 f(xf(x);2.2.将数据将数据 (x xi i,y,yi i)i=1,)i=1,n n 作图,通过直观判断确定作图,通过直观判断确定 f(x)f(x):拟合函数的选择:拟合函数的选择:2阶曲线拟合与10阶曲线拟合n=1作为阶次,得到最简单的线性近似。通常称为线性回归;n=2作为阶次,得到一个2阶多项式;高阶多项式给出很差的数值特性,不应选择比所需的阶次高的多项式。拟合曲线的阶次:拟合曲线的阶次:l双曲线模式 hyperbolic curve:曲线形状:双曲线;假定数据拟合下式:y=a+b(1/x)或(1/y)=p+q(x)。l多项式模式:曲线形状:抛物线;假定校准曲线拟合下述曲线形式;y=a+bx+cx2+dx3+pxn。lLog-Logit转换:曲线形状:具有单点屈曲的连续性S形函数;假定校准曲线拟合下述曲线形式:logit(y)=a+b*ln(x),其中logit(z)=lnz/(1-z)。lLogistic公式(两参数,四参数):曲线形状:具有单点屈曲的连续性S形函数;假定校准曲线拟合下述曲线形式:logistic公式:Y=+dx以对数表示时曲线呈线性。a-d 1+(X/C)b拟合模式:拟合模式:1)将校准物浓度的倒数对测定反应作图或以B0/B对校 准物浓度作图;2)最小平方线性回归。双曲线拟合双曲线拟合 hyperbolic curve:y=a+b(1/x)或(1/y)=p+q(x)n问题问题:n标准曲线的端值得不到好的拟合(特别是低浓度端);n测定误差为倒数,与实际误差规律相反;n不具有S形,限制了应用。n双曲线拟合模式双曲线拟合模式:n竞争性免疫测定数据(在限定范围内的值)能拟合很好的平滑曲线。双曲线模式双曲线模式 hyperbolic curve应用应用1)将测定反应对校准物浓度作图;2)对多项式进行最小平方回归。多项式拟合:多项式拟合:n适用范围适用范围:n一个三次多项式可被快速和成功地用于竞争免疫测定数据拟合;n非竞争性免疫测定:有部分校准曲线为直线,可能拟合不好;x的次方为非整数时能够再现校准曲线的实际线性部分,但在零浓度附近和高浓度时不准确,需要截尾。n问题问题:n一个给定反应值可能对应两个结果,因此需对校正曲线进行截尾。多项式模式应用多项式模式应用1)将logit(B/B0)对校准物浓度的对数作图;2)对转换后的曲线进行最小平方回归可得到良好的直线。Log-Logit 转换曲线:转换曲线:logit(y)=a+b*ln(x)logit(y)=a+b*ln(x)n适用范围适用范围:n竞争免疫测定数据拟合。n问题问题:n不能包含零校准物点;n不能包含放免中的非特异结合数据。Log-Logit转换应用:转换应用:1)将测定反应对校准物浓度的对数作图;2)对转换后的曲线进行最小平方回归。Logistic公式(两参数,四参数)公式(两参数,四参数):Y=(a-d)/1+(X/C)b+d两参数两参数:a=y0,d=yx y=(y0-yx)/1+(X/C)b+yx Y=log(y0-y)/(y-yx)=logit(y),X=log(x),A=-b,B=-blog(c)Logit(y)=Alog(x)+B四参数四参数:不依赖于y0和yx的测定,更好地拟合原始数据。n优点优点:n不会出现钩状(hooks);n问题问题:n与直线公式相比logistic公式在代数学上是一个相当复杂的公式,因此要找出“最佳拟合”相对较难;n参数参数:na,b,c,d四参数,或带入a&d值,则为b,c两参数。Logistic公式(两参数,四参数)应用公式(两参数,四参数)应用 例:在例:在fPSA免疫分析中,四参数免疫分析中,四参数logistic拟合和四次多项式拟合拟合和四次多项式拟合最接近真实值。最接近真实值。Figure 2 Effect of curve-fitting program applied on the degree(extent)of deviation of fPSA values from expected mean values of fPSA(represented by the dotted horizontal line).n剂量反应曲线剂量反应曲线:通常为S形或双曲线。n目标目标:曲线线性化,获得数学模式。n方法方法:n转换一个或两个变量(对数或倒数);n多项或其他方式的曲线线性回归或比例转换(logit)。n最低要求最低要求:n应用时经济省时;n一个反应变量只对应一个剂量结果(无hooks出现)。总结总结:曲线拟合及其应用:曲线拟合及其应用u质量作用定律模式和质量作用定律模式和Scatchard作图作图l曲线构建曲线构建:从化学原理(抗原抗体之间的反应符合质量作用定律)计算校准曲线。l原理原理:Ag+AbAbAg,Ka=,=Ka(n-AbAg)n为反应孔中抗体的最大结合能力,以mol/g抗体表示,Ka是平衡常数。lScatchard plot Scatchard plot 绘制方法绘制方法:以AbAg/Ag比值对AbAg作图可得到一条直线;计算机软件作图。AbAgAbAg AbAg Ag特点特点:以化学理论为基础,给出了免疫测定的化学本质,比其他经验模式更可靠。问题问题:在实际反应中往往只在一定浓度范围内呈线性,受 到以下条件限制 1)抗原抗体均一(标记物与非标记物)和单价(多抗);2)抗原抗体反应必须达到平衡(非一步反应);3)抗原抗体按照一级质量作用定律反应,无改变抗体或抗原反应性的作用,如协同作用或变构作用;4)结合和游离物浓度必须为真正的测定值。使用范围使用范围:非竞争免疫测定中双抗夹心测定不能用。Scatchard作图及其应用作图及其应用相关应用软件相关应用软件lThermo labsystems酶标仪酶标仪:可进行的曲线拟合类型包括LINEAR REGRESSION,POINT TO POINT,QUAD.POLYNOMIAL,CUBIC POLYNOMIAL,CUBIC SPLINE,QUARTIC POLYNOMIAL,4 PARAM.LOGISTIC,从中选出最佳拟合(“best fit”)。lProgram:RIA AID,ELISA AID(Robert Maciel Associates,Inc.Arlington,MA)通用的处理程序,可进行log-logit(加权、非加权)、四参数logistic拟合、多项式拟合、点对点拟合等,可用于RIA和EIA。lCurveExpert 1.3:linear regression models,nonlinear regression models,interpolation,or splines.Over 30 models。数据处理类软件Introduction GraphPad PRISM 4.0 Demo著名的数据处理软件,用来进行生物学统计、曲线拟合以及作图。SigmaStat 3.11 Demo是一个易于使用的智能统计软件,尤其适合对统计知识了解不多的人使用,它具有一个“专家系统”,引导你对数据进行统计分析。PeakFit 4.12 Demo自动分离、拟合与分析非线性数据软件。分析非线性数据,进行曲线作更方便,更精确。数据作图助手II v2.1_A是一款用于对实验结果进行数据分析和作图的专业软件。它可满足您根据实验数据作出经验曲线,或以平滑曲线联结各数据点的要求。支持三次样条插值算法、最小二乘法直线拟合算法、可化为直线方程处理的特殊函数方程拟合算法以及一元多项式回归算法。CurveExpert 1.38ELISA标准曲线拟合等各种有关的实验数据分析,都可以应用。它使用非常方便,可以说是实验数据处理的圣手,并且可以生成漂亮的曲线应用到论文之中。NoSA5 2005.6.13版中文统计软件。覆盖了绝大部分常用的统计分析方法,嵌入了当代数据处理技术,能满足从事各类研究的专家、学者对数据作统计分析的需要,是各专业研究生、本科生统计学教学的优秀课件。二十万字的在线帮助使您运用自如。从数据录入与管理、统计分析、绘图,到结果管理,NoSA风格独特,核心算法(广义线性模型建模)是创制组全体成员数十年探索的结晶,计算结果通过了SAS、SPSS的验证。DRS 2005依据“最小三乘法”编制的数据回归分析软件;它使得一元线性、多元线性、一元非线性以至多元非线性的数据回归,计算更简单结果更准确。摘自生物软件网 www.bio-有关概念准确度准确度accuracy实验测得的分析物浓度与其真值之间符合程度。标准差标准差standard deviation,SD 一组数据的离散度。变异系数变异系数coefficient of variation,CV 标准差以其均数的百分比来表示。重复性重复性reproducibility 通过重复测定的SD或算术平均值的区间值来考察。测定下限测定下限detectability 超过零剂量精密度的最低抗原浓度。敏感性敏感性sensitivity 实验的测定反应对待侧物质浓度变化的改变,即dR/dC。夹心ELISA校准曲线优化:为得到更大的线性范围,可提高包被抗体和检测抗体的用量;标准曲线的不同位置精确度不同,这影响到标准曲线上数据点的疏密分布,并需要相应的质控品;不同批标准曲线之间亦有误差,因此每批实验都应重新坐标准确性。Referrencel李金明,临床酶免疫测定技术.人民军医出版社,2005.lJames T.Wu,PhD.Quantitative immunoassay:a practical guide for assay establishment,troubleshooting,and clinical application.l数学建模与数学实验拟合,海军航空工程学院青岛分院教程.l曲线拟合与插值.lStephen P.FitzGerald,etc.Development of a High-Throughput Automated Analyzer Using Biochip Array Technology.Clinical Chemistry 2005,51:7.