医学研究中标准曲线修正的初探.pdf
第 35 卷第 4 期2005 年 4 月数学的实践与认识MATHEMATICS IN PRACTICE AND THEORYVol.35No.4April,2005医学研究中标准曲线修正的初探王桂杰1,李新1,魏庆铮2,张海鹏3(1.中国医科大学基础医学院数学教研室,沈阳110001)(2.中国医科大学公共卫生学院卫生统计教研室,沈阳110001)(3.中国医科大学基础医学院病理生理教研室,沈阳110001)摘要:目的:在医学研究和临床检验中经常使用定量检测法,在该方法中标准曲线被广泛应用,且其准确性直接影响检测结果.从统计学角度对其进行修正,使结果更为可靠.方法:应用直线回归法对直线型标准曲线进行处理,求出直线回归方程;对曲线型标准曲线,先将指数方程取对数后变成直线方程,然后求直线回归方程后再回代,求出曲线回归方程.结果:以蛋白量与其对应的 OD 值间关系求得直线回归方程 y?=0.006x;以TNF?浓度与对应的OD 值间关系求得指数回归方程y?=0.015x0.732,对两者进行F 检验,回归效果均极显著.结论:应用回归法可获得定量检测法中常用的直线型及曲线型标准曲线的方程,据此可直接计算出待测样本所需数据,使其更为简便、准确、可靠.关键词:标准曲线;直线回归法;拟线性回归法;函数收稿日期:2005-01-24在医学研究和临床检验中经常应用标准曲线,它是在一定范围内通过实验数据所绘制,利用标准曲线可以由测得样品的一个变量值直接查出所需要的另一个变量值.显然从标准曲线上获得的值是否准确,除实验操作方面的原因外,最关键的问题是标准曲线的准确性.很明显,获取的两个变量的信息量越多,则标准曲线越接近于真实的标准水平,准确性就高,结果也就越可靠.但在实验中,往往受到样本来源和资源等限制,不可能利用太多的信息量来获得标准曲线.因此用于绘制标准曲线的各点往往也不能全部在一条直线上,有时在同一坐标中根据实验数据可获得若干条标准曲线,这样就不能确定哪条曲线更可靠.如何根据各点数据获得更接近实际的标准曲线,使实验结果更准确是医学实验中需要解决的问题之一.本文从量化角度应用回归法对这一问题进行初步探讨.为更好地说明问题,我们以直线型和曲线型两种标准曲线为例进行阐述如下.1标准曲线的制作及处理原理1.1标准曲线的制作1)直线型标准曲线应用酚试剂法准确称取牛血清白蛋白 20mg,将其溶于 10ml 容量瓶中,然后分别准确地取该蛋白液:0?l、20?l、40?l、60?l、80?l、100?l、120?l、140?l再分别加入呈色的甲、乙试剂,在总反应体积相同的情况下,经呈色反应后,分别测得各浓度下的OD 值,每一个 OD 值均为四个样本测得的平均值,蛋白量 x 及其 OD 均值 y 的实验数据如表 1 所示.据此绘制出图 1 所示的标准曲线.表 1原直线型标准曲线处理蛋白量 x20406080100120140OD均值y0.1650.3050.4000.5400.6250.7090.76注:?x 轴所示为标准蛋白溶液量,实际浓度应分别乘 2?g?原曲线OD 值分别为四个样本测得的平均值图 1蛋白浓度的标准曲线与回归曲线的比较2)曲线型标准曲线准确获得肿瘤坏死因子(TNF?)的标准品浓度,首浓度为 1000u/ml,用倍比稀释法依次稀释为:500u/ml、250u/ml、125u/ml、62.5u/ml、31.25u/ml、15.625u/ml共 7 个浓度,将 T NF?的特异抗体吸附在 96 孔微孔板上,分别加入上述稀释之各浓度T NF?标准品,再加入与酶结合的抗体,并使该抗体与 T NF?抗体结合.最后加入可与酶进行呈色反应的底物,使其显色.用酶标仪检测,获得各浓度 T NF?相应的光密度OD 值.每一个OD值均为两个样本测得的平均值,倍比稀释浓度及其相应的 OD 均值见表 2.据此绘制出如图2 所示的标准曲线.表 2原曲线型标准曲线处理浓度x15.62531.25362.51252505001000OD均值 y0.1010.1750.3310.5881.0651.3442.0011.2处理原理回归法在医药学应用中是一种常见的方法.当两个变量中有一个是非随机变量,另一个是随机变量时常常用回归法来研究这两个变量之间的关系.当由各样本构成的成对数据所描绘出的散点图成直线趋势时,通常用直线回归法;当散点图成曲线趋势时,则用拟线性回归法.所谓拟线性回归法是把原始数据转化成对数形式的数据,然后把曲线方程化为直线方程,再利用直线回归法求出直线回归方程,最后把原变量回代,就可以得到所求的曲线回归方程.上述直线型标准曲线中所描述的蛋白浓度 x 及其 OD 值 y 之间成直线关系,因此我们采用直线回归法;而曲线型标准曲线中所描述的 TNF?标准浓度及其 OD 值之间成曲线关1114 期王桂杰,等:医学研究中标准曲线修正的初探注:原曲线中 OD 值分别为两个样本测得的平均值图 2TNF标准曲线与回归曲线的比较系,因此需应用拟线性回归法进行处理.目的是根据两个变量之间的变化趋势由实验数据分别求出相应的直线回归方程和曲线回归方程,用于描述这两个变量之间的量化关系.一方面可对原标准曲线进行修正;另一方面,则可由获得的回归方程式直接求出所需的变量值,使结果简单、可靠.2方法与结果2.1直线型标准曲线的处理从理论上可知蛋白量 x 与OD 值y 成直线函数关系,并且过原点.根据表1 所示 7 个蛋白量所对应的 OD 值的散点图,其变化趋势确实按直线关系变化.为了求蛋白量 x 与其OD值 y 之间函数关系,可设 x 与 y 函数关系如下:y=bx系数b 的真值未知,只能通过样本值求出 b 的估计值 b?.具体数据如表 3.Sxy=28i=1xiyi=1346.02Sxx=28i=1x2i=224000b?=SxySxx=1346.02224000=0.006112数学的实践与认识35 卷表 328 个测得的样本点(OD值)的处理结果nx(蛋白量)mly(OD 值)x2y2x y1200.1414000.022.822200.1464000.0212.923200.1854000.0343.74200.1854000.0343.75400.31016000.09612.46400.31016000.09612.47400.30016000.09128400.30016000.09129600.40036000.162410600.40036000.162411600.40036000.162412600.40036000.162413800.55564000.30844.414800.56064000.31444.815800.52064000.2741.616800.52064000.2741.6171000.620100000.38462181000.620100000.38462191000.630100000.39763201000.630100000.39763211200.701144000.49184.12221200.702144000.49384.24231200.715144000.51185.8241200.716144000.51385.92251400.760196000.578106.4261400.740196000.548103.6271400.780196000.608109.2281400.760196000.578106.414.0062240008.1651346.02所求的回归直线方程为 y?=b?x=0.006x.经 F 检法验,有F=MS回MS剩=SS回/1SS剩/(n-2)=(n-2)SS回28i=1y2i-SS回=(28-2)b?Sxy28i=1y2i-b?Sx y=26 0.006 1346.028.165-0.006 1346.02=2359.31而 F=2359.31 F0.05(1,26)=4.23,故回归效果极显著.利用所求的回归直线方程求出的 OD 值数据如表 4,对应的标准曲线如图 1所示.表 4直线型标准曲线处理蛋白量 x20406080100120140回归OD值y0.120.240.360.480.60.720.841134 期王桂杰,等:医学研究中标准曲线修正的初探2.2曲线型标准曲线的处理从理论上可知倍比稀释浓度 x 与 OD 值 y 成指数函数关系,并且根据表 2 所示 7 个浓度所测 OD 值的散点图,其变化趋势确实按指数关系变化.为了求浓度与其 OD 值之间函数关系,同理设 x 与y 函数关系如下:y=axb系数a、b 的真值未知,只能通过样本值求出它们的估计值.为此先将方程y=axb两边取对数,并令lg y=y,lg a=a,lg x=x 得y=a+bx a 的真值仍未知,只能通过最小二乘原则求出它们的估计值 a?与 b?,具体数据见表 5.表 514 个测得的样本点(OD值)的处理结果nxyx =lg xy=lg yx 2y2x y 115.6250.1021.194-0.9911.4260.982-1.183215.6250.1001.194-11.4261-1.194331.250.1761.495-0.7542.2350.569-1.127431.250.1741.495-0.7592.2350.576-1.135562.50.3311.796-0.4803.2260.23-0.862662.50.3311.796-0.4803.2260.23-0.86271250.5882.097-0.2314.3970.053-0.48481250.5882.097-0.2314.3970.053-0.48492501.0672.3980.0285.7500.00080.067102501.0632.3980.0275.7500.00070.065115001.3422.6990.1287.2850.0160.345125001.3462.6990.1297.2850.0170.3481310002.00230.30190.0910.9031410002.00030.30190.0910.90329.358-4.01266.6383.91-4.7其中:Sx y=14i=1xiyi-11414i=1xi14i=1yi=-4.7-114 29.358 (-4.012)=3.713Sx x=14i=1x 2i-11414i=1xi2=66.638-114 29.3582=5.074(1)从而得:b?=Sx ySx x=3.7135.074=0.732a?=11414i=1(yi)-11414i=1xib?=114(-4.012)-114 29.358 0.732=-1.822(2)回归直线方程114数学的实践与认识35 卷y?=a?+b?x=-1.822+0.732x(3)经 F 检验,有F=MS回MS剩=SS回/1SS剩/(n-2)=(n-2)SS回14i=1y 2i-11414i=1yi2-SS回=(14-2)b?Sx y 14i=1y2i-11414i=1yi2-b?Sx y=12 0.732 3.7133.91-114(-4.012)2-0.732 3.713=776.548(4)而F=776.548 F0.05(1,12)=4.75(5)故回归效果极显著.a=10a?=10-1.822=0.015回归曲线方程为y?=axb=0.015x0.732根据回归曲线方程所求的 OD 值数据见表 6.表 6曲线型标准曲线处理浓度 x15.62531.25362.51252505001000回归 OD 值y0.1120.1860.3100.5140.8541.4182.3563讨论图 1 所示的直线型标准曲线中,理论上蛋白量与 OD 值之间应呈直线函数关系,但按常规,我们在制作直线型标准曲线时,只能选择几个标准浓度(x),而同一个浓度下所对应的y 值最常见的是测量两个样本所得的平均值.由于受多种因素的影响,每个标准蛋白浓度所测得的 OD 值往往是:虽然可随浓度增加而升高,其变化呈直线趋势,但各实验数据点却不在一条直线上.因此在绘制标准曲线时,可人为地划出几条相近的曲线,其中有的标准曲线通过的点多些,有的则少些,这样获得的标准曲线带有主观因素,可能并不符合实际情况.为了求得客观的更接近实际情况的标准曲线,我们应用回归法求出直线回归方程.由于回归直线方程中的参数是最接近随机变量 y 均值中参数的真值,根据该方程所绘出的标准曲线可使更多的点落在这条曲线上或接近于这条曲线,所求出的回归直线由于更接近理论上的标准曲线,从该曲线上查得的待测样品所需要的数据能更准确,也可用该方程直接计算出所需要的数据,这样则更简单、可靠.图 2 所示为曲线型标准曲线,与直线型不同的是需先将指数方程取对数后变成直线方程,求出直线回归方程后回代,得到回归曲线方程,根据此回归曲线方程再绘制成标准曲线.此外有两点说明:一是当理论上可知两个变量 x 与 y 成直线函数关系,并且不过原点,这时可设x 与 y 之间的函数为 y=a+bx,其中 a 与 b 估计值 a?与 b?的求法请参看(1)(5)式;二是在处理曲线型标准曲线时,本文取的是以 10 为底的对数,还可以取以 e 为底的对数,所得结果是一致的.1154 期王桂杰,等:医学研究中标准曲线修正的初探最后,应予指出的是,应用回归法对标准曲线的修正是在实验所获得的两个变量间有明显的线性趋势或常见曲线函数趋势时才可用.比如标准曲线中,如果测得的某一个 OD 值偏离标准曲线太大,应予舍去后再做相应的处理;或者测得的某一个OD 值是随浓度的增加而减少时,显然这一个数据是错误的,同样应予舍去后再做相应的处理.参考文献:1 盛骤等主编.概率论与数理统计 M.高等教育出版社,2002,3.2 杨树勤主编.卫生统计学 M.人民卫生出版社,1997,3.3 李春喜主编.生物统计学 M.科学出版社,2000,2.4 方积乾.医药数理统计方法M.人民卫生出版社,1998,2.Discussion Revision of Standard Curve in Medical StudyWANG Gui-jie1,LI Xing1,WEI Qing-zheng2,ZHANG Hai-peng3(1.Department of Mathematics,College of Basic Medical Sciences,China Medical University,Shenyang 110001,China)(2.Department of Health Statistics,College of Public Health,China M edical University,Shenyang110001,China)(3.Department of Pathophysiology,College of Basic Medical Sciences,China Medical University,Shenyang 110001,China)Abstract:Objective:Quantum test method,in which standard curve is applied widely,isoften used in medical sciences study and clinical test.Its exactitude affects test result directly.The theme revise standard curve from statistical angle for its result more reliable.Methods:Find linear regression equation in order to dispose linear type standard curve with linearregression method.Exponential equation is usually changed to linear equation firstly bylogarithm to standard curve of curve type and then back to exponential equation after findingout linear regression equation.Regression equation of curve can be work out.Results:Findlinear regression equation y?=0.006x with the relationship of albumen solution quantity and itsOD value and exponential regression equationy?=0.015x0.732with the relationship ofT NF?concentration and its OD value.Regression effect is significant extremely to them by F-test.Conclusion:Linear and curve type standard curve equation which is often used in quantum testmethod is obtained by regression method.Sample data which is simpler,more accurate andreliable can be calculated directly according to the regression equation.Keywords:standard curve;linearregression method;quasi-linearregression method;function116数学的实践与认识35 卷