基于模糊模式识别的艾滋病疗法研究.pdf
基于模糊模式识别的艾滋病疗法研究3李 薇 李卫军 戴明强(海军工程大学理学院 武汉 430033)摘 要 针对艾滋病不同疗法的评价问题,提出基于模糊模式识别原理的多指标评价方法;针对艾滋病用药后的疗效预测问题,建立非等间距G M(1,1)模型,得到药效函数和停止用药的时间,实验结果说明该方法的有效性和正确性。关键词 评价 预测 模糊模式识别 药效 G M(1,1)模型中图分类号 TP3121 引言建立数学模型研究流行病的发展机理和传播过程,已有一个多世纪历史,艾滋病出现以后,更引起生物数学家们的注意1-3。艾滋病的医学中文全名为“获得性免疫缺损综合症”,英文简称A I DS,其病毒H I V破坏人的免疫系统,使人体丧失抵抗各种疾病的能力,从而严重危害人的生命。人类免疫系统的CD4细胞在抵御H I V的入侵中起着重要作用,当CD4被H I V感染而裂解时,其数量会急剧减少,H I V将迅速增加,导致艾滋病(A I DS)发作。艾滋病治疗的目的,是尽量减少人体内H I V的数量,同时产生更多的CD4,至少要有效地降低CD4减少的速度,以提高人体免疫能力。对于艾滋病的治疗,需要根据治疗情况评价各种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。2 基于模糊模式识别原理的多指标评价方法2.1 评价指标的确定选取三个指标进行疗效评价4:(1)C1-CD4浓度相对变化率的平均值先求每位病人在各时刻的CD4浓度的相对变化率,然后将所有病人所有时刻CD4浓度的相对变化率求平均值得到C1。(2)C2-CD4浓度相对变化率的方差先求每位病人CD4浓度相对变化率的方差,然后将所有病人CD4浓度相对变化率的方差求平均值得到C2。(3)C3-CD4浓度相对净增长率的平均值先求每位病人在用药后若干时刻的CD4浓度减去初始时刻的CD4浓度,再除以初始时刻的CD4浓度,然后对所有病人求平均值得到C3。2.2 基于模糊模式识别原理的多指标评价方法我们先给出基于模糊模式识别原理的多指标评价方法:运用模糊模式识别原理,将m种疗法分为g类,由于每种疗法的属性可用一个K维向量(这里K=3)表示:即(Ai)=(ai1,ai2,aik)(i=1,2,m),因此对疗法分类可转化为对向量分类。假设g个类的原型分别用向量pi=(pj1,pj2,pjk)(j=1,2,g)表示,而疗法Ai即向量(Ai)属于这g个类的隶属度分别为(u1(Ai),u2(Ai),ug(Ai),且 gj=1uj(Ai)=1。考虑分类的性能评价函数J(uj(Ai)=mi=1gj=1(uj(Ai)d(Ai)-pj)2式中,d(Ai)-pj)表示疗法Ai即向量(Ai)与第j类的原型间的加权距离。由于uj(Ai)表示疗法Ai属于第j类的隶属度,故uj(Ai)d(Ai)-pj)表示疗法Ai即向量(Ai)与第j类的原型间的广义加权距离。则J(uj(Ai)表示所有疗法向量与分类原型间全部广义加权距离的平方和。很显然,J(uj(Ai)的值越小,分类效果越好。于是,考虑如下优化问题:minJ(uj(Ai)=mi=1gj=1(uj(Ai)d(Ai)-pj)281 计算机与数字工程 第35卷3收到本文时间:2006年2月20日作者简介:李薇,女,硕士,讲师,研究方向:数值计算。李卫军,男,硕士,副教授,研究方向:方程理论及其应用。戴明强,男,博士研究生,副教授,研究方向:军事运筹及其应用。s。t。gj=1uj(Ai)=10uj(Ai)1定理1假设原型向量pj=(pj1,pj2,pjk)(j=1,2,g)和向量d均已知,且对 j(1,2,g),有 d(Ai)-pj)0,则(u1(Ai),u2(Ai),ug(Ai)为上述问题的最优解,当且仅当uj(Ai)=1gs=1d(Ai)-pj)2d(Ai)-ps)2j=1,2,g(1)证明 构造拉格朗日函数L(uj(Ai),)=mi=1gj=1(uj(Ai)d(Ai)-pj)2+(1-gj=1uj(Ai)求偏导数5L5uj(Ai)=2uj(Ai)d(Ai)-pj)2-5L5=1-gj=1uj(Ai)令,5L5uj(Aj)=0,5L5=0,很容易导出(1)式。再由52L5uj(Ai)2=2d(Ai)-pj)2其他二阶混合偏导数均为0,可得海赛矩阵H为对角矩阵,由于 d(Ai)-pj)0,故H为正定矩阵。于是J(uj(Ai)在(3)式处取得最小值。令g=2,即将所有m个疗法分为“优”和“劣”两类,显然,这两类的原型可分别用p1(1,1,1)和p2=(0,0,0)表示。若用K维实数空间上的欧氏距离来表示向量(A i)与第j类的原型间的加权距离,即d(Ai)-pj)=Kk=1dk(aik-pjk)2则由定理1,疗法Ai属于“优”类的隶属度为u1(A i)=Kk=1(dkaik)2KK=1dk(1-aik)2+Kk=1(dkaik)2(2)比较各疗法属于“优”类的隶属度,可判断各疗法的优劣。3 基于非等间距G M(1,1)模型的治疗效果预测3.1 治疗效果函数的构造由于人体内的CD4细胞能够抵御H I V的入侵,且CD4的浓度越高,病人的免疫能力越强,另外,H I V的浓度越底说明病人的感 染程度越轻5,6。因此,综合考虑两者的浓度,以两者的商来近似的反映病人的身体状况。故定义第j个病人ti时刻的身体状态函数为:Fj(ti)=Cj(ti)hj(ti)+c(c为非零常数,为防分母为零而设)。其中:Cj(ti)表示第j个病人在ti时刻的CD4浓度值,hj(ti)表示第j个病人在ti时刻的H I V浓度值。另外,为了反映药物的疗效,我们选用在药物作用下身体状况的变化速率作为药效函数Gj(ti),即令:Gi(ti)=Fj(ti)-Fj(ti-1)ti-ti-13.2 基于非等间距G M(1,1)模型的治疗效果预测不同病人的检测时刻不一致,我们选取每类病人中检测人数较多的时刻来作为特征时刻点,并记为t1,t2,tn,计算ti时刻该类所有检测病人身体状况的变化速率(药效函数)的平均值G(ti)=1mimij=1Gj(ti)作为该类病人ti时刻药品的疗效。G(0)=G(t1),G(t2),G(tn)以G(0)作为非等间距G M(1,1)模型中的原始序列,应用G M(1,1)建模原理建立灰色微分方程4 应用实例美国艾滋病医疗试验机构ACTG公布的一组数据7,将1300多名病人随机地分为4组,每组按4种疗法中的一种服药,每隔一定时间(周)测试CD4浓度值和HIV浓度值,要求以实验数据为依据评价4种疗法的优劣,并对较优的疗法预测继续治疗的效果,或者确定最佳治疗终止时间。4.1 疗法评价相同的疗法对于不同年龄的人效果是不一样的,数据中所有病人的年龄都介于15到75岁之间,我们将1300多名病人按年龄分为三类:青年(小于30岁)、中年(3050岁)、老年(50岁以上)。将四种疗法分别记为A1、A2、A3、A4,并以aij表91第35卷(2007)第9期 计算机与数字工程 示Ai疗法在指标Cj下的指标值。得到不同年龄段各个疗法的指标值矩阵(见表1):表1 指标值矩阵青年C1C2C3A1-0.006090.019019-0.09519507A2-0.0050.020669-0.05433624A3-0.003730.029585-0.03331265A40.0047850.0236950.11450648中年C1C2C3A1-0.006050.01913-0.07397268A2-0.003190.027786-0.02899877A3-0.000780.0245190.013441699A40.0046720.0207210.076683503老年C1C2C3A1-0.004930.020411-0.06166706A2-0.002820.022811-0.02457753A3-0.000690.0258830.036005323A40.0013390.0250620.067421833C1、C3是效益性指标,C2是成本性指标,将其归一化后得到归一化指标值矩阵(见表2):表2 归一化指标值矩阵青年C1C2C3A1010A20.1003510.8438460.194842765A30.21696200.295097598A410.5574551中年C1C2C3A1010A20.26678500.298520161A30.4915080.3773660.580224305A410.816181老年C1C2C3A1010A20.3371430.5614110.287317762A30.67702400.756628876A410.150031 运用(2)式,并令三个指标的权重向量为d=(d1,d2,d3),可计算出不同年龄段各疗法属于“优”类的隶属度,并结合不同年龄段的病人人数,确定不同年龄段的权重向量。W=(W1,W2,W3)=(16.26%,48.24%,35.50%)记第k年龄段疗法Ai属于“优”类的隶属度为uk1(Ai),令u1(Ai)=3k=1wkuk1(Ai)u1(Ai)反映各疗法针对所有病人属于“优”类的隶属度,其值越大说明疗法的总体疗效越优,在不同指标值权重d之下计算得出疗法四较优。4.2 疗效预测对疗法四的治疗效果进行预测.利用实验数据计算,得出三类病人的预测模型分别为:由这三个模型可以得到各周的预测值。对于第一类病人其预测值在22周后均小于0;对于第二类病人其预测值在24周后均小于0;对于第三类病人其预测值在25周后均小于0.因此,我们认为对于一、二、三类病人的最佳停药时间分别为22,24,25周.并由后验差检验得到,三类模型的后验差比值分别为:C1=0.1743,C2=0.2937,C3=0.2697,均小于0.35,说明预测精度为一级。5 结束语针对艾滋病疗法评价问题提出基于模糊模式识别原理的多指标评价方法,并利用非等间距G M(1,1)模型对治疗效果进行预测。根据美国艾滋病医疗试验机构ACTG公布的数据计算出结果,实验结果说明了该方法的有效性和正确性,为艾滋病的治疗和疗效分析提供了较为有力的工具。参 考 文 献1Perelson A S,Nelson PW.Mathematical Analysis of HI V-1 Dynamics inVivo.SI AM Review,1999,41(1):3442Perelson A S,Kirschner D E,Boer R DE.Dynamics ofHI V Infection of CD4+T Cells.MathematicalBiosciences,1993,114:811253 Isihara P A.I mmunological and Epidemiological HI V/A I DSModeling.UMAP Journal,2005,26(1):51894赵文立,许人庆.关于中药和中西药结合治疗A I DS效果评估指标标准的探讨J.中国艾滋病性病,2004,10(4):2932955孙丹,张可,蒋岩等.成人HI V/AI DS CD4细胞数与病毒载量之间关系分析J.传染病信息,2003,16(4):1751766韩晓旭,王亚男,刘静等.我国部分地区抗H I V治疗效果实验室评估和耐药变异的初步研究J.中华医学杂志,2005,85(11):760764(下转第23页)02 李 薇等:基于模糊模式识别的艾滋病疗法研究 第35卷(2)应用网格搜索法选择一个参数对(C,),用该参数对进行交叉验证。方法就是将样本集随机分成K个集合(假定每个集合的数据分布近似或相同),一个集合留作独立的测试集,其余K-1个集合合并后作为训练集。通过选择不同的验证集,可重复K次。(3)循环选择参数对进行交叉验证,计算每个参数对的均方误差直到网格搜索停止,使得均方误差最小的参数对(C,)是最佳的,应用交叉验证方法选择参数能够避免过拟合问题。3.3 实验结果为了分析训练样本数对整体分类效果的影响,对每个病症类数据进行取不同比例的样本作为训练样本,剩余的作为测试集。在实验分析时分别从总样本中选择30%、50%、70%和90%的样本作为训练集,表2给出了在4种医疗诊断数据集上的训练和测试的结果。表2 四个数据集在不同训练样本比例下的训练与测试的准确率训练比例和结果数据集DiseaseDisordersDiabetesCancer30%训练集(train)90.12%83.65%76.09%98.54%测试集(test)81.48%61.53%77.88%82.64%50%训练集(train)87.41%82.66%77.86%96.49%测试集(test)84.44%69.77%80.73%98.24%70%训练集(train)84.66%80.08%77.88%96.44%测试集(test)85.19%68.27%77.39%98.05%90%训练集(train)85.19%75.52%77.42%97.07%测试集(test)81.48%77.14%79.22%98.53%表3LS-SVM、K-NN和C4.5三种分类器的不同应用结果不同分类器数据集Disease Disorders DiabetesCancerK-NN(K=3)78.19%61.23%73.78%96.83%C4.577.53%65.93%73.51%94.43%LS-SVM85.19%77.14%80.73%98.53%针对几种不同疾病分类诊断研究问题,将目前一些典型的分类器诸如K近邻分类器(K-NN,本文中K=3)、C4.5决策树分类器与本文中LS-SVM分类器所得结果进行了对比,见表3。从表3可知,在保持对样本准确识别的基础上,LS-SVM分类器取得了较好的准确率。(本文中,对于K近邻分类器和C4.5决策树分类器方法也是建立在与LS-SVM分类器同样的训练和测试集合的基础上获得的各个数据集的最佳结果)。4 结束语介绍最小二乘支持向量机分类器的算法原理,并将其应用于不同疾病医疗诊断数据的分析中,建立的LS-SVM分类器比使用K-NN(K=3)和C4.5决策树分类器具有更高的分类识别准确率。最小二乘支持向量机具有比一般的支持向量机更快的求解速度,而且求解所需的计算资源也较少。最小二乘支持向量机求解线性方程,其解满足极值条件,但不能保证是全局最优解。LS-SVM能较好地解决小样本、非线性等实际问题。当前特征基因选取、识别与分类成为生物信息学研究中的重要课题,进一步的研究方向将是把最小二乘支持向量机应用到基因和生物的识别与分类领域,处理更高维和复杂的数据集合。参 考 文 献1汪丹,张亚非.SVM和BP算法在气体识别中的对比研究J.传感技术学报,2005,1,2012042姚奕,叶中行.基于支持向量机的银行客户信用评估系统研究J.系统仿真学报,2004,4,7837863杨敏,张焕国,傅建明等.基于支持向量数据描述的异常检测方法J.计算机工程,2005,3,39424Suykens JAK,Vandewalle J.Least squares support vectormachines classifier J.Neural ProcessingLetters,1999,9(3):8398425段洪伟,陈一民,林锋等.基于LSSVM的静态手势识别J.计算机工程与设计,2004,12,235223546高彦宇,杨扬,陈飞等.基于融合特征和LS-SVM的脱机手写体汉字识别J.北京科技大学学报,2005,4,5095127Suykens JAK,Vandewalle J.Recurrent least squares sup2port vector machines J.IEEE Transactions on Circuitsand System-I,2000,47(7):11091114.8 C.L.Blake,C.J.Merz.UCI Repository of MachineLearning DatabasesOL,http:/www.ics.uci.edu/mlearn/MLRepository.html,19 July 2002(上接第20页)72006年全国大学生数学建模竞赛试题 EB/OL.ht2tp:/ 计算机与数字工程 Index(Vol.35 No.9)Computer and Engineering Institute A Camera Calibration M ethod Based on DLT M odel andC ircular Points CorrectionbyDong LipingAbstractA m ethod for cam era calibration on DLT(directlinear transfo r m ation)model and circular points correctionis proposed.The cam era calibrati on param eters are ob2tained using 3-D DLT plane model upon the fundam en2tal principle of computer vision.A circle is designed onthe calibration plane model,using a series calculation onthe circular points to i mprove the precision of calibrationparam eters.Experi m ents w ith si m ulated data show thatthis m ethod is effective.Key wordscomputer vision,3D-DLT,cam era calibra2tion,circular points correction(Page:1)M odeli ng of Recommendation System for Financial Prod2ucts Based on Collaborative FilteringbyLi XinluAbstractBased on the characteristic of financial prod2ucts and banking,the paper gives a model of recom2m endation system for financialproducts,using collabo ra2tive filtering algorithm.Decision tree and clustering areused to analyze custom ers before recomm endation toi mprove the system efficiency.The analysis both of cus2tom ers and products avoid the problem of none-m atchdata for new product in the algorithm of collaborative fil2tering.A m atching m atrix of custom er,financialproductand ti m e w ill becreated,w hich canstrengthentheeffect of custom er relati onship m anagem ent and m arket2ing&sales strategy of banks.Key wordscollaborative filtering,recomm endation sys2tem,financial products,custom er relationship m anage2m ent(Page:6)Application of Artificial Neural Network in the Spatial I n2terpolation of Ra infallbyM o LinAbstractIn this paper,an experi m ent is taken to testthe m ean annualand the monthly m ean spatial rainfall in2terpolation in 117 stati ons of Yunnan p rovince,adoptingthe modelof BP neural network and radial basis function(RBF)neural network.In addition,this experi m ent a2dopts the inverse distance w eighting modeland the Krig2ing model too.through the contrastive analysis to the in2terpolation results w ith above-m enti oned models,itshow s that the artificial neural netwo rk has three excel2lences:less adjustable param eters,si mple operation andthe preferable interpolation effect.Key wordsspatial interpolation of rainfalldata,BP neuralnetwo rk,radius basis function neural network,inversedistance w eighting,Kriging(Page:9)Studies on Tag Anti2collision Algorithm s Based on AlohabyYu ChengAbstractIn RFI D system,one of the problem s is thecollision betw een tags,w hich low ers the efficiency of thesystem.Aloha is the popular anti-collisi on algorithm.This paper studies variants of the anti-collision algo2rithm s based on Aloha used for tags collision.Finally,itpresents the opti m ized algorithm used for tags collision.Key wordsRFI D,anti-collision algorithm s,Aloha(Page:13)Study on the Fractal Based on VTKbyLiu LuAbstractAs a new developed geom etry,fractal theoryis w idely used in m any subjects.The visualization toolkit(VTK)is a class library for 3D computer graphics,i m ageprocessing,and visualization.U sing VTK pipeline to ren2der the graphics and 3D models enable the visualizati onof the research on the fractal theory,the pipeline cansti m ulate the fractal graphics reality.Based on analyzingthe algorism of fractal theory,designs a rendering p i pe2line to render 2D and 3D fractalgraphics,provides a newm ethod to generate fractalgraphics and 3D models usingVTK,and render the M andelbrot set as an example.Key wordsVTK,fractal,3D rendering,p i peline(Page:16)Research on the Treatment for A I DS Based on the FuzzyPattern Recogn itionbyLiW eiAbstractO n the basis of the evaluation of differentA I DStreatm ents,m ulti-normevaluatingapp roachw hich is based on the fuzzy pattern recognition is ex2plored.In the light of the curative prediction of A I DStreatm ents,non-equidistance GM(1,1)model is estab2lished and both efficacy function and the ti m e to stopdrug-taking are gained.The experi m ental results showthe efficiency and correctness of the proposed approach.Key wordsevaluation,predicti on,fuzzy pattern recogni2tion,efficacy,GM(1,1)model(Page:18)Application of Least Squares Support Vector Machi nes toM edicalD i agnosticsbyZhong PingAbstractAs the m edical diagnose dada an applicati onobject,LS-SVM classificati on hyper-param eters areopti m ized w ith grid-search and cross-validation m eth2od,carry through to validate the classification perform2ance.Then it is compared to other typical classificationssuch as K-NN and C4.5 decision tree on the datasets.Computational results indicate that LS-SVM has goodperfo r m ance on the classificati on recognize,LS-SVMhas potential applicati on in m edical diagnostics research.Key wordsleast squares support vector m achines(LS-SVM),classification,m edical diagnostics,grid-search,cross-validation(Page:21)M uch Connection I nquiry Opti m izing of Inheritance Algo2rithm on D istinguished ChoosingbyW ang XingbangAbstractThe operation of m uch connection is one ofthe most i mportant operation of the relation database,itis the mo st i mportant m ethod of linking two or m any1