《肾病诊断数学模型.docx》由会员分享,可在线阅读,更多相关《肾病诊断数学模型.docx(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、肾炎诊断的数学模型摘要本文研究的是通过人体内各种元素含量来判断就诊人员是否患有肾炎的问题。首先我们将收集的数据分为两组进行抽样调查,其中肾炎患者视为实验组,正常人视对照组,运用软件对数据进行处理,建立判别模型。对于问题一、二:分析相关数据,运用判别法建立判别模型。对数据运用软件进行判别处理,得到相应的判别函数和判别函数的监界值,通过马氏判别法对模型有效性检验,数据正则相关性达到0.811,判断正确度达90%。然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人11名,肾炎患者19名。对于问题三、四:通过实验组与对照组中各相同元素的对比及相关分析,剔除一些对诊断结果影响不大的元素
2、,重新运用判别法及软件建立新的优化判别模型。通过马氏判别法对模型有效性检验,数据正则相关性达到0.708,判断正确度达90%。然后运用模型一中的判别函数将表二中数据代入得到30个就诊人员中正常人10名,肾炎患者20名。对于问题五:对二、四问结果作进一步分析,所判断的结果基本相同。这说明所给的元素指标中有些对总体判断不大,属于小因素。相比之下剔除后判别更有说服性,确定了Zn、Fe、Ca、Mg为判别肾炎的重要指标。关键字:fisher判别法;多元统计分析;马氏距离检验;1. 问题重述1.1问题的简单提要:人们到医院就诊时,通常要化验一些指标来协助医生的诊断。诊断就诊人员是否患肾炎时通常要化验人体内
3、各种元素含量。表B.1是确诊病例的化验结果,其中130号病例是已经确诊为肾炎病人的化验结果;3160号病例是已经确诊为健康人的结果。表B.2是就诊人员的化验结果。1.2本文需要解决的问题:1)根据表B.1中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人的方法,并检验你提出方法的正确性;2)按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人;3)能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标;4)根据3的结果,重复2的工作;5)对2和4的结果作进一步的分析。2.模型的假设与符号的说明2.
4、1模型的假设假设1:题目所给的数据是正确、合理的;假设2:人处于健康状态时身体各元素的相对含量是相对稳定的,而且波动幅度较小,没有显著性变化;假设3:通过Zn,Cu,Fe,Ca,Mg,K,Na这七种元素可以判断出患者是否患有肾炎;假设4:不需要考虑到患者由于自身原因(例如:患有其他疾病、身体机能)对身体各元素的相对含量影响可以忽略不计;假设5:暂时不考虑各种元素之间的相互作用;2.2符号说明符号符号的解释确诊的健康人群确诊的肾炎患者待测人群在已确诊的健康人群()中来抽样检测,所取的样本个数在已确诊的肾炎患者()中来抽样检测,所取的样本个数。检测各检测样本中各种元素的编号:1.Zn 2.Cu 3
5、.Fe 4.Ca 5.Mg 6.K 7.Na 在模型二中的值依据选取的优化指标元素进行分析(以选取给定)判别函数样品的各项检测元素所占的权重组抽取样本平均判别值组抽取样本平均判别值判别监界值化验结果中第i病例号所对应的元素的检测含量化验结果中的病例号。范围为1.、2、3、90标准化的典型判别式函数的系数判别函数抽取的总体样本的协方差的逆矩阵已确诊的健康人群()中来抽样检测中各项指标元素含量的均值已确诊的肾炎患者()中来抽样检测中各项指标元素含量的均值检验统计量第一自由度(在spss中即为第一自由度)3.问题的分析诊断就诊人员是否患肾炎时通常要化验人体各种元素含量,通过一些指标来协助诊断。首先对
6、数据进行初步的分析处理,将肾炎患者视为试验组,将健康者视为对照组。其次对于单一元素而言,不难发现无论是肾炎患者还是健康人,不同人体内相同元素,含量都是随机的在某个范围内上下波动。将两组中各相同元素进行对比,发现肾炎患者与健康者之间相同元素存在覆盖,因此仅研究单个元素是不行的,需多方面考虑。由于问题数据量大,考虑的指标多,属于多元统计分析问题。针对问题一、二:采用判别法建立费歇样本判别模型,在实验组与对照组各取25个样本,运用软件对数据进行判别分析处理,得到相关判别函数系数数据,并确定判别监界值。将剩余实验组与对照组数据代入判别函数进行检验,看诊断结果是否与原诊断一致,并运用马氏距离法知识计算统
7、计检验量值对模型正确性进行检验。运用问题一建立的模型对问题二的数据进行诊断,并得出相应的结果;针对问题三、四:通过实验组与对照组中各相同元素的对比及相关分析,剔除一些对诊断结果影响不大的元素,重新运用判别法及软件建立新的优化模型二。并运用马氏距离法对模型二进行正确行检验。重复对问题二的数据进行诊断,得出相应结果;针对问题五:通过问题二和问题四的结果相互对比,看剔除对诊断结果影响不大元素后,两种判断结果的差异,总结出真正有效的的判别指标。4.模型一的建立与求解4.1模型一的建立1)数据的处理:为了达到能够较为快捷和正确的判别患者是否是肾炎患者还是健康人。我们对已有的确诊数据运用spss软件进行了
8、多元统计分析,利用判别分析的基本思想我们建立了关于Fisher判别函数用于对肾炎患者和健康人的判定。2)目标函数的确立:判别函数:我们先对样本进行了分割,分别在已确诊的健康人群()中来抽样检测和已确诊的肾炎患者()中来抽样检测。取得的样本数为,即取的是病例号为1-25和病例号为31-55的患者。组的判别值为:;组的判别值为:;、组抽取样本平均判别值为:那么监界值为:即为;标准化的典型判别式函数的系数为:;所以目标函数(判别函数)可写为: 约束条件为:3)判别的标准:若,我们则可判定该病例为健康人;若,我们则可判定该病例为肾炎患者。4)模型的检验标准:检验模型:马氏距离检验统计量: 其中第一自由
9、度为,第二自由度为。模型检验通过标准:在差分布表中,如果则判别函数有效否则判别函数无效。4.2模型一的求解与检验:运用软件求得判别函数为: ;判断监界值为=1992.092;函数正则相关性:0.811;对剩下的实验组及对照组进行检验26-30判断一致,56-60中存在误判,其中病例号为60是有病组,(具体见附录表四); 由于判别函数有效。5.问题二的解答运用判别函数对表就诊人员的化验结果进行判断有19个健康者,11个肾炎患者。健康者病例号:70,74,75,80,81,82,84,86,88,89,90;肾炎患者病例号:61,62,63,64,65,66,67,68,69,71,72,73,7
10、6,77,78,79,83,85,87;具体情况见附录(表三)。6.模型二的建立与求解6.1模型的建立1)模型二建立分析:因为问题三提出确定:哪些指标是影响人们患肾炎的关键或主要因素,以便减少化验的指标。所以我们在模型一的基础上对那些确诊肾炎患者和确诊健康人群的平均值作比较剔出那些平均值波动较小的检测元素,选取组检测元素,再次运用spss统计软件对数据进行多元统计分析额,利用判别分析的基本思想我们建立了关于Fisher判别函数用于对肾炎患者和健康人的判定。从而对模型一进行简单优化得出模型二的建立。2)目标函数的确立:判别函数:我们先对样本进行了分割,分别在已确诊的健康人群()中来抽样检测和已确
11、诊的肾炎患者()中来抽样检测。取得的样本数为,即取的是病例号为1-25和病例号为31-55的患者。组的判别值为:;组的判别值为:;、组抽取样本平均判别值为:那么监界值为:即为;标准化的典型判别式函数的系数为:;所以目标函数(判别函数)可写为: 约束条件为:3)判别的标准:若,我们则可判定该病例为健康人;若,我们则可判定该病例为肾炎患者。4)模型的检验标准:检验模型:马氏距离检验统计量: 其中第一自由度为,第二自由度为。模型检验通过标准:在差分布表中,如果则判别函数有效否则判别函数无效。5)方案层:我们运用统计学理论,通过在模型一中对确诊肾炎患者和确诊健康人群的各元素进行了分析与求解,得到Zn,
12、Fe,Ca,Mg这几种元素肾炎病人与健康人差异非常显著因此我们有理由认为,Zn,Fe,Ca,Mg这几种元素是影响人们患肾炎的关键或主要因素,其它几种元素则为次要因素。因此我们提出剔除Cu,K,Na这三种元素进行讨论,得到我们的方案层即考虑Zn,Fe,Ca,Mg为检测元素指标。6.2模型的求解:运用软件求得判别函数为: ; 监界值为=1676.208;函数正则相关性为:0.708;对剩下的实验组及对照组进行检验26-30判断一致,56-60中存在误判,其中病例号为60是有病组,(具体见附录表六)。由于判别函数有效。由于无论再剔除那一组将会使判别函数也将无效 ,正则相关性也会降低。7.问题四的求解
13、运用判别函数对表就诊人员的化验结果进行判断有10个健康者,20个肾炎患者。健康者病例号:70,74,75,80,81,82,86,88,89,90;肾炎患者病例号:61,62,63,64,65,66,67,68,69,71,72,73,76,77,78,79,83,84,85,87;具体情况见附录(表五)。8.问题五的解答问题二判别有11人正常19人为肾炎患者,问题四判别有10人正常20人为肾炎患者且情况基本相同。这说明诊断中所给指标中有些指标元素对肾炎的诊断影响不大,属于小因素。虽然正相关系数降低但是丝毫不影响对肾炎患者和健康人群的判定,继而明确了Zn、Fe、Ca、Mg 元素为判断肾炎的重要
14、指标,也为肾炎检测方面提供参考。9.模型的评价、改进及推广9.1模型的评价优点:运用判别法建立了费歇判别模型,并用马氏距离判别法对模型进行了合理的检验,这确保了模型的正确性与准确性,即很好的解决了就诊人员是否有肾炎问题。此模型容纳了大量的数据信息,保证了信息的最大利用,使得得到的相关信息更加准确。缺点:未能考虑到人为因素对模型造成的影响,如化验前的饮食问题。处理问题时进行了适当的假设,未能考虑到几种元素的相互影响。9.3模型的改进考虑几种元素的相互作用,并进行相关的处理如两种元素,三种元素相互作用时的影响,这就使得检验结果更加准确,更具有说服力。对数据进行详细的分析,建立两个以上的诊断模型,使
15、得诊断结果更加可信,提高诊断的准确率。9.4模型的推广可以利用到对其他医学疾病的检测之中,可以用于工业生产中对一些生产指标进行检测分析等等。10.参考文献1 何晓群 编著,多元统计分析,中国人民大学出版社,第二版,2008.9;2茆诗松、王静龙、濮晓龙 编著,高等数理统计,高等教育出版社,第二版,2006.05;附录:表一:病例号ZnCuFeCaMgKNa116615.824.5700112179513218515.731.570112518442731939.825.9541163128642415914.239.789699.2239726522616.223.860615270.3218
16、61719.299.2930718745.5257720113.326.655110149.4141814714.53065910215468091728.857.8655175.798.43181015611.532.56391071035521113215.917.757892.4131413721218211.311.3767111264672131869.2637.195823373347141628.2327.162510862.4465151506.63216271401796391615910.711.761219098.53901711716.17.0498895.513657
17、21818110.14.0414371841015421914620.723.8123212815010922042.310.39.762993.74398882128.212.453.137044.14548522215413.853.36211051607232317912.217.9113915045.22182413.53.3616.813532.651.6182251755.8424.980712355.61262611315.847.362653.61686272750.511.66.360858.958.91392878.614.69.742170.813346429903.27
18、8.1762252.37708523017828.832.499211270.2169以下是健康人的检查数据:3121319.136.22220249401683217013.929.8128522647.93303316213.219.8152116636.2133342031390.8154416298.93943516713.114.1227821246.31343616412.918.6299319736.394.5371671527205626064.62373815814.437102510144.672.53913322.83116334011808994015613532267
19、471090228810411698308106899.1532894224717.38.65255424177.9373431668.162.81233252134649442096.4386.9215728874219451826.4961.738704321433674623515.623.4180616668.81884717319.117249729565.82874815119.764.220314031828744919165.43553613921376885022324.486360335397.74795122120.11553172368150739522172528.2
20、23433731104945316422.235.52212281153549541738.993616242161032575520218.617.737852253167.35618217.324.8307324650.7109572112417383642873.53515824621.593.2211235471.71955916416.138213515264.3240601792135156022647.9330表二:待检验组病例号ZnCuFeCaMgKNa6158.25.4229.7323138179513621061.8740.5542177184427631520.8012.
21、513321761286466485.51.703.9950362.3238762.6651440.7015.154779.771.0218.56685.71.094.279017045.8257.9671440.309.1141755249.5141.5681704.169.32943260155680.8691760.5727.331813399.4318.8701927.0632.91969343103553711888.2822.6120823113141372721535.8734.8328163264672.5731432.8415.726512373.0347.57421319.
22、136.2222024962.0465.87519220.123.8160615640.01687617110.530.567214547.0330.57716213.219.8152116636.21337820313.090.8154416298.9394.57916420.128.9106216147.3134.58016713.114.1227821236.596.58116412.918.6299319765.5237.88216715.027.0205626044.872.08315814.437.01025101180899.58413322.831.31633401228289
23、851698.030.8106899.153.08178624717.38.65255424177.5373.5871853.9031.31211190134649.8882096.4386.9215728874.0219.8891826.4961.73870432143367.59023515.623.4180616668.9188表三:待检人员检测结果(问题二结果表)病例号判别函数值判别类型检测结果病例号判别函数值判别类型检测结果61323.189待测肾炎者76812.240待测肾炎者62661.850待测肾炎者771959.949待测肾炎者631560.788待测肾炎者781922.67
24、待测肾炎者64413.289待测肾炎者791372.912待测肾炎者65668.418待测肾炎者802953.211待测健康者661005.364待测肾炎者813798.565待测健康者67805.86待测肾炎者822713.622待测健康者681103.98待测肾炎者831031.666待测肾炎者69381.526待测肾炎者842193.785待测健康者702492.878待测健康者851107.41待测肾炎者711295.969待测肾炎者863212.350待测健康者72294.158待测肾炎者871414.507待测肾炎者73287.615待测肾炎者882839.314待测健康者7427
25、67.099待测健康者895027.220待测健康者752040.909待测健康者902301.004待测健康者表四:模型一标准样本检测病例号判别函数值确诊类型判别结果病例号判别函数值确诊类型判别结果26602.649肾炎者正确563970.886健康者正确27742.9523肾炎者正确574940.250健康者正确28398.728肾炎者正确582812.280健康者正确29584.741肾炎者正确592692.040健康者正确301235.243肾炎者正确601967.208健康者不正确对模型一Spss运行结果:特征值函数特征值方差的 %累积 %正则相关性11.925a100.0100.0
26、.811a. 分析中使用了前 1 个典型判别式函数。Wilks 的 Lambda函数检验Wilks 的 Lambda卡方dfSig.1.34247.7647.000协方差矩阵aVAR00008VAR00001VAR00002VAR00003VAR00004VAR00005VAR00006VAR00007合计VAR000012016.68961.446207.29120310.0831799.802-2998.011-4520.614VAR0000261.446368.056667.72818838.7252592.735270.9471441.079VAR00003207.291667.728
27、3820.30737253.2545744.155-165.2582184.789VAR0000420310.08318838.72537253.2541753948.842181816.402-32775.767-6798.303VAR000051799.8022592.7355744.155181816.40226554.023-2211.1936656.921VAR00006-2998.011270.947-165.258-32775.767-2211.19336284.27239325.441VAR00007-4520.6141441.0792184.789-6798.3036656.
28、92139325.44183676.901a. 总的协方差矩阵的自由度为 49。标准化的典型判别式函数系数函数1VAR00001.005VAR00002-1.356VAR00003.365VAR000041.261VAR00005.586VAR00006.115VAR00007-.373运行程序:DISCRIMINANT /GROUPS=VAR00008(1 2) /VARIABLES=VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 /ANALYSIS ALL /PRIORS EQUAL /STATISTICS=ME
29、AN STDDEV COEFF RAW TCOV /CLASSIFY=NONMISSING POOLED.Lingo运行程序:model:sets:object/1.7/:w,x;endsetsdata:w=0.005 -1.356 0.365 1.261 0.586 0.115 -0.373;x=(自变量)enddatay=sum(object(i):w(i)*x(i);表五:问题四的结果病例号判别函数值判别类型检测结果病例号判别函数值判别类型检测结果61323.694待测肾炎者76718.971待测肾炎者62557.905待测肾炎者771592.764待测肾炎者631389.139待测肾炎
30、者781642.942待测肾炎者64553.883待测肾炎者791118.487待测肾炎者65594.669待测肾炎者802369.472待测健康者66805.117待测肾炎者813317.557待测健康者67337.364待测肾炎者822128.443待测健康者68967.468待测肾炎者831095.024待测肾炎者69354.434待测肾炎者841642.659待测肾炎者702025.158待测健康者851142.417待测肾炎者711258.552待测肾炎者862672.207待测健康者72351.682待测肾炎者871272.869待测肾炎者73289.864待测肾炎者882249.
31、894待测健康者742317.375待测健康者893983.605待测健康者751693.481待测健康者901911.862待测健康者表六:对模型二的标准样本检测病例号判别函数值确诊类型判别结果病例号判别函数值确诊类型判别结果26680.274肾炎者正确563194.791健康者正确27634.0515肾炎者正确573949.197健康者正确28445.334肾炎者正确582198.332健康者正确29662.428肾炎者正确592239.449健康者正确301062.973肾炎者正确601625.851健康者不正确对模型二Spss运行结果:协方差矩阵aVAR00005VAR00001VAR
32、00002VAR00003VAR00004合计VAR000012016.689207.29120310.0831799.802VAR00002207.2913820.30737253.2545744.155VAR0000320310.08337253.2541753948.842181816.402VAR000041799.8025744.155181816.40226554.023a. 总的协方差矩阵的自由度为 49。Wilks 的 Lambda函数检验Wilks 的 Lambda卡方dfSig.1.49931.9934.000特征值函数特征值方差的 %累积 %正则相关性11.005a100
33、.0100.0.708a. 分析中使用了前 1 个典型判别式函数。标准化的典型判别式函数系数函数1VAR00001.298VAR00002.183VAR000031.041VAR00004-.256Spss运行程序:DISCRIMINANT /GROUPS=VAR00008(1 2) /VARIABLES=VAR00001 VAR00002 VAR00003 VAR00004 VAR00005 VAR00006 VAR00007 /ANALYSIS ALL /PRIORS EQUAL /STATISTICS=MEAN STDDEV COEFF RAW TCOV /CLASSIFY=NONMISSING POOLED.Lingo运行程序:model:sets:object/1.4/:w,x;endsetsdata:w= 0.298 0.183 1.041 -0.256;x=(自变量)enddatay=sum(object(i):w(i)*x(i);- 29 - / 29
限制150内