多元统计分析与中医证候规范化研究.pdf
《多元统计分析与中医证候规范化研究.pdf》由会员分享,可在线阅读,更多相关《多元统计分析与中医证候规范化研究.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、http:/-1-多元统计分析与中医证候规范化研究多元统计分析与中医证候规范化研究1 白云静1,申洪波2,王乐1,孟庆刚1 1 北京中医药大学,北京(100029)2 中国中医药科技开发交流中心,北京(100027)E-mail: 摘摘 要:要:多元统计方法主要探讨高维数据的内在规律,是数理统计学中近 20 多年来迅速发展的一个分支,由于建立统一、客观的中医证候诊断标准是目前中医研究工作的重点,因此许多学者尝试用多元统计方法进行研究,为证候研究引入了规范和量化的数学表述。多元统计方法用于证候研究的方法有:主成分分析、因子分析、聚类分析、回归分析、判别分析、对应分析等。本文从确立基本证型、筛选优
2、化指标、确立优化指标的权重、建立证候数学模型等 4 个环节上介绍了多元统计分析在中医证候诊断标准领域的应用,并指出:多元统计分析是研究多因素和多指标问题的统计分析方法,证候诊断学正是研究疾病的多种证型与多种症状之间的关系问题,因此,可以将多元统计分析应用于中医证候的规范化研究中。但是,由于各种多元统计分析方法自身的特点,在具体的应用中又都存在着各自的局限,有些通过几种方法联合应用可以克服,但有些却是克服不了的,在实际应用中要灵活掌握。关键词:关键词:多元统计分析,证候,规范化研究 中图分类号:中图分类号:R 文献标识码:文献标识码:B 多元统计方法主要探讨高维数据的内在规律,是数理统计学中近2
3、0多年来迅速发展的一个分支。由于电子计算机的使用日益广泛,多元分析的方法也很快地应用到各个领域,从自然科学到社会科学的许多方面,都已证实了多元分析方法是一种很有效的数据处理方法。建立统一、客观的中医证候诊断标准是目前中医研究工作的重点。许多学者尝试用多元统计方法进行研究,为证候研究引入了规范和量化的数学表述。多元统计方法的种类很多,一般用于证候研究的有:主成分分析、因子分析、聚类分析、回归分析、判别分析、对应分析等。其在证候研究中的应用常集中在确立基本证型、筛选优化指标、确立优化指标的权重、建立证候数学模型等 4 个环节上。本文拟从此四方面阐述多元统计方法在中医证候研究领域的应用情况。1.确立
4、基本证型确立基本证型 证候是对疾病某一时点病理状态的综合反映。证候通常是以疾病为载体的,虽然临床遣方用药多依证而立,但是此时的证候却常依赖于某一疾病而存在,对证候的认识是建立在对疾病的准确把握基础上的,即呈现在医者面前的是疾病统辖下的证候,因此,目前的证候研究多是通过病辖诸证的形式,这样便于把握证候的本来面目。采用病辖诸证的形式确立疾病的基本证型研究主要有两种情况:1.1 根据文献分析、专家经验确立基本证型。根据文献分析、专家经验确立基本证型。根据文献分析、专家经验确立所研究疾病的基本证型后,又可根据研究目的的不同分为以下三种情况:1.1.1 直接作为该病的基本证型,对这些证型包含的诊断指标进
5、行优化指标的筛选研究。如:李永健等1在确立肝癌 6 个基本证型后,从以往的 2060 例肝癌流行病学调查资料中随机选出辨证结果为单证的 154 例,初步筛选指标后,进行非条件 Logistic 回归分析,最终确立了 1本课题得到国家自然科学基金(NO:90409005)、教育部博士点基金(20050026011)、国家中医药管理局基金(02-03LP15)和国家科技支撑计划课题(2006BA108B05)的资助。http:/-2-上述 6 个基本证型的诊断优化指标。1.1.2 将确立的基本证型作为假设研究证型,与通过对该组资料的聚类分析、主成分分析、因子分析等方法提取的基本证型进行对比,从而验
6、证后者的诊断准确性。如周慎2首先拟定中风病的假设证型及诊断标准。然后对 757 例样本中的 592 例进行 Bayes 判别分析,得出4 种基本证型 26 个指标的判别函数后,计算 165 例验证样本各证型的后验概率,并将判别结果与原假设证型进行比较,以判别验证效果。1.1.3 将确立的基本证型作为假设辨证标准,在此基础上进行诊断指标的初步筛选,为今后优化指标的进一步严格筛选奠定基础。如申春悌等3首先通过文献复习及古籍整理研究,制订了更年期综合征的 4 种假设证型;然后在假设证型的基础上对指标进行初步筛选,继而进行多元统计分析,最终建立了更年期综合征的证候诊断标准。1.2 不设立基本证型,通过
7、对流调资料的统计分析确立基本证型不设立基本证型,通过对流调资料的统计分析确立基本证型 这种方法由于对证候未作规定,因而保证了症状的客观性,避免了因证候诊断所带来的偏倚。常用的有聚类分析、主成分分析、因子分析等方法。1.2.1 聚类分析聚类分析 聚类分析是研究分类问题的常用统计方法,在不知道应分几类的情况下,可对现有资料进行适当的归类,因此,该法常被用于确立基本证型的研究。如:李欣等4采用聚类分析确立了支气管扩张症的基本证型;王红玉等5采用聚类分析确立了亚健康状态人群的常见证候和次常见证候。1.2.2 主成分分析主成分分析 主成分分析可以将多个变量通过降维,化为少数几个互不相关的综合变量,这些综
8、合变量能够涵盖绝大部分原始的信息。利用这种方法可以从多个原始指标中提取出少数几个综合性指标,即证型。主成分分析常与聚类分析联合应用。如:王氏等6对中风病大规模流调资料(3909 例)中有显著性意义的证候相关因素分别进行了聚类分析和主成分分析,按症状的属性得出了中风病中医证型的分类,并从中得出结论:证候的症状(变量)之间的多重共线性形成了复杂的多元非线性关系,多元统计分析可客观地评价各症状在证候中所处的地位和作用,是揭示中医证候复杂关系的有效方法。刘氏等7在对乳腺癌术后患者进行症状问卷调查的基础上,首先进行样品聚类分析,确定基本分类后,再结合每一类的主成分分析结果,最终确立了乳腺癌术后稳定期患者
9、的 5 种基本证型。1.2.3 因子分析因子分析 因子分析可从多个原始指标中找到少数几个能够解释这些原始指标的不可测变量(公因子),组成证候的一组症状受一个证候实质支配,实际上也可看作受一个公因子支配,提取出该公因子即可以模拟出该证候的近似模型。因此,许多学者认为用因子分析法对流调资料进行基本证型的提取比较合理。如查氏等8对 469 例类风湿关节炎的四诊信息进行因子分析,最终提取出四个公因子,根据中医理论确定其中的三个公因子分别与肝肾亏虚、寒、热的证候表现有关,可分别称为虚因子、寒因子和热因子;徐丽华等9通过对700 例慢性支气管炎患者四诊信息的证实性因子分析(CFA),确立了慢性支气管炎“痰
10、”、“瘀”、“虚”三大证候的诊断标准。在确立基本证型的研究中有时也将聚类分析与因子分析联合应用。如:张琴等10对一组肝炎后肝硬化的证候流调资料(310 例),联合应用因子分析与聚类分析方法,最终确立了肝炎后肝硬化的 7 个基本证型。2.筛选优化指标筛选优化指标 证候是开放的复杂系统,具有多维界面的特征,在不同的机体、不同的疾病、疾病发展http:/-3-的不同阶段甚至不同的观察视角下,常呈现出不同的形式(界面),显然,证候所包含的诊断因素纷繁而复杂。这种情况为中医证候的规范研究增加了相当的难度,因此,筛选优化指标就成为建立临床操作性较强的证候诊断标准的当务之急。当然,由于目前建立证候诊断数学模
11、型的多元统计方法如因子分析、判别分析等均需输入建模所用的全部指标,建立在全部诊断指标基础上的诊断模型非常繁琐,难于操作,所以,筛选优化指标也成为进一步建模的必由之路。目前,筛选优化指标的方法多用因子分析、回归分析、逐步判别分析等,但具体操作方法却差异较大,归纳起来主要有 4 种情况,即:2.1 初步筛选指标初步筛选指标 为了全面反应证候信息,一般制定流行病学调查表时应提供尽可能多的候选相关因素,这给多元统计分析增加了一定的难度。所以,一般在进行多元统计分析前,首先进行指标的初步筛选。指标的初步筛选包括两种情况,一是直接根据症状的出现频率进行取舍。一般先选取临床和统计学意义大于 10%出现率的指
12、标9;二是根据统计分析的结果进行取舍。如:申春悌等3对一组更年期综合征的流行病学资料进行多元统计分析前,首先对所有入选指标做单变量分析,筛选对几种假设证型的区别有统计学意义的指标,最终确定 73 个指标进入统计分析。2.2 聚类分析与因子分析结合聚类分析与因子分析结合 确定初步的候选指标后,一种筛选方法是将聚类分析与因子分析相结合。首先对进入分析的指标进行指标聚类分析,将指标聚为相对合理的基本证类;继而进行因子分析,以提取合理的公因子,进一步筛选相对更优化的指标。如申春悌等3对经过初步筛选的 73 个指标进行指标聚类分析,最终确认将上述指标聚为 5 类比较合理,其中的 4 类与研究前的假设证型
13、符合;然后在聚类的基础上进行探索性因子分析和证实性因子分析,根据因子载荷阵确立了最终的优化指标。2.3 回归分析回归分析 对经过初步筛选的指标可进行逐步回归分析进行进一步的筛选。如李永健等1采用非条件 Logistic 回归分析,最终确立了肝癌 6 个基本证型的诊断优化指标。3.确立优化指标的权重确立优化指标的权重 临床上,证候相关因素对诊断证候所起的作用并不完全一致。因此,可以根据相关因素对证候贡献程度的大小而赋予不同的分值,即确立各优化指标在证候中的权重。目前,多用相关的多元统计分析方法如回归分析、因子分析等进行研究。3.1 多因素回归分析多因素回归分析 多因素回归分析是应用较多的方法,在
14、早期的研究中,主要根据逐步线性回归分析中各指标的标准偏回归系数及偏回归平方和计算其对证候的贡献值,这种方法对后来的相关研究影响很大;近几年的研究有学者采用 Logistic 回归分析,根据各指标的标准偏回归系数,确定各优化指标对证型诊断的贡献度11。3.2 因子分析因子分析 http:/-4-在根据因子分析的因子载荷阵进行筛选指标的同时,可根据因子分析中因子载荷的大小确定证候的主、次症。如徐氏等9以因子载荷 0.4 作为界点(0.4 为主症,0.4 为次症),根据因子分析中每个指标的因子载荷的大小,确立了慢性支气管炎“痰”、“瘀”、“虚”三大证候的诊断标准;申氏等3 也以因子分析中载荷系数0.
15、4 为临界值,建立了更年期综合征分证诊断标准。4.建立证候诊断模型建立证候诊断模型 证候是疾病某一阶段的病因、病位、病性、病机、病势等的病理总概括。证候学研究的主要目的就是通过对证候特征的分析,找出辨证的规律。通过用数理分析的方式总结中医辨证的规律,可以确定辨证的函数关系、建立证候诊断数学模型。证候特征的量化研究,就是试图建立一个合理的判别方程,用各资料之间量化的函数关系来阐释证候特征,使中医辨证实现数字化、科学化。模型的建立方法多与进行优化指标筛选的多元统计方法有关,常用的有以下几种。4.1 判别分析法判别分析法 判别分析也是研究分类问题的统计方法,但与聚类分析不同的是:它是在已知资料分类情
16、况的前提下,判定观察对象的归属。常用于建立证候的判别函数或验证所建模型的性能。如汪受传等12对筛选出的 9 项指标进行逐步判别分析,初步建立了小儿病毒性肺炎 5 种证型的判别函数;罗团连等13对一组流调资料采用最大似然判别法进行判别分析,从而建立了中医肝脏 5 种证型的计量鉴别诊断表,临床验证符合率达 84%100%。4.2 回归分析法回归分析法 利用 Logistic 回归分析,不仅可以筛选变量,也可以建立证候的数学模型。如吴大嵘等11采用非条件和配对的条件 Logistic 回归分析,建立了急性期中风病血瘀证的证候预测模型,并采用临床调查的结果对模型进行了验证。刘氏等14对中医各科 129
17、 种疾病脾气虚证的诊断因素作了逐步回归分析,得到了一个能代表各系统脾气虚证共性特点的回归方程,并验证了该方程的诊断性能,认为方程中的十七种因素可作为确立脾气虚证诊断标准的主要参考因素。5.结语结语 多元统计分析是研究多因素和多指标问题的统计分析方法,证候诊断学正是研究疾病的多种证型与多种症状之间的关系问题,因此,可以将多元统计分析应用于中医证候的规范化研究中。但是,由于各种多元统计分析方法自身的特点,在具体的应用中又都存在着各自的局限,有些通过几种方法联合应用可以克服,但有些却是克服不了的,在实际应用中要灵活掌握。http:/-5-参考文献参考文献 1.李永健,方肇勤,唐辰龙,等.154 例原
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 中医 规范化 研究
限制150内