多元统计分析讲座.pdf
《多元统计分析讲座.pdf》由会员分享,可在线阅读,更多相关《多元统计分析讲座.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、多元统计分析多元统计分析Multivariate Analysis Multivariate Analysis-An An IntroductionIntroduction(MVAMVA)临床评价中心白文静2007-02-162内 容内 容 我们的研究工作?我们的研究工作?什么是多元统计分析?什么是多元统计分析?为什么需要用到多元统计分析?为什么需要用到多元统计分析?有哪些分析方法?如何选择有哪些分析方法?如何选择 Logistic回归分析回归分析 因子分析介绍及举例因子分析介绍及举例 结论结论2007-02-163多元统计分析多元统计分析conclusionsDatabaseanalysis
2、Design统计需要参与到整个研究过程中!统计需要参与到整个研究过程中!复杂问题背后的简单表述复杂问题背后的简单表述医生(领域专家、临床医生)医生(领域专家、临床医生)统计学专家统计学专家实验室数据实验室数据临床试验数据临床试验数据问卷调研数据问卷调研数据基本统计分析基本统计分析多元统计分析多元统计分析研究工作流程图研究工作流程图2007-02-164多元统计分析多元统计分析 什么是多元统计分析呢?什么是多元统计分析呢?单因素分析单因素分析单因素分析单因素分析 多因素分析多因素分析多因素分析多因素分析单因素分析方法:单独地研究每个因素对结果的影响;多因素分析方法:分析多个因素对结果的单独作用和
3、对结果的联合作用。2007-02-165相关分析相关分析交叉表交叉表参数检验参数检验非参数检验非参数检验描述分析描述分析回归分析回归分析四分位距四分位距方差方差频率频率均值均值中位数中位数单 因 素 统 计单 因 素 统 计2007-02-166多 因 素 统 计多 因 素 统 计判别分析判别分析多元方差分析多元方差分析相关分析相关分析结构方程模型结构方程模型因子分析因子分析回归分析回归分析聚类分析聚类分析曲线回归曲线回归概率单位回归概率单位回归二值逻辑回归二值逻辑回归有序回归有序回归线性回归线性回归岭回归岭回归分层聚类分层聚类快速聚类快速聚类主成分回归主成分回归岭回归岭回归生存分析生存分析2
4、007-02-167多元统计分析多元统计分析 为什么会用到多元统计分析呢?为什么会用到多元统计分析呢?联合作用!联合作用!联合作用!联合作用!临床研究的因果效应往往受多种因素的综合影响,单因素分析常受混杂因素的干扰而难获得真实结果。进行多元统计分析则可获得更为全面而真实的结论。临床研究的因果效应往往受多种因素的综合影响,单因素分析常受混杂因素的干扰而难获得真实结果。进行多元统计分析则可获得更为全面而真实的结论。2007-02-168多元统计分析多元统计分析 证候证候 干预干预 症状1症状1 症状2症状2 症状n症状n单因素统计分析单因素统计分析2007-02-169多元统计分析多元统计分析 一
5、个一个研究者研究者可能不了解所有的分析技术细节可能不了解所有的分析技术细节 但是应该能够正确地选择适当的方法但是应该能够正确地选择适当的方法 使用多元技术,你不必知道详细的数学公式-但是你应当明白它的原理,结果的解释使用多元技术,你不必知道详细的数学公式-但是你应当明白它的原理,结果的解释 多元分析并不是魔术棒,不需要我们开动脑筋就能解决问题-它不会轻易告诉你答案多元分析并不是魔术棒,不需要我们开动脑筋就能解决问题-它不会轻易告诉你答案 如果设计的很差,多元分析就很难发挥作用如果设计的很差,多元分析就很难发挥作用2007-02-1610常用的多元分析技术常用的多元分析技术如何选择恰当的多元统计
6、方法?如何选择恰当的多元统计方法??分析目的分析目的 多元线性回归分析多元线性回归分析 多元logistic回归分析多元logistic回归分析 生存分析生存分析 判别分析判别分析 时间序列分析时间序列分析 路径分析路径分析 结构方程分析结构方程分析依存关系依存关系依存关系依存关系 聚类分析聚类分析 主成分分析主成分分析 因子分析因子分析 多元相关分析多元相关分析 典型相关分析典型相关分析相互关系相互关系相互关系相互关系疾病的计量诊断;病症、药物疗效疾病的计量诊断;病症、药物疗效疾病的病因学分析;疾病的病因学分析;疾病危险因素/保护因素的寻找;疾病危险因素/保护因素的寻找;患者治疗后生存分析;
7、患者治疗后生存分析;证候症状关系;证候症状关系;多个医学指标的分类与筛选;多个医学指标的分类与筛选;两群多个医学指标间的关系;两群多个医学指标间的关系;寻找能反映多个医学指标的综合指标;寻找能反映多个医学指标的综合指标;症状群的研究。症状群的研究。2007-02-1611常用的多元分析技术常用的多元分析技术 与回归有关的分析与回归有关的分析xyx2yx3x1x1y11x2x3y2231x1y1x2x3y22x4y3一元回归路径图多元回归路径图多变量回归分析路径图路径分析路径图一元回归路径图多元回归路径图多变量回归分析路径图路径分析路径图2007-02-1612反映反映依存依存关系的多元统计方法
8、关系的多元统计方法?多元线性回归分析:多个自变量对一个定量类型变量的作用;多元线性回归分析:多个自变量对一个定量类型变量的作用;?多元多元logistic回归分析回归分析:多个自变量对一个定性类型变量的影响;:多个自变量对一个定性类型变量的影响;?生存分析:生存时间的分布规律以及生存时间和相关因素之间关系;生存分析:生存时间的分布规律以及生存时间和相关因素之间关系;?判别分析:用一批已经具有明确分类的样品,根据特定测量指标建立一个或多个判别函数;判别分析:用一批已经具有明确分类的样品,根据特定测量指标建立一个或多个判别函数;?时间序列分析:受到时间性因素:季节、长期趋势、循环变动等时间序列分析
9、:受到时间性因素:季节、长期趋势、循环变动等?路径分析:描述变量间的间接作用;克服了自变量独立的强假设路径分析:描述变量间的间接作用;克服了自变量独立的强假设?结构方程分析:含有潜在因子的路径分析模型。结构方程分析:含有潜在因子的路径分析模型。2007-02-1613反映反映相互相互关系的多元统计方法关系的多元统计方法?聚类分析:将若干个对象按属性相似的程度进行归类;可以对样本聚类,也可以对指标聚类;聚类分析:将若干个对象按属性相似的程度进行归类;可以对样本聚类,也可以对指标聚类;?主成分分析:减少指标的个数同时尽量不损失或少损失原指标变量所含信息。将非独立变量转化为独立变量,为依存分析作准备
10、。主成分分析:减少指标的个数同时尽量不损失或少损失原指标变量所含信息。将非独立变量转化为独立变量,为依存分析作准备。?因子分析:探索性因子分析和验证性因子分析因子分析:探索性因子分析和验证性因子分析?典型相关分析:两组变量间的相关性研究。典型相关分析:两组变量间的相关性研究。2007-02-1614常用的多元分析技术常用的多元分析技术 如何选择恰当得多元统计方法?如何选择恰当得多元统计方法??资料的分布资料的分布 单变量单变量均均为正态分布为正态分布 样本含量较大样本含量较大?样本含量样本含量 一般为研究因素个数的510倍,少于50例不宜一般为研究因素个数的510倍,少于50例不宜?资料类型资
11、料类型 数值变量(计量资料)数值变量(计量资料)无序分类变量(计数资料)无序分类变量(计数资料)有序分类变量(等级资料)有序分类变量(等级资料)不同方法,适用的变量类型不同!不同方法,适用的变量类型不同!不同方法,适用的变量类型不同!不同方法,适用的变量类型不同!2007-02-1615常用的多元分析软件常用的多元分析软件 SPSS 15.0 操作简单SPSS 15.0 操作简单 SAS 9.1 灵活SAS 9.1 灵活 EQS/LISREL 结构方程模型EQS/LISREL 结构方程模型 S-plus 数学运算S-plus 数学运算 Eviews 3.1 时间序列Eviews 3.1 时间序
12、列2007-02-1616Logistic 回归分析篇回归分析篇Logistic Regression AnalysisLogistic Regression Analysis2007-02-1617结构结构 什么是Logistic 回归分析?什么是Logistic 回归分析?尝试通过练习了解它尝试通过练习了解它 应用场合应用场合 软件实现软件实现2007-02-1618LogisticLogistic 回归分析基本原理回归分析基本原理利用一组观测数据拟和利用一组观测数据拟和logisticlogistic模型,然后借助这个模型来揭示总体中若干自变量与一个因变量取某个值的概率之间的依存关系,并
13、评估该模型模拟相关事物变化规律的准确性。模型,然后借助这个模型来揭示总体中若干自变量与一个因变量取某个值的概率之间的依存关系,并评估该模型模拟相关事物变化规律的准确性。1.000.750.500.250.0LogisticLogistic曲线曲线PX2007-02-1619Logistic 回归分析基本原理回归分析基本原理 因变量为分类型变量时,因变量为分类型变量时,生存与死亡;有病与无病;有效与无效;生存与死亡;有病与无病;有效与无效;疾病程度(轻度、中度、重度);治疗效果(治愈、显效、好转、无效)疾病程度(轻度、中度、重度);治疗效果(治愈、显效、好转、无效)数学上,用概率来表示数学上,用
14、概率来表示x与与y的关系!的关系!患病的概率与危险因素患病的概率与危险因素2007-02-1620一元一元logistic回归举例回归举例【例】66975155013511750621880115095113501949684750950未患BPD患BPD观察人数组中值出生时体重(g)BirthwtBPD(223例)调查数据新生儿出生体重是否是支气管发育不良的影响因素?BirthwtBPD(223例)调查数据新生儿出生体重是否是支气管发育不良的影响因素?新生儿出生体重是否是支气管发育不良的影响因素?新生儿出生体重是否是支气管发育不良的影响因素?2007-02-1621SPSS2007-02-1
15、622(1)卡方检验(1)卡方检验birthwt*bpd Crosstabulation19496827.9%72.1%100.0%62188077.5%22.5%100.0%6697588.0%12.0%100.0%1477622365.9%34.1%100.0%Count%within birthwtCount%within birthwtCount%within birthwtCount%within birthwt75011501550birthwtTotal01bpdTotalChi-Square Tests64.709a2.00065.2292.00055.7571.000223P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 统计分析 讲座
限制150内