有关与回归分析过程.ppt
《有关与回归分析过程.ppt》由会员分享,可在线阅读,更多相关《有关与回归分析过程.ppt(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、,相关与回归,相关分析简介,在医学科学研究中,常常要分析两个变量之间的关系,例如身高和体重、年龄和血压、体温和脉搏、药物剂量和疗效等问题,因此涉及到研究两个变量的相互关系。这时就涉及到两个变量之间的相关与回归。,积差相关系数,又称Pearson相关系数:定量描述线性相关程度好坏的常用指标,只适用于两变量呈线性相关时。 特点: 相关系数r 是一个无单位的量值,且-1 0 为正相关,r 0 为负相关; r 越接近于1,说明相关性越好;越接近于0,相关性越差。 Spearman等级相关系数:当数据不满足条件双变量正态时。,相关分析简介,连续变量的相关指标(最常见),Gamma统计量:描述有序分类变量
2、数据联系强度的指标,以下指标都是基于Gamma统计量衍生出来的。 Kendalls Tau-b:反映两个有序分类变量的一致性。 Kendalls Tau-c: 对Kendalls Tau-b进行了校正。,相关分析简介,有序变量的相关指标,列联系数:基于2值得出 Phi and Cramers V:也是基于2值得出 Lambda 系数:用于反映自变量对因变量的预测效果 不确定系数,相关分析简介,名义变量的相关指标,Eta Kappa 值 OR、RR等,相关分析简介,其他相关指标,相关分析简介,实际上,在Freq过程中measures选择项提供了非常整齐的相关分析指标体系,如上图。,除了Freq过
3、程的measures选择项外,SAS还提供了其他更专业的相关分析过程:,PROC CORR 过程:线性相关、秩相关和偏相关分析 PROC CANCORR 过程:典型相关分析(略),相关分析简介,相关分析CORR过程:,功能:分析变量间的相关关系 格式: Proc corr ; Var 分析变量1分析变量p; Partial 分析变量1分析变量p; freq 频数变量; With 分析变量;,说明: 1、Corr语句后的选择项很多,主要 是一些控制的功能。 2、var语句指明的分析变量。 3、partial语句作偏相关分析 4、freq语句指明频数变量 5、with语句用来指定和var语句中的
4、变量形成特定的组合。,例1 某医院研究某种代乳粉的营养价值是用大白鼠做试验,得大鼠进食量和体重增量间的关系的原始数据如下,试分析两者有无直线相关关系。,进食量和体重增量的数据,简单相关分析,首先绘制散点图,结果如下:,简单相关分析,两变量间存在线性相关趋势 没有发现明显的异常值,Data corr_1; Input x y; Cards; 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; Proc corr spearman; Var x y; Run;,pearson相关系数和p值,Sp
5、earman相关系数和P值,指定计算spearman秩相关系数, 默认时只计算pearson相关系数。,大家可以发现,对相同的数据,秩相关系数的绝对值比积差相关系数小,为什么?,简单相关分析,显然,这是由于在秩变换或数据按有序分类处理时损失信息所导致的。,前面介绍的相关分析是分析两个计量资料间的关系,在计算积差相关系数、Spearman 相关系数时候,都没有考虑第三方的影响,这就导致可能对事物的解释出现偏差。下面以一个例子对此作进一步的说明。,偏相关分析,表1 32例40岁以上男性的BMI指数、年龄、吸烟与收缩压实测值,续表一,续表二,Data corr_2; Input y x1-x3; C
6、ards; 1354502.876 1224103.251 1304903.100 1585203.768 1465412.979 1294712.790 1626013.668 1575413.612 1444412.368 1806414.637 1665913.877 ;,Proc corr data=corr_2; Var y x2 x3; Partial x1; Run;,控制x1影响后的结果,例4 仍以前数据为例,进一步作回归分析,计算进食量与体重增量之间的回归方程。,分析: 与相关分析类似,在回归分析之前首先要考虑的问题是两变量是否存在某种趋势,通过前面的散点图已经得到了肯定的结
7、论,因此直接进行回归分析。,简单回归分析,绘制散点图如下:,简单回归分析,两变量间存在线性相关趋势 没有发现明显的异常值,回归分析过程,功能:拟合线性回归模型 格式: Proc reg ; Model 因变量=自变量; Freq 频数变量; Plot ; Run;,Reg过程的选择项较多,用法也比较 复杂,但常用的选择项不多也容易掌 握,说明如下: 1、reg后的选择项主要是对data的一 些操作,比如:data=数据集。 2、model语句后的选择项主要进行自 变量的筛选,比如:selection=stepwise等。 3、freq语句后频数变量。 4、plot语句可以输出各类散点图,符 号
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 有关 回归 分析 过程 进程
限制150内