两变量间相关与回归分析.ppt
《两变量间相关与回归分析.ppt》由会员分享,可在线阅读,更多相关《两变量间相关与回归分析.ppt(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第十一章 两变量间相关与回归分析 对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系,称确定性关系。若两变量之间确实存在着某种关系,但这种关系不是一一对应的函数关系,称非确定性关系。第一节第一节 直线相关直线相关 一、直线相关的概念一、直线相关的概念 描述两个变量相互关系最简单的统计方法描述两个变量相互关系最简单的统计方法就是直线相关分析:两个变量是否有直线相关就是直线相关分析:两个变量是否有直线相关关系关系?如果有直线相关关系,那么它们之间的如果有直线相关关系,那么它们之间的关系是正相关还是负相关关系是正相关还是负相关?相关程度如何?相关程度
2、如何?散点图散点图 图图11-1 两变量相关关系示意图两变量相关关系示意图二、相关系数的定义与计算二、相关系数的定义与计算 相关系数(相关系数(correlation coefficientcorrelation coefficient)又称为积差)又称为积差相关系数(相关系数(coefficient of product moment coefficient of product moment correlationcorrelation)、皮尔逊相关系数()、皮尔逊相关系数(Pearsons Pearsons correlation coefficientcorrelation coeff
3、icient)、简单相关系数)、简单相关系数(simple correlation coefficientsimple correlation coefficient)等)等,以符号以符号r r表表示样本相关系数,示样本相关系数,表示总体相关系数。它说明具有表示总体相关系数。它说明具有直线关系的两个变量,相关关系的密切程度与相关方直线关系的两个变量,相关关系的密切程度与相关方向的指标。向的指标。其值为其值为r。计算公式计算公式 三、相关分析的步骤三、相关分析的步骤 例例11-1某医师测得某医师测得10名名3岁儿童的体表岁儿童的体表面积面积(m2)与体重与体重(kg)原始资料见表原始资料见表11
4、-1第第2、3栏栏,试分析三岁儿童体表面积与体重间试分析三岁儿童体表面积与体重间的相关关系。的相关关系。计算步骤如下:计算步骤如下:1、绘制散点图:、绘制散点图:2 2、相关系数的计算、相关系数的计算 4、相关系数的假设检验、相关系数的假设检验四、相关分析中应注意的问题四、相关分析中应注意的问题(1)进行相关分析的资料应有实际意义。(2)相关系数的计算适用双变量正态分布资料(3)进行相关分析前应先绘制散点图。图图11-3 异常点对相关分析的影响异常点对相关分析的影响(4)相关关系不完全等同于因果关系。(5)实际工作中计算出的相关系数仅是样本 相关系数(6)不要把相关系数的假设检验结果误认为 两
5、事物或现象间相关的密切程度。(7)要注意资料的同质性。)要注意资料的同质性。图图11-4样本来自不同总体时对相关性的影响样本来自不同总体时对相关性的影响ndata li11_1;ninput x y;ncards;n;nproc corr;nvar x y;run;nproc plot;plot y*x=*;run;第二节第二节 直线回归直线回归相关分析是描述两变量之间相互关系相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系回归分析是分析两变量间是否有依存关系一、直线回归方程一、直线回归方程a称为截距,称为截距,b称之为斜率或回归系数,表示称之为斜率或回归系数,表示当自变
6、量当自变量X每改变一个单位每改变一个单位,因变量因变量Y平均变动平均变动的单位数。的单位数。最小二乘法:最小二乘法:二、实例求解回归方程二、实例求解回归方程例例11-2某地测得某地测得10名名3岁儿童的体表面积岁儿童的体表面积(m2)与与体重体重(kg)资料见表资料见表11-1第第2、3栏栏,试求试求3岁儿童由体岁儿童由体重推算体表面积的回归方程。重推算体表面积的回归方程。二、实例求解回归方程二、实例求解回归方程1、绘制散点图。绘制散点图。2、计算、计算 b 1831.24-(134.4)2/10 3.绘制回归线绘制回归线 图图11-5 三岁儿童的体表面积与体重的回归线三岁儿童的体表面积与体重
7、的回归线三、直线回归方程的假设检验三、直线回归方程的假设检验1、回归系数的假设检验、回归系数的假设检验方差分析方差分析,拒绝H0,接受H1,回归方程有统计学意义,故可认为小儿体表面积与体重之间有直线回归关系存在。2、回归系数的假设检验、回归系数的假设检验t检验检验 S为剩余标准差,四、直线回归方程的应用四、直线回归方程的应用1、描述两变量间的依存关系2、利用回归方程进行预测 所谓利用回归方程进行预测就是把自变量代入回归方程,对应变量进行估计,可求出因变量取值的波动范围,即个体Y值的预测区间(prediction interval,PI)。当X为某定值时,Y的1-预测区间为:SY为总体中当为总体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 相关 回归 分析
限制150内