《回归与相关》PPT课件.ppt
《《回归与相关》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《回归与相关》PPT课件.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章 回归与相关回归与相关Linear Regression and Correlation引言引言医学工作科研研究的目的医学工作科研研究的目的:1.研研究究某某指指标标的的特特征征(平平均均水水平平、发发生生率率等等)并并比比较较该该指指标标组组间间均均数数(率率)的差别。的差别。2.了了解解两两个个、或或多多个个指指标标之之间间是是否否有有相相关关关关系系,以以解解释释和和预预测测(用用一一个个指指标预测另一指标的高低)。标预测另一指标的高低)。表2-1 108例高血压患者治疗后临床记录例高血压患者治疗后临床记录编号编号 年龄年龄 性别性别 治疗组治疗组 舒张压舒张压 体温体温 疗
2、效疗效 X1X1 X2X2 X3 X3 X4 X5X4 X5 X6X6 1 37 男男 A 11.27 37.5 显效显效 2 45 女女 B 12.53 37.0 有效有效 3 43 男男 A 10.93 36.5 有效有效 4 59 女女 B 14.67 37.8 无效无效 。100 54 男男 B 16.80 37.6 无效无效8名健康成人血清胆固醇(名健康成人血清胆固醇(mmol/l)与)与低密度脂蛋白(低密度脂蛋白(g/l)结果)结果编号编号 胆固醇(胆固醇(X X)脂蛋白(脂蛋白(Y Y)1 4.271 4.27 0.8 0.82 5.172 5.17 1.23 1.233 5.6
3、93 5.69 1.31 1.314 5.174 5.17 1.33 1.335 3.775 3.77 0.68 0.686 5.176 5.17 1.12 1.127 5.667 5.66 1.29 1.298 3.318 3.31 0.46 0.46 第二节:第二节:直线相关直线相关 (Linear Correlation)一、直线相关的概念一、直线相关的概念1.两指标来自同一个体两指标来自同一个体,一个指标的数据一个指标的数据增大,其另一个指标数字也增大或减少,增大,其另一个指标数字也增大或减少,为两个变量(指标)有相关关系。为两个变量(指标)有相关关系。2.变量关系类型的了解变量关系类
4、型的了解用两变量数据的散点图(图用两变量数据的散点图(图7-3),反映),反映关系的类型(线性或非线性),统计中关系的类型(线性或非线性),统计中用用相关系数相关系数描述关系的密切程度。描述关系的密切程度。母血TSH 脐带血脐带血TSH编号 X Y 1 1.21 3.90 2 1.30 4.50 3 1.39 4.20 4 1.42 4.83 5 1.47 4.16 6 1.56 4.93 7 1.68 4.32 8 1.72 4.99 9 1.98 4.70 10 2.10 5.20讲义例讲义例7-1研究同一母研究同一母亲与婴儿的亲与婴儿的母血TSH 与 脐带血脐带血TSH的关系的关系母血母
5、血TSH值与脐带血值与脐带血TSH值的关系散点图值的关系散点图(1.2,3.9)二、相关系数的意义二、相关系数的意义pearson(皮尔逊)相关系数(皮尔逊)相关系数(pearson correlation coefficient):):用用 r表示(积差法相关系数)表示(积差法相关系数)pearson r 系数的意义系数的意义:是描述是描述两个计量变量值直线两个计量变量值直线关系的密切关系的密切程度和方向的统计指标程度和方向的统计指标。相关系数(相关系数(r)的意义)的意义r系数的值无单位,波动范围为系数的值无单位,波动范围为 -1 1。|r|=1,表示完全相关,线性函数关系(见讲义图,表示
6、完全相关,线性函数关系(见讲义图7-3中的(中的(e)和()和(f)。)。|r|越接近越接近1,表示两变量关系越密切(点子接近,表示两变量关系越密切(点子接近一条直线)。一条直线)。|r|=0,表示两变量无相关关系和直线相关关系,表示两变量无相关关系和直线相关关系(见图(见图c、g、h)。)。系数的符号系数的符号r为正,表示正相关关系,即为正,表示正相关关系,即x值的增加,值的增加,y 也增也增加,反之为负相关加,反之为负相关。两指标(两指标(X,Y)数据关系的散点图)数据关系的散点图图图a、c为正相关关系为正相关关系图图a图图b图图c图图d图图b、d为负相关关系为负相关关系三、相关系数的计算
7、三、相关系数的计算 X和和Y的离均差积和的离均差积和(7-17)母血母血TSH 脐带血脐带血TSH X Y X2 Y2 XY 1.21 3.90 1.46 15.2 4.72 1.30 4.50 1.39 4.20 1.42 4.83 1.47 4.16 1.56 4.93 1.68 4.32 1.72 4.99 1.98 4.70 2.10 5.20合计合计15.83 45.73 25.80 210.73 73.14例表,分别计算下列公式:例表,分别计算下列公式:=25.80-15.832/10=0.7411=73.14-15.83 45.73/10=0.7494=210.73-45.732
8、/10=1.6067相关系数的计算相关系数的计算r为正值,表示随着为正值,表示随着母血的TSH的增加,其 脐脐带血带血TSH的含量也增加,关系为正相关关系的含量也增加,关系为正相关关系四、相关系数(四、相关系数(r)假设检验)假设检验相关系数(相关系数(r)为样本数据计算)为样本数据计算,r的大小也的大小也存在抽样误差,统计对存在抽样误差,统计对r做统计检验,推断做统计检验,推断 两变量的总体是否有相关关系。两变量的总体是否有相关关系。检验检验r的方法:的方法:1.查表法(附表查表法(附表13,243页页)2.相关系数(相关系数(r)的)的t检验公式计算法检验公式计算法等价等价1.查表法方法与
9、步骤方法与步骤1)建立假设:)建立假设:H0:=0,即两变量(总体相关系数,即两变量(总体相关系数=0)无相关)无相关关系关系H1:0,两变量有相关关系,两变量有相关关系,=0.052)查表()查表(243页):页):确定自由度(确定自由度(v)=n-2=10-2=8,本例样本相关系数本例样本相关系数 r=0.68070.632,P0.05结论:在结论:在=0.05水准上,水准上,P0.05,拒绝,拒绝H0假设,假设,母血母血TSH 与与 脐带血脐带血TSH有相关关系存在。有相关关系存在。方法方法2:tr检验检验H0:=0,即两变量(总体相关系数,即两变量(总体相关系数=0)无相关)无相关关系
10、关系H1:0,两变量有相关关系,两变量有相关关系,=0.05样本相关系数的样本相关系数的t 检验检验结论:本例结论:本例p0.05,即,即母血TSH 与脐带血脐带血TSH有有相关关系存在。相关关系存在。相关系数的解释与应用相关系数的解释与应用:1.相关系数(相关系数(r)描述两个变量的线性协)描述两个变量的线性协同变化关系,不表示因果关系。同变化关系,不表示因果关系。何者做何者做X或或Y,计算的,计算的r相同。相同。2.在例数相等时,不同指标相关关系可在例数相等时,不同指标相关关系可做比较,做比较,r越大,表示两变量关系越密切。越大,表示两变量关系越密切。3.应在有统计检验结果的前提下,得出应
11、在有统计检验结果的前提下,得出有无相关关系的结论。有无相关关系的结论。例:体重、胸围、呼吸差与肺例:体重、胸围、呼吸差与肺活量的关系活量的关系对象对象 体重体重 胸围胸围 身高身高 肺活量肺活量编号编号 X1 X2 X3 Y1 48.5 73.7 166.4 33.82 49.5 73.9 167.3 34.1.46.4 76.2 160.5 32.9.174 44.9 73.8 158.7 29.70 例:相关分析(例:相关分析(Correlation Analysis)体重体重 胸围胸围 身高身高 肺活量肺活量 X1 X2 X3 YX1 1 0.1717 0.6409 0.6954X2 1
12、 0.4522 0.5863X3 1 0.7288X4 1第一节、直线回归第一节、直线回归一、一、“回归回归”的由来的由来二、直线回归的概念二、直线回归的概念直直线线回回归归是是用用数数学学方方程程表表达达出出两两个个变变量量(X增增加加,Y也也增增加加)变变化化的的数数量量关关系系,称为回归分析。回归方程:称为回归分析。回归方程:回归关系与函数关系回归关系与函数关系函数关系:函数关系:X与与Y值为一一对应的确值为一一对应的确切关系。表达式:切关系。表达式:回归关系:回归关系:X与与Y值间关值间关系不为一一对应,回归方程表达非系不为一一对应,回归方程表达非确切关系两变量的数量变化关系确切关系两
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归与相关 回归 相关 PPT 课件
限制150内