双变量线性回归与相关讲稿.ppt
《双变量线性回归与相关讲稿.ppt》由会员分享,可在线阅读,更多相关《双变量线性回归与相关讲稿.ppt(105页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、双变量线性回归与相关第一页,讲稿共一百零五页哦医学统计学医学统计学第九章第九章 双变量线性回归与相关双变量线性回归与相关 主讲:黄志碧主讲:黄志碧第二页,讲稿共一百零五页哦 本章学习重点 1、直线回归与相关的概念;2、直线回归方程的建立;3、回归系数、相关系数的假设检验;4、直线回归与相关的区别和联系;5、直线回归与相关分析应注意的问题;6、等级相关(秩相关)的应用范围。第三页,讲稿共一百零五页哦回归与相关概述回归与相关概述什么是标准体重,如何测量?什么是标准体重,如何测量?男性:身高(cm)-105标准体重(kg)女性:身高(cm)-100标准体重(kg)北方人理想体重(身高cm-150)0
2、.6+50(kg)南方人理想体重(身高cm-150)0.6+48(kg)第四页,讲稿共一百零五页哦回归与相关回归与相关是研究变量之间相互关系的统计分析方是研究变量之间相互关系的统计分析方法,它是一类双变量或多变量统计分析方法(法,它是一类双变量或多变量统计分析方法(本章主要介本章主要介绍双变量分析方法绍双变量分析方法),在实际之中有着广泛的应用。),在实际之中有着广泛的应用。如年龄与体重、年龄与血压、身高与体重、体重与如年龄与体重、年龄与血压、身高与体重、体重与肺活量、体重与体表面积、毒物剂量与动物死亡率、污肺活量、体重与体表面积、毒物剂量与动物死亡率、污染物浓度与污染源距离等都要运用回归与相
3、关方法对资染物浓度与污染源距离等都要运用回归与相关方法对资料进行统计分析。料进行统计分析。第五页,讲稿共一百零五页哦变量之间的关系:变量之间的关系:()直直线线关关系系(线线性性关关系);系);()曲曲线线关关系系(非非线线性性关系)。关系)。在在回回归归与与相相关关分分析析中中,直直线线回回归归与与相相关关是是最最简简单单的的一一种种,是本章主要内容。是本章主要内容。第六页,讲稿共一百零五页哦 直直线线回回归归分分析析:分分析析两两个个变变量量间间的的数数量量关关系系,目目的的是是用用一一个个变变量量推推算算另另一一个个变变量量 (建建立立回回归归方方程程)。直直线线相相关关分分析析:分分析
4、析两两个个变变量量之之间间有有无无相相关关关关系系以以及及相相关关的的性性质质(正正、负负相相关关)和和相相关关的的密切程度。密切程度。第七页,讲稿共一百零五页哦第一节第一节直线回归直线回归一、直线回归的概念一、直线回归的概念“回归回归”一词首先由英国生物统计学家一词首先由英国生物统计学家()提出,他发现,高个子的()提出,他发现,高个子的父代其子代平均身高不是更高,而是稍矮;相反,父代其子代平均身高不是更高,而是稍矮;相反,矮个子的父代其子代平均身高不是更矮,而是稍高矮个子的父代其子代平均身高不是更矮,而是稍高于其父代水平,他把这种身高趋向种族稳定的现象于其父代水平,他把这种身高趋向种族稳定
5、的现象称为称为“回归回归”。目前回归的含义已经演变成变量之目前回归的含义已经演变成变量之间的某种数量依存关系。间的某种数量依存关系。第八页,讲稿共一百零五页哦函数关系函数关系:确定的关系。确定的关系。例如例如园周长与半径:园周长与半径:y=2r。回归关系回归关系:不确定的关系(随机的关系)。例如:不确定的关系(随机的关系)。例如血压和年龄的关系,称为血压和年龄的关系,称为直线回归直线回归(linearregression)。北方人理想体重北方人理想体重(身高身高cm-150)0.6+50(kg)变量间的关系变量间的关系第九页,讲稿共一百零五页哦变量间的回归关系变量间的回归关系由由于于生生物物间
6、间存存在在变变异异,故故两两相相关关变变量量之之间间的的关关系系具具有有某某种种不不确确定定性性,如如同同性性别别、同同年年龄龄的的人人,其其肺肺活活量量与与体体重重有有关关,肺肺活活量量随随体体重重的的增增加加而而增增加加,但但体体重重相相同同的的人人其其肺肺活活量量并并不不一一定定相相等等。因因此此,散散点点呈呈直直线线趋趋势势,但但并并不不是是所所有有的的散散点点均均在在同同一一条条直直线线上上,肺肺活活量量与与体体重重的的关关系系与与严严格格对对应应的的函函数数关关系系不不同同,它它们们之之间间是是一一种种回回归归关关系系,称称直直线线回归。这种关系是用直线回归方程来定量描述。回归。这
7、种关系是用直线回归方程来定量描述。第十页,讲稿共一百零五页哦回回归归分分析析涉涉及及到到两两个个变变量量,X与与Y,其其中中X称称自变量,自变量,Y为因变量或反应变量。为因变量或反应变量。回归分析对资料的要求回归分析对资料的要求Y必须是呈正态分布的随机变量。必须是呈正态分布的随机变量。可以是非随机变量可以是非随机变量:年龄、药物浓度或剂量年龄、药物浓度或剂量型回归型回归也可以是随机变量也可以是随机变量:身高、体重、血清胆固身高、体重、血清胆固醇的含量,血红蛋白的含量醇的含量,血红蛋白的含量型回归型回归X第十一页,讲稿共一百零五页哦由由X推算推算Y的直线回归方程一般表达式的直线回归方程一般表达式
8、(9-2)a称为截距称为截距,b为回归系数为回归系数,即直线的斜率。即直线的斜率。ab0yx第十二页,讲稿共一百零五页哦2 2、回归系数、回归系数b b的统计学意义的统计学意义b0b0时时,Y,Y随随X X增大而增大增大而增大;b0b0b0 b0d第十四页,讲稿共一百零五页哦 b=0 b=0 b=0 b=0d第十五页,讲稿共一百零五页哦二、直线回归方程的建立二、直线回归方程的建立 式式中中、分分别别是是X、Y的的均均数数;为为X的的离离均均差差平平方和;方和;为为X与与Y的离均差积和,按下式计算。的离均差积和,按下式计算。第十六页,讲稿共一百零五页哦回归分析的步骤回归分析的步骤1 1、用原始数
9、据绘制散点图;、用原始数据绘制散点图;2 2、求、求a a和和b(b(如果呈直线关系如果呈直线关系)3 3、对回归系数、对回归系数b b作假设检验(方法:作假设检验(方法:a.Fa.F检验检验 b.t b.t检检验验 c.c.用用r r检验来代替)。检验来代替)。4 4、如果、如果x x与与y y存在直线关系(存在直线关系(b b假设检验的结果假设检验的结果P0.05PF FF0.01,1,18 0.01,1,18 ,P0.01P0.01 P0.01,Pt0.001,18,故故Pt0.001,13,故故Pr0.001,13,P20时,用该法)。时,用该法)。第七十一页,讲稿共一百零五页哦例例9
10、-312名脑膜瘤病人瘤周脑组织血流量(名脑膜瘤病人瘤周脑组织血流量(PTBF)和)和同侧大脑半球血流量同侧大脑半球血流量(hCBF)资料如下表,分析资料如下表,分析PTBF和和hCBF相关性。相关性。第七十二页,讲稿共一百零五页哦分析步骤如下:分析步骤如下:H0:s=0,PTBF和和hCBF无直线关系无直线关系H1:s0,PTBF和和hCBF有直线关系有直线关系=0.05分分别别对对X、Y的的观观察察值值从从小小到到大大编编秩秩,若若有有相相同同的的观观察察值则取平均秩次。值则取平均秩次。第七十三页,讲稿共一百零五页哦第七十四页,讲稿共一百零五页哦按 n=12查rs界值表:0.005P0.00
11、2,0.005P0.002,按按=0.05=0.05,拒绝,拒绝H H0 0接受接受H H1 1,可以认,可以认为为PTBFPTBF和和hCBFhCBF有正的直线相关关系。有正的直线相关关系。第七十五页,讲稿共一百零五页哦一、直线回归与相关的区别和联系一、直线回归与相关的区别和联系(一)、区别(一)、区别 1 1、对资料要求不同、对资料要求不同(1 1)回回归归分分析析要要求求因因变变量量Y Y是是服服从从正正态态分分布布的的随随机机变变量量,X X是是可可以以精精确确测测量量和和严严格格控控制制的的变变量量,一一般般称称型型回回归归,即只能由即只能由X X作自变量推算作自变量推算Y Y。(2
12、 2)相相关关分分析析要要求求两两个个变变量量X X、Y Y是是均均服服从从正正态态分分布布的的随随机机变变量量,即即双双变变量量正正态态分分布布。对对这这种种资资料料进进行回归分析称行回归分析称型回归,可以求出两个方程型回归,可以求出两个方程:第四节第四节回归与相关分析应注意的问题回归与相关分析应注意的问题第七十六页,讲稿共一百零五页哦由由X推算推算Y的方程:的方程:由由Y推算推算X的方程:的方程:2、应应用用不不同同:说说明明两两变变量量间间依依存存变变化化的的数数量量关关系系用用回回归,说明变量间的相关关系用相关。归,说明变量间的相关关系用相关。3、意意义义不不同同:b表表示示X每每增增
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 变量 线性 回归 相关 讲稿
限制150内