欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    双变量线性回归与相关讲稿.ppt

    • 资源ID:47507420       资源大小:4.23MB        全文页数:105页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    双变量线性回归与相关讲稿.ppt

    双变量线性回归与相关第一页,讲稿共一百零五页哦医学统计学医学统计学第九章第九章 双变量线性回归与相关双变量线性回归与相关 主讲:黄志碧主讲:黄志碧第二页,讲稿共一百零五页哦 本章学习重点 1、直线回归与相关的概念;2、直线回归方程的建立;3、回归系数、相关系数的假设检验;4、直线回归与相关的区别和联系;5、直线回归与相关分析应注意的问题;6、等级相关(秩相关)的应用范围。第三页,讲稿共一百零五页哦回归与相关概述回归与相关概述什么是标准体重,如何测量?什么是标准体重,如何测量?男性:身高(cm)-105标准体重(kg)女性:身高(cm)-100标准体重(kg)北方人理想体重(身高cm-150)0.6+50(kg)南方人理想体重(身高cm-150)0.6+48(kg)第四页,讲稿共一百零五页哦回归与相关回归与相关是研究变量之间相互关系的统计分析方是研究变量之间相互关系的统计分析方法,它是一类双变量或多变量统计分析方法(法,它是一类双变量或多变量统计分析方法(本章主要介本章主要介绍双变量分析方法绍双变量分析方法),在实际之中有着广泛的应用。),在实际之中有着广泛的应用。如年龄与体重、年龄与血压、身高与体重、体重与如年龄与体重、年龄与血压、身高与体重、体重与肺活量、体重与体表面积、毒物剂量与动物死亡率、污肺活量、体重与体表面积、毒物剂量与动物死亡率、污染物浓度与污染源距离等都要运用回归与相关方法对资染物浓度与污染源距离等都要运用回归与相关方法对资料进行统计分析。料进行统计分析。第五页,讲稿共一百零五页哦变量之间的关系:变量之间的关系:()直直线线关关系系(线线性性关关系);系);()曲曲线线关关系系(非非线线性性关系)。关系)。在在回回归归与与相相关关分分析析中中,直直线线回回归归与与相相关关是是最最简简单单的的一一种种,是本章主要内容。是本章主要内容。第六页,讲稿共一百零五页哦 直直线线回回归归分分析析:分分析析两两个个变变量量间间的的数数量量关关系系,目目的的是是用用一一个个变变量量推推算算另另一一个个变变量量 (建建立立回回归归方方程程)。直直线线相相关关分分析析:分分析析两两个个变变量量之之间间有有无无相相关关关关系系以以及及相相关关的的性性质质(正正、负负相相关关)和和相相关关的的密切程度。密切程度。第七页,讲稿共一百零五页哦第一节第一节直线回归直线回归一、直线回归的概念一、直线回归的概念“回归回归”一词首先由英国生物统计学家一词首先由英国生物统计学家()提出,他发现,高个子的()提出,他发现,高个子的父代其子代平均身高不是更高,而是稍矮;相反,父代其子代平均身高不是更高,而是稍矮;相反,矮个子的父代其子代平均身高不是更矮,而是稍高矮个子的父代其子代平均身高不是更矮,而是稍高于其父代水平,他把这种身高趋向种族稳定的现象于其父代水平,他把这种身高趋向种族稳定的现象称为称为“回归回归”。目前回归的含义已经演变成变量之目前回归的含义已经演变成变量之间的某种数量依存关系。间的某种数量依存关系。第八页,讲稿共一百零五页哦函数关系函数关系:确定的关系。确定的关系。例如例如园周长与半径:园周长与半径:y=2r。回归关系回归关系:不确定的关系(随机的关系)。例如:不确定的关系(随机的关系)。例如血压和年龄的关系,称为血压和年龄的关系,称为直线回归直线回归(linearregression)。北方人理想体重北方人理想体重(身高身高cm-150)0.6+50(kg)变量间的关系变量间的关系第九页,讲稿共一百零五页哦变量间的回归关系变量间的回归关系由由于于生生物物间间存存在在变变异异,故故两两相相关关变变量量之之间间的的关关系系具具有有某某种种不不确确定定性性,如如同同性性别别、同同年年龄龄的的人人,其其肺肺活活量量与与体体重重有有关关,肺肺活活量量随随体体重重的的增增加加而而增增加加,但但体体重重相相同同的的人人其其肺肺活活量量并并不不一一定定相相等等。因因此此,散散点点呈呈直直线线趋趋势势,但但并并不不是是所所有有的的散散点点均均在在同同一一条条直直线线上上,肺肺活活量量与与体体重重的的关关系系与与严严格格对对应应的的函函数数关关系系不不同同,它它们们之之间间是是一一种种回回归归关关系系,称称直直线线回归。这种关系是用直线回归方程来定量描述。回归。这种关系是用直线回归方程来定量描述。第十页,讲稿共一百零五页哦回回归归分分析析涉涉及及到到两两个个变变量量,X与与Y,其其中中X称称自变量,自变量,Y为因变量或反应变量。为因变量或反应变量。回归分析对资料的要求回归分析对资料的要求Y必须是呈正态分布的随机变量。必须是呈正态分布的随机变量。可以是非随机变量可以是非随机变量:年龄、药物浓度或剂量年龄、药物浓度或剂量型回归型回归也可以是随机变量也可以是随机变量:身高、体重、血清胆固身高、体重、血清胆固醇的含量,血红蛋白的含量醇的含量,血红蛋白的含量型回归型回归X第十一页,讲稿共一百零五页哦由由X推算推算Y的直线回归方程一般表达式的直线回归方程一般表达式(9-2)a称为截距称为截距,b为回归系数为回归系数,即直线的斜率。即直线的斜率。ab0yx第十二页,讲稿共一百零五页哦2 2、回归系数、回归系数b b的统计学意义的统计学意义b0b0时时,Y,Y随随X X增大而增大增大而增大;b0b0b0 b0d第十四页,讲稿共一百零五页哦 b=0 b=0 b=0 b=0d第十五页,讲稿共一百零五页哦二、直线回归方程的建立二、直线回归方程的建立 式式中中、分分别别是是X、Y的的均均数数;为为X的的离离均均差差平平方和;方和;为为X与与Y的离均差积和,按下式计算。的离均差积和,按下式计算。第十六页,讲稿共一百零五页哦回归分析的步骤回归分析的步骤1 1、用原始数据绘制散点图;、用原始数据绘制散点图;2 2、求、求a a和和b(b(如果呈直线关系如果呈直线关系)3 3、对回归系数、对回归系数b b作假设检验(方法:作假设检验(方法:a.Fa.F检验检验 b.t b.t检检验验 c.c.用用r r检验来代替)。检验来代替)。4 4、如果、如果x x与与y y存在直线关系(存在直线关系(b b假设检验的结果假设检验的结果P0.05PF FF0.01,1,18 0.01,1,18 ,P0.01P0.01 P0.01,Pt0.001,18,故故Pt0.001,13,故故Pr0.001,13,P20时,用该法)。时,用该法)。第七十一页,讲稿共一百零五页哦例例9-312名脑膜瘤病人瘤周脑组织血流量(名脑膜瘤病人瘤周脑组织血流量(PTBF)和)和同侧大脑半球血流量同侧大脑半球血流量(hCBF)资料如下表,分析资料如下表,分析PTBF和和hCBF相关性。相关性。第七十二页,讲稿共一百零五页哦分析步骤如下:分析步骤如下:H0:s=0,PTBF和和hCBF无直线关系无直线关系H1:s0,PTBF和和hCBF有直线关系有直线关系=0.05分分别别对对X、Y的的观观察察值值从从小小到到大大编编秩秩,若若有有相相同同的的观观察察值则取平均秩次。值则取平均秩次。第七十三页,讲稿共一百零五页哦第七十四页,讲稿共一百零五页哦按 n=12查rs界值表:0.005P0.002,0.005P0.002,按按=0.05=0.05,拒绝,拒绝H H0 0接受接受H H1 1,可以认,可以认为为PTBFPTBF和和hCBFhCBF有正的直线相关关系。有正的直线相关关系。第七十五页,讲稿共一百零五页哦一、直线回归与相关的区别和联系一、直线回归与相关的区别和联系(一)、区别(一)、区别 1 1、对资料要求不同、对资料要求不同(1 1)回回归归分分析析要要求求因因变变量量Y Y是是服服从从正正态态分分布布的的随随机机变变量量,X X是是可可以以精精确确测测量量和和严严格格控控制制的的变变量量,一一般般称称型型回回归归,即只能由即只能由X X作自变量推算作自变量推算Y Y。(2 2)相相关关分分析析要要求求两两个个变变量量X X、Y Y是是均均服服从从正正态态分分布布的的随随机机变变量量,即即双双变变量量正正态态分分布布。对对这这种种资资料料进进行回归分析称行回归分析称型回归,可以求出两个方程型回归,可以求出两个方程:第四节第四节回归与相关分析应注意的问题回归与相关分析应注意的问题第七十六页,讲稿共一百零五页哦由由X推算推算Y的方程:的方程:由由Y推算推算X的方程:的方程:2、应应用用不不同同:说说明明两两变变量量间间依依存存变变化化的的数数量量关关系系用用回回归,说明变量间的相关关系用相关。归,说明变量间的相关关系用相关。3、意意义义不不同同:b表表示示X每每增增(减减)一一个个单单位位,Y平平均均改改变变b个个单单位位;r说说明明具具有有直直线线关关系系的的两两个个变变量量间间相相关关关关系系的的密切程度与相关的方向。密切程度与相关的方向。4、算方法不同、算方法不同。5、取值范围不同、取值范围不同;-1r1,-b+。6、b有单位,有单位,r没有单位。没有单位。第七十七页,讲稿共一百零五页哦(二)、联系(二)、联系1、对对一一组组数数据据若若同同时时计计算算r与与b,则则它它们们的的正正负负号号是是一一致的。致的。2、r和和b的的假假设设检检验验是是等等价价的的,即即对对同同一一资资料料,两两者者的的t值值相相等等()。在在实实际际中中常常采采用用对对r的的检检验验来代替对来代替对b的检验。的检验。3、可用回归解析相关。、可用回归解析相关。r的的平平方方,即即r2,称称决决定定系系数数,它它说说明明回回归归平平方方和和(SS回回)占占总总平平方方和和(SS总总)的的比比重重,其其取取值值范范围围在在01之间。之间。第七十八页,讲稿共一百零五页哦上式说明,当上式说明,当SS总总固定不变时,固定不变时,SS回回的大小取决于的大小取决于r2。r2越大,则越大,则SS回回就越大就越大;SS回回是由于引入了相关变量后使总平是由于引入了相关变量后使总平方和减少的部分。方和减少的部分。SS回回越接近越接近SS总总,则,则r2越接近越接近1,说明引入相关变量的效,说明引入相关变量的效果越好。在临床研究中,若果越好。在临床研究中,若r2达到达到0.7以上,就可认为回归效以上,就可认为回归效果不错;但在实验室研究中,如标准曲线的配制,果不错;但在实验室研究中,如标准曲线的配制,r2的要求很的要求很高,达到高,达到0.999以上。以上。第七十九页,讲稿共一百零五页哦可通过可通过r2的大小来确定两变量间相关关系的实际意义。的大小来确定两变量间相关关系的实际意义。例如例如r=0.2,n=100时,可以认为两变量间有直线相关关时,可以认为两变量间有直线相关关系,但系,但r2=0.04,表示回归平方和在总平方和中仅占,表示回归平方和在总平方和中仅占4%,即,即X对对Y的影响仅占的影响仅占4%,实际意义不大。,实际意义不大。第八十页,讲稿共一百零五页哦(一)、根据分析目的选择变量及统计方法;(一)、根据分析目的选择变量及统计方法;(二)、进行回归、相关分析前应绘制散点图;(二)、进行回归、相关分析前应绘制散点图;(1 1)看有无直线趋势;)看有无直线趋势;(2 2)有无异常点:离群点)有无异常点:离群点 识别和处理异常点识别和处理异常点 识别:散点图、残差图识别:散点图、残差图 二、直线回归与相关中的注意事项二、直线回归与相关中的注意事项第八十一页,讲稿共一百零五页哦(三)两变量为非线性关系时的曲线回归 血药浓度与时间效应曲线 生长曲线 剂量反应关系 进行曲线拟合,拟合出曲线方程。第八十二页,讲稿共一百零五页哦第八十三页,讲稿共一百零五页哦第八十四页,讲稿共一百零五页哦(四)、进行残差分析:看数据是否符合模型假设条件;第八十五页,讲稿共一百零五页哦(五)分层资料合并后做回归或相关分析要慎重。第八十六页,讲稿共一百零五页哦(六)正确理解相关分析的意义和作用 两变量有相关性不一定是因果关系,可能是一种伴两变量有相关性不一定是因果关系,可能是一种伴随关系,即相关分析不能说明变量间的因果关系。随关系,即相关分析不能说明变量间的因果关系。第八十七页,讲稿共一百零五页哦一、一、曲线曲线拟合拟合的意义的意义在在医医学学研研究究中中,两两变变量量之之间间的的关关系系有有时时不不呈呈直直线线而而呈呈曲曲线线关关系系。如如药药物物在在体体内内的的浓浓度度与与时时间间的的关关系系,儿儿童童年年龄龄与与身身长长发发育育的的关关系系等等都都不不是是简简单单的的直直线线关关系系,这这种种资资料料就就不不能能用用直直线线回回归归分分析析,有有时时可可以以通通过过适适当当的变量变换使之直线化,从而扩大了直线回归的应用。的变量变换使之直线化,从而扩大了直线回归的应用。第五节第五节曲线拟合曲线拟合第八十八页,讲稿共一百零五页哦1、曲线拟合:、曲线拟合:就是用适当的曲线方程来描述变量之间就是用适当的曲线方程来描述变量之间的变化关系。的变化关系。曲线拟合最基本方法是曲线拟合最基本方法是曲线直线化,曲线直线化,即通过适当的即通过适当的变量变换,使曲线关系变为直线关系,然后用直线回归变量变换,使曲线关系变为直线关系,然后用直线回归分析方法求出直线方程,然后还原为曲线方程。分析方法求出直线方程,然后还原为曲线方程。2、直接使用变量变换后的直线回归:、直接使用变量变换后的直线回归:若两变量呈曲若两变量呈曲线趋势,常使用直线化回归方程,绘制标准曲线。线趋势,常使用直线化回归方程,绘制标准曲线。第八十九页,讲稿共一百零五页哦二、曲线拟合步骤二、曲线拟合步骤1、选定曲线类型、选定曲线类型 指数曲线示意图指数曲线示意图第九十页,讲稿共一百零五页哦2、将变量作对数变换、将变量作对数变换选选定定X(或或K-X)或或Y(或或K-Y)进进行行对对数数变变换换,K为为常常量量,使使变变换换后后的的两两变变量量呈呈直直线线关关系系。也也可可以以将将实实测测数数据据在在半对数坐标纸上作直线化尝试。半对数坐标纸上作直线化尝试。第九十一页,讲稿共一百零五页哦3、按求直线回归方程的方法求直线化方程;、按求直线回归方程的方法求直线化方程;4、将直线化方程转为曲线方程,作曲线图。、将直线化方程转为曲线方程,作曲线图。表表9.7某地氰化物浓度与污染源距离的关系某地氰化物浓度与污染源距离的关系与污染源与污染源氰化物氰化物距离距离(m)浓度浓度(mg/m3)XYy=lgYY(1)(2)(3)(4)500.687-0.16300.5841000.398-0.40010.3641500.200-.069900.2272000.121-0.91720.1422500.090-1.04580.0883000.050-1.30100.0554000.020-1.69900.0215000.010-2.00000.008 1950(X)-8.2251(y)第九十二页,讲稿共一百零五页哦1、从从表表中中(1)、(2)栏栏可可见见,随随X的的增增加加,Y有有加加速减少的趋势,可选用指数曲线;速减少的趋势,可选用指数曲线;2、在半对数纸上作图;见图、在半对数纸上作图;见图11.7,呈直线趋势;,呈直线趋势;3、求直线方程;、求直线方程;用用X与与y(y=lgY)求直线化方程:求直线化方程:a=-0.0287,b=-0.0041y=-0.0287-0.0041X;4、将直线化方程转为曲线方程:、将直线化方程转为曲线方程:lgY=-(0.0287+0.0041X)第九十三页,讲稿共一百零五页哦三、曲线拟合方程的评价 同一资料可同时采用多种拟合方法(包括同一资料可同时采用多种拟合方法(包括线性方程),然后,计算决定系数线性方程),然后,计算决定系数r r2 2,和剩余,和剩余标准差。决定系数越大,剩余标准差越小,标准差。决定系数越大,剩余标准差越小,所拟合的方程效果越好。所拟合的方程效果越好。第九十四页,讲稿共一百零五页哦第九十五页,讲稿共一百零五页哦秩秩回回归归当当资资料料不不满满足足最最小小二二乘乘回回归归分分析析时时,可可以以进进行行秩秩回回归归分分析析。秩秩回回归归不不要要求求Y的的总总体体分分布布型型,Y和和X可可以以呈呈直直线线趋趋势势或或非非线线性性趋趋势势,仅仅要要求求Y的的均均数数随随着着X的增大而增大或减小。的增大而增大或减小。第九十六页,讲稿共一百零五页哦第九十七页,讲稿共一百零五页哦第九十八页,讲稿共一百零五页哦第九十九页,讲稿共一百零五页哦第一百页,讲稿共一百零五页哦第一百零一页,讲稿共一百零五页哦表表11.1SS剩的计算剩的计算序号序号XY122.4134.099.386134.61391198.1221251.6167.0133.833533.16651100.0167358.1132.3141.5015-9.201584.6676425.180.2102.5713-22.3713500.4751565.9100.0150.7032-50.70322570.8145679.7139.1166.9832-27.8832777.4728775.3187.2161.792525.4075645.5411832.497.2111.1831-13.9831195.5271996.4192.3186.68425.615831.53721085.7199.4174.061425.3386642.0447合计合计592.61428.71428.700.00007746.2189第一百零二页,讲稿共一百零五页哦第一百零三页,讲稿共一百零五页哦第一百零四页,讲稿共一百零五页哦第一百零五页,讲稿共一百零五页哦

    注意事项

    本文(双变量线性回归与相关讲稿.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开