欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    两变量间相关与回归分析.ppt

    • 资源ID:77659588       资源大小:262KB        全文页数:57页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    两变量间相关与回归分析.ppt

    第十一章 两变量间相关与回归分析 对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系,称确定性关系。若两变量之间确实存在着某种关系,但这种关系不是一一对应的函数关系,称非确定性关系。第一节第一节 直线相关直线相关 一、直线相关的概念一、直线相关的概念 描述两个变量相互关系最简单的统计方法描述两个变量相互关系最简单的统计方法就是直线相关分析:两个变量是否有直线相关就是直线相关分析:两个变量是否有直线相关关系关系?如果有直线相关关系,那么它们之间的如果有直线相关关系,那么它们之间的关系是正相关还是负相关关系是正相关还是负相关?相关程度如何?相关程度如何?散点图散点图 图图11-1 两变量相关关系示意图两变量相关关系示意图二、相关系数的定义与计算二、相关系数的定义与计算 相关系数(相关系数(correlation coefficientcorrelation coefficient)又称为积差)又称为积差相关系数(相关系数(coefficient of product moment coefficient of product moment correlationcorrelation)、皮尔逊相关系数()、皮尔逊相关系数(Pearsons Pearsons correlation coefficientcorrelation coefficient)、简单相关系数)、简单相关系数(simple correlation coefficientsimple correlation coefficient)等)等,以符号以符号r r表表示样本相关系数,示样本相关系数,表示总体相关系数。它说明具有表示总体相关系数。它说明具有直线关系的两个变量,相关关系的密切程度与相关方直线关系的两个变量,相关关系的密切程度与相关方向的指标。向的指标。其值为其值为r。计算公式计算公式 三、相关分析的步骤三、相关分析的步骤 例例11-1某医师测得某医师测得10名名3岁儿童的体表岁儿童的体表面积面积(m2)与体重与体重(kg)原始资料见表原始资料见表11-1第第2、3栏栏,试分析三岁儿童体表面积与体重间试分析三岁儿童体表面积与体重间的相关关系。的相关关系。计算步骤如下:计算步骤如下:1、绘制散点图:、绘制散点图:2 2、相关系数的计算、相关系数的计算 4、相关系数的假设检验、相关系数的假设检验四、相关分析中应注意的问题四、相关分析中应注意的问题(1)进行相关分析的资料应有实际意义。(2)相关系数的计算适用双变量正态分布资料(3)进行相关分析前应先绘制散点图。图图11-3 异常点对相关分析的影响异常点对相关分析的影响(4)相关关系不完全等同于因果关系。(5)实际工作中计算出的相关系数仅是样本 相关系数(6)不要把相关系数的假设检验结果误认为 两事物或现象间相关的密切程度。(7)要注意资料的同质性。)要注意资料的同质性。图图11-4样本来自不同总体时对相关性的影响样本来自不同总体时对相关性的影响ndata li11_1;ninput x y;ncards;n;nproc corr;nvar x y;run;nproc plot;plot y*x=*;run;第二节第二节 直线回归直线回归相关分析是描述两变量之间相互关系相关分析是描述两变量之间相互关系 回归分析是分析两变量间是否有依存关系回归分析是分析两变量间是否有依存关系一、直线回归方程一、直线回归方程a称为截距,称为截距,b称之为斜率或回归系数,表示称之为斜率或回归系数,表示当自变量当自变量X每改变一个单位每改变一个单位,因变量因变量Y平均变动平均变动的单位数。的单位数。最小二乘法:最小二乘法:二、实例求解回归方程二、实例求解回归方程例例11-2某地测得某地测得10名名3岁儿童的体表面积岁儿童的体表面积(m2)与与体重体重(kg)资料见表资料见表11-1第第2、3栏栏,试求试求3岁儿童由体岁儿童由体重推算体表面积的回归方程。重推算体表面积的回归方程。二、实例求解回归方程二、实例求解回归方程1、绘制散点图。绘制散点图。2、计算、计算 b 1831.24-(134.4)2/10 3.绘制回归线绘制回归线 图图11-5 三岁儿童的体表面积与体重的回归线三岁儿童的体表面积与体重的回归线三、直线回归方程的假设检验三、直线回归方程的假设检验1、回归系数的假设检验、回归系数的假设检验方差分析方差分析,拒绝H0,接受H1,回归方程有统计学意义,故可认为小儿体表面积与体重之间有直线回归关系存在。2、回归系数的假设检验、回归系数的假设检验t检验检验 S为剩余标准差,四、直线回归方程的应用四、直线回归方程的应用1、描述两变量间的依存关系2、利用回归方程进行预测 所谓利用回归方程进行预测就是把自变量代入回归方程,对应变量进行估计,可求出因变量取值的波动范围,即个体Y值的预测区间(prediction interval,PI)。当X为某定值时,Y的1-预测区间为:SY为总体中当为总体中当X为某定值时为某定值时Y的标准差的标准差,例12-3:例12-2所得的回归方程:若已知某岁儿童的体重为若已知某岁儿童的体重为13.5kg,试估计该儿童体试估计该儿童体表面积:表面积:3、利用回归方程进行统计控制 统计控制是利用回归方程进行逆估计,如要求因变量Y在一定范围内波动,可以通过控制自变量X的取值来实现。ndata li11_2;ninput x y;ncards;n;nproc reg;nmodel y=x/stb nP /*输出y的实测值、预测值及其误差、残差*/nClm /*输出预测值均值的95%的置信区间*/ncli;/*输出y的95%的预测区间*/nRun;五、直线回归分析中应注意的问题五、直线回归分析中应注意的问题1、进行回归分析要有实际意义。2、注意直线回归分析的条件。线性 独 立性 正态性 方差齐性 3、结果的正确解释:不能混淆P值与回归系 数的意义。4、线性回归应用时应考虑其实测范围。第三节第三节 直线回归与直线相关分析的区别与联系直线回归与直线相关分析的区别与联系一、直线回归与直线相关分析的区别 1.资料要求不同。2.应用目的不同。3.统计意义不同二、直线回归与直线相关分析的联系 1.正负符号一致 2.假设检验等价 3.r与b可换算 4.用回归解释相关:决定系数=第四节 秩相关 一、Spearman等级相关系数 二、假设检验 例12-5 某保险公司在18个地区开展大病住院医疗保险,收集到表11-2(1)、(2)、(4)栏统计资料。资料中X表示承保深度(参保人数对该地区人口数的比例,%),Y表示因大病住院赔付系数(住院赔付额对保费收入的比例,%)。现欲研究大病住院医疗保险承保深度与赔付系数间的关系。data li11_5;input x y;cards;proc corr spearman;var x y;run;曲线拟合曲线拟合二、曲线拟合的一般步骤二、曲线拟合的一般步骤依据分析目的确定自变量依据分析目的确定自变量X和应变量和应变量Y之之后,根据两变量散点图呈现的趋势,结后,根据两变量散点图呈现的趋势,结合专业知识及以往经验选择合适的曲线合专业知识及以往经验选择合适的曲线形式。形式。选用适当的估计方法求得回归方程。选用适当的估计方法求得回归方程。曲线直线化作最小二乘拟合,非线性最曲线直线化作最小二乘拟合,非线性最小二乘法,利用统计软件中的一些数值小二乘法,利用统计软件中的一些数值算法直接求得算法直接求得Y和和X关系的估计方程。关系的估计方程。可结合散点图试配几种不同形式的曲可结合散点图试配几种不同形式的曲线方程并计算其线方程并计算其R2,一般来说,一般来说R2较大时较大时拟合效果较好。为了单纯地得到较大拟合效果较好。为了单纯地得到较大的的R2,模型的形式可能会很复杂,甚,模型的形式可能会很复杂,甚至使其中的参数无法解释实际意义。至使其中的参数无法解释实际意义。要充分考虑专业知识,结合实际解释要充分考虑专业知识,结合实际解释和应用效果来确定最终的曲线。和应用效果来确定最终的曲线。例1:对数曲线拟合某研究者以已知浓度免疫球蛋白某研究者以已知浓度免疫球蛋白A(lgA,g/ml)作火箭电泳,测得火箭高度作火箭电泳,测得火箭高度(cm)如下表)如下表,试采用恰当的回归方程描试采用恰当的回归方程描述火箭高度述火箭高度Y与与lgA浓度浓度X之间的关系。之间的关系。对数曲线对数曲线ndata dsh;ninput x y;x1=log10(x);ncards;n;nproc reg;nmodel y=x1;/*曲线直线化法*/nrun;ndata dsh2;ninput x y;ncards;n1.00 18.70 1.20 21.40 1.40 22.60 1.60 23.80 n;nproc nlin;nparms a=0 b=0;nmodel y=a+b*log10(x);run;例2:指数曲线拟合例例某疾病防治站重复治疗钩虫病病某疾病防治站重复治疗钩虫病病人的次数(人的次数(X)与复查阳性率()与复查阳性率(y)资料如)资料如下。根据散点图用合适的曲线回归方程来拟下。根据散点图用合适的曲线回归方程来拟合此资料。合此资料。X 1 2 3 4 5 6 7 8指数曲线指数曲线ndata zhsh;input x y;ncards;n;nproc nlin;parms a=0 b=0;modelny=exp(a+b*x);nproc plot;plot y*x=*;run;例3:抛物线拟合:抛物线拟合:n大气污染对日光紫外线辐射的影响研究大气污染对日光紫外线辐射的影响研究时间时间X 9 10 11 12 13 14 15紫外线紫外线强度强度Y.47 .57 .68 .73 .67 .55 .38 ndata pwx;input x y;ncards;n;nproc nlin;parms a=0 b=0 c=0;model ny=a+b*x+c*x*2;nproc plot;plot y*x=+;run;常见的几种常见的几种 曲线拟合曲线拟合

    注意事项

    本文(两变量间相关与回归分析.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开