欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    回归与相关分析 (2).ppt

    • 资源ID:78698185       资源大小:1.94MB        全文页数:88页
    • 资源格式: PPT        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    回归与相关分析 (2).ppt

    试验设计与分析试验设计与分析 第四章第四章 回归与相关回归与相关 主讲教师主讲教师 李得孝李得孝 4-1直线回归与相关LinearRegressionandCorrelation变量之间的关系n统计相关关系1)因果关系因果关系回归分析回归分析2)平行关系相关分析4-1-1直线回归7067555251525160641616.31610.91440.01440.71423.31471.31421.81547.11533.0表表4-1-3 播种至齐穗天数播种至齐穗天数x与总积温与总积温y的关系的关系图图4-1-4 y关于关于x的回归散点图的回归散点图(Scatter plot)回归关系的模拟步骤:回归关系的模拟步骤:一、绘制散点图:一、绘制散点图:根据初等函数及其图像知识确定近根据初等函数及其图像知识确定近似的函数似的函数y=f(x)y=0+xy=0+x找到一条直线,即,确定0和的值,使偏差平方和最小。二二.参数估计参数估计利用最小二乘法估计0和:7067555251525160641616.31610.91440.01440.71423.31471.31421.81547.11533.0实例计算:实例计算:回归方程(Regressionequation)为:Intercept回归截距Slope斜率确定直线回归方程的方法有最小二乘法、高斯牛顿法、麦夸特法、确定直线回归方程的方法有最小二乘法、高斯牛顿法、麦夸特法、牛顿法、梯度法、正割法等等。牛顿法、梯度法、正割法等等。提问:回归方程是否真是存在?三三.显著性检验显著性检验1)检验回归方程的显著性剩余平方和,残差平方和,离回归平方和残差回归平方和与剩余平方和的计算回归平方和与剩余平方和的计算回归直线的显著性检验回归直线的显著性检验方法1:方差分析法方法2:相关系数法(后讲)2)b的显著性检验的显著性检验3)3)b b0 0 的假设检验的假设检验(过原点)过原点)在实际应用中,有时要检验回归直线过定点(c,d)的问题,此时只要把观察点(x,y)变为(x-c,y-d)就成为过原点的问题了四四.预测与控制预测与控制当显著时,可用于预测、控制等但必须注意,运用时x的取值范围只能在拟合回归方程时所用样本的范围内,不能外推。例例3的的99%预测图预测图4-2 相关分析及检验:相关分析及检验:这种检验不能对作出区间估计,亦不能进行H0:=c(c0)的检验!?解决途径:将r转换成Z1)相关系数等于非零常数的检验相关系数等于非零常数的检验则z近似服从正态分布u检验:,【例4-2-1】在第一节【例4-1-1】中,试检验与的差异显著性,并给出95%的置信区间2)两个相关系数的比较两个相关系数的比较【例4-2-2】在研究贵阳水牛中,用39头牛的实测数据,得体重与胸围的相关系数为r1=0.8256*,,体重与体斜长的相关系数为r2=0.6678*,试比较两相关系数的的差异显著性(参考成组数据的假设测验!)结论4-3 y关于关于x的非线性回归分析的非线性回归分析常用的一些简单非线性关系,都可通过变量代换变成直线回归分析,这种方法称为拟线性化法。此种方法获得的非线性方程一般不是最好的回归方程,只有用非线性最小二乘回归才能得到较为理想的结果【例4.1.4】用表4-1-4数据拟合Logistic曲线图图4-1-8Z与与x 的的Logistic关系曲线关系曲线 转换?xz53.527.5714303.316780040106.414.6520002.6827323931514.65.8493151.7663245722031.42.1847130.7814846422545.61.1929820.1764564373060.40.6556290.4221599873575.20.3297871.10.3075784090.20.1086472.2196470414595.40.0482183.0320222755097.50.0256413.663516646表表4-1-4 越冬棉红铃虫的化蛹进度越冬棉红铃虫的化蛹进度计算直线回归方程的SAS程序为:Data new;Input x y;Cards;165 1.25 117180 1.85 160175 5.92 80120 9.42 259.98 28 11.01 40;Run;利用利用reg的程序的程序*/proc reg;model y=x;plot y*x /conf95;/*指定给出回归曲线图指定给出回归曲线图*/run;利用利用glm的程序:的程序:proc glm;model y=x;run;计算相关系数的SAS程序为:Data new;Input x y;Cards;701616.3671610.9551440.0521440.7511423.3521471.3511421.8611547.1641533.0;Proc corr;/用于计算相关系数的过程用于计算相关系数的过程Var x y;Run;4-3对直线回归分析的进一步讨论n回归直线的失拟问题分析回归直线的失拟问题分析n回归直线间的比较回归直线间的比较 (1)两条回归直线的比较)两条回归直线的比较 (2)k 条回归直线的比较条回归直线的比较4-3-1 回归直线的失拟问题分析回归直线的失拟问题分析表表4-1-1 4-1-1 吸附率吸附率y y关于浓度关于浓度x x的直线回归的有重复的数据的直线回归的有重复的数据149.016.616.733.316.6516.67249.316.816.833.616.8016.78349.516.816.933.716.8516.84449.816.917.033.916.9516.95550.017.017.134.117.0517.02650.217.017.134.117.0517.08在K个点上均作了m次重复观察,则真正的观察误差平方和失拟平方和失拟性检验:故回归直线是不失拟的。进行失拟检验后,再进行回归方程的显著性检验参见系统分组4-3-2回归直线间的比较回归直线间的比较1.两条回归直线的比较两条回归直线的比较【例4-2-1】测定玉米地方品种“石榴子”和“七叶白”的叶片长宽乘积(x,cm2)和叶面积(y,cm2)的关系,试比较二者的异同经计算有七叶白:石榴子:1)平行性检验平行性检验2)共截距检验共截距检验3)在平行情况下的共截距检验在平行情况下的共截距检验(重合性检验)重合性检验)4)在平行性被拒绝下的共截距检验)在平行性被拒绝下的共截距检验b0可解释为加权平均回归直线的截距(权重:ni/(n1+n2)2.k条回归直线的比较条回归直线的比较第一步:重合性分析,如果它成立,则把k个样本合并,计算出:重合:合并回归直线不重合:平行性分析第二步:平行性分析不全相等由k条回归直线变为k条平行回归直线所引起的剩余平方和变化为第三步:共截距分析不全相等k条回归直线的比较条回归直线的比较:实例实例,【例4-2-2】为研究某4个作物品种从播种至出穗的总积温(单位:d)与天数x的关系,在同一管理条件下,各观察了7个点,(1)fi(2)SSxi(3)SSyi(4)SPi(5)(4)/(2)bi(6)b0i(7)(1)-1 f ei(8)(3)-(4)2/(2)Q ei(9)品种1673897939.48364.011.33701.2353147.426394.950109.74291.410.87865.3353474.836928.0151457.711809.012.73755.9651185.646830.0185460.412325.514.85773.8552426.710234.5品种内(平行性)242890.9484967.236789.912.73618.86759.80756.23890.672316775。0(Qe(平)品种间3696.75486388.359225.9总变异(重合性)273587.7971355.646015.812.83750.1226381157。5(Qe(重)先检验重合性重合性被拒绝,检验平行性重合性与平行性均被拒绝,但是仔细斟酌,4条回归直线中的第4条与其他3条差别甚大,先把它剔除,仅比较前3条回归线的异同前3条回归直线的品种内(平行性)计算:检验表明前3条回归直线是平行的,其方程为:进一步研究第4条与第3条的关系(因为二者的回归截距很相近):4-4多元线性回归与相关年月日4-4多元回归与相关提纲n多元回归方程的建立n多元回归方程的检验与偏回归系数的检验n通径分析与偏相关分析x1x2xjxpy1x11x12x1jx1py12x21x22x2jx2py2.ixi1xi2xijxipyi.nxn1xn2xnjxnpyn和T.1T.2T.jT.pT.y表表4-4-1 多元回归数据多元回归数据4-4-1多元回归方程的建立:复相关系数复相关系数R (采用大写以与简单相关系数r相区别)多元相关或称复相关(MultipleCorrelation):是在m1个变量中,m个变量的综合和一个变量的相关。4-4-2多元线性回归的统计检验多元线性回归的统计检验1.多元线性回归方程的显著性检验不完全为0计算复相关系数后,直接查计算复相关系数后,直接查Ra表(表(df=n-p-1,变量个数变量个数 p+1)2 偏回偏回归归系数系数 bj 的检验的检验或例4-4-1】支崇远对贵阳成年水牛39头实测了体重(y/kg)、胸围(x1/cm)、体斜长(x2/cm)和体高(x3/cm),资料列于表4-4-2中,试建立三元线性回归方程编号12345678体重443.5507.5462.5514.0471.5545540.5536胸围194200194211205204315207体长146150150153153153154142体高122.1123.5126.5134.5129.5125.5133.0128.5编号910111213141516体重468550.5492.0583442.5439.5477.5450胸围201199200210194190203194体长153160149160140147148135体高128.7127.5123.5138.6124121129118编号1718192021222324体重466480422413.5471.0414.5410428.5胸围190190185183193188179193体长135138.5140130145133140140体高122124119.5114123.5119119116编号2526272829303132体重468517.5578620481702420491胸围190195.5207.5211203220197194体长155150160150137165142149体高120.5129.5128.5132.5130142.2124122编号33343536373839体重515483505465460404496胸围198200197192185187194体长150135153144154151152体高131.5128124119.5119.5123.0120.0表表4-4-2 39头成年水牛实测体重、体尺数据表头成年水牛实测体重、体尺数据表由表4-4-2数据计算一级统计数据:由一级统计数据计算二级统计数据:平方和lxx交叉积lxy计算并估计各偏回归系数得出回归方程:计算U,Q,U1,U2,U3并检验表表4-4-3 4-4-3 三元线性回归方程的方差分析三元线性回归方程的方差分析变异来源 df(自由度)SS(平方和)MS(均方)FFaX119410.4418(U1)9410.44189.154*X216553.4201(U2)6553.42016.3746*X311103.0016(U3)1103.00161回归3(p)108128.5546(U)36042.84535.06*剩余35(n-p-1)35981.5546(Q)1028.0444总变异38(n-1)144110.0897(Lyy)剔除x3后:其中200-7693/39=2.7436150-5741.5/39=2.7821123.5-4885.1/39=-1.7590(2.7436,2.7821,1.7590)示例:4-4-3 用线性回归解决多项式非线性回归问题用线性回归解决多项式非线性回归问题如:如:令:令:表表4-4-4 4-4-4 废品率废品率y y与化学成分与化学成分x x的记录的记录y(%)(0.01%)y(%)(0.01%)1.303411560.444016001.003612960.564116810.733713690.304217640.903814440.424318490.813915210.354318490.703915210.404520250.603915210.414722090.504016000.60482304图4-4-1废品率y与化学成分x的散点图及回归曲线图正则方程组为,极值:当某化学成分含量在0.44%左右时,平均废品率最小,约为0.39%4-4-4 通径分析与偏相关分析偏相关(PartialCorrelation):是在其余M2个变量皆固定时,指定的两个变量间的相关。偏回归系数bi不能反映自变量的相对重要性,因为:bi带有具体的单位,单位不同无法比较;即使单位相同,Xi的变异程度不同,也不能比较。但可以采用标准化的偏回归系数,也称通径系数(Path coefficient):):即对分子和分母分别除以即对分子和分母分别除以Y和和Xi的标准差,就可以消除单位和变异度的影响,的标准差,就可以消除单位和变异度的影响,其统计学意义是若增加一个标准差单位,其统计学意义是若增加一个标准差单位,Y将增加或减少将增加或减少Pi个标准差单位。个标准差单位。通径分析实质上是标准化的多元线性回归分析图图4-5-1 y关于各关于各x的通径图的通径图决策系数【例4-5-2】关于小麦产量y与其构成因素x1(百粒重)、x2(每株穗数)、x3(每穗粒数)x4(每穗粒重)的通径分析试验为随机区组设计,参试品种10个,重复3次误差自由度为18,遗传型的自由度为9,遗传相关系数的显著性临界值为x1X2X3X4yX110.2740.7060.5250.050X210.3000.4740.477X30.6650.256X410.440通径直接作用间接作用X对y的总作用决策系数x1对y0.3210.0867.10.8330.4770.050 x2对y0.3130.08820.00.3540.4300.477x3对y1.1800.22779.00.0940.06040.256x4对y0.9080.1690.1482.60.7850.440对y0.3650.36513.3偏相关分析偏相关分析观察值x126.731.330.433.934.633.830.427.0 x273.459.065.958.264.664.662.171.4y10089591051102210971103992945观察值和平均X133.330.431.533.134.0410.431.5692x264.564.161.156.059.8824.763.4385y1074102910049951045133241024.9231【例4-5-3】测定13块中籼南京11号高产田的每亩穗数(x1),每穗实粒数(x2)和每亩稻谷产量(y).结果列于表4-5-4,试求偏相关系数简单相关系数偏相关系数4-5协方差分析年月日回顾试验条件的控制n为了提高试验的准确度和精确度,必须使所有试验单元或区组内的试验单元的试验条件一致,这叫试验控制n如果试验指标为y,而影响试验单元不一致的因素X可以量测,则X叫做方差分析中的协变量,可进行统计控制例4-3-1】为比较三种肥料(A1,A2,A3)对苹果的增产效果,选了24株同龄苹果树,随机分成三组,并在第一年记下各树的产量(x,kg),第二年每组随机施用一种肥料,并记录各树的产量(y,kg),结果见表4-3-1,试进行方差分析表表4-3-1 4-3-1 施用三种肥料的苹果产量(施用三种肥料的苹果产量(kg/kg/株)株)肥料观察值(xijj,yij)和平均A1x1j475853464956544440750.875y1j546663515666615046758.375A2x2j525364585961636647659.500y2j545367626263646949461.750A3x3j444846505957585341551.875y3j525854617064696649461.750129854.083145560.6254-5-1 单因素完全随机设计试验的协方差分析单因素完全随机设计试验的协方差分析表表4-3-2 4-3-2 不考虑协变量不考虑协变量X X的方差分析的方差分析变异来源DFSSMSF肥料间260.75030.375误差21830.87539.565总变异23891.625变异来源DFSSMSF肥料间2356.0833178.04176.34(Pr=0.0070)误差21589.7528.0833总变异23945.8333表表 苹果树的基础生产力(苹果树的基础生产力(x x)的方差分析)的方差分析表表4-3-3 三种肥料供试树中三种肥料供试树中y关于关于x的直线回归分析的直线回归分析变异来源(1)SSxi(2)SSyi(3)SPi(4)=(3)/(1)bi(5)(6)(8)A1180.875293.875226.3751.25165.2979610.5543A2178.000223.500195.0001.09553.432669.8764A3230.875313.500257.7501.11643.8365625.746646.1773肥料内0.2100(平行589.750830.875675.1251.15156.76712048.8305性)2.0135肥料间356.08360.75086.6252总变异945.833891.625765.7500.809616.839222271.6709(重合性)三条回归直线的重合性检验:三条回归直线的平行性检验:说明树的基础生产力x每增加1kg,则y平均增加1.1515kg,其标准差为0.0643kg如果把基础生产力影响校正到同一平均基础生产力水平才是Ai的真正观察值回归校正值表表4-3-4 4-3-4 的校正值的校正值 肥料A162.156 61.490 64.247 60.308 61.853 63.793 61.09661.611496.554A256.399 54.247 55.581 57.490 56.338 55.035 53.732 55.278444.100A363.61165.005 63.308 65.702 64.338 60.641 64.490 67.247514.3421455.000三种肥料均值间的比较变成三条平行的回归直线截距间的比较,有协变量的单因素完全随机等重复试验方差分析有以下几点:具有协变量的方差分析过程是a条回归直线比较的过程,它既等价于校正平均数间的显著性检验,又等价于三条平行回归直线截距间的显著性检验,因而这个方差分析过程又称为离回归分析模型充分说明了这里的协方差分析就是关于X的直线回归分析表表4-3-5 单因素完全随机试验的协方差分析(离回归分析)单因素完全随机试验的协方差分析(离回归分析)变异来源df回归计算离回归分析SSxSSySPbiF(1)处理+误差(总回归)23945.833891.625765.7500.809622271.6709(2)处理间2356.08360.75086.625(3)误差(处理内)21589.750830.875675.1251.15152048.83052.4415(4)重合性,即校正平均数间或回归截距间2222.8404111.420245.64*4-5-2 单因素单因素随机区组试验的协方试验的协方差分析差分析表表4-3-6 “南优南优3号号”在不同施肥条件下的颖花数(在不同施肥条件下的颖花数(x)和结实率()和结实率(y)区组处理III处理总和处理平均校正平均数xyxy14.59584.32618.911194.45559.564.7624.09654.11628.201274.10063.566.0333.94644.11648.051284.02564.065.9543.90663.57697.471353.73567.567.2253.45713.79677.241383.62069.067.8463.48713.38726.861433.43071.568.8773.39713.03746.421453.21072.568.1883.14723.24696.381413.19070.566.0293.34693.04696.381383.19069.064.53104.12614.76548.881154.44057.562.64114.12634.75568.871194.43559.564.60123.84673.60627.441293.72064.564.10133.96644.50608.461244.23062.065.53143.03753.01716.041463.02073.067.2252.3993753.21910105.6018473.74266.933.80165.003.771465.964366.7065.23表表4-3-7 4-3-7 例例2 2的平方和与偏差积和的平方和与偏差积和变异来源df区组间10.024026.030.79处理间136.8732694.4666.37误差130.837282.476.44总变异277.7344802.9673.60表表4-3-8 4-3-8 例例2 2中中X X与与y y的方差分析的方差分析变异来源df颖花数(X)结实率(y)SSMSFSSMSF区组间10.02400.0240126.0326.034.10处理间136.87320.52888.20*694.4653.428.43*误差130.83720.064582.476.34表表4-3-9 例例2中有关处理的协方差分析(离回归分析)中有关处理的协方差分析(离回归分析)变异来源df回归计算离回归分析SSxSSySPbiF(1)处理+误差(总回归)267.7104776.9372.819.4432589.3786(2)处理间136.8732694.4666.37(3)误差(处理内)130.837282.476.447.6921232.93152.744(4)重合性,即校正平均数间或回归截距间1356.44714.342校正结实率没有显著性差异,表4-3-8的结论是错的表表4-3-9 例例2中有关处理的协方差分析(离回归分析)中有关处理的协方差分析(离回归分析)变异来源df回归计算离回归分析SSxSSySPbiF(1)区组+误差(总回归)140.8612108.50-7.23-8.39531347.8023(2)区组间10.024026.03-0.79(3)误差(区组内)130.837282.47-6.44-7.69231232.93152.7443(4)重合性,即校正平均数间或回归截距间114.870814.8708

    注意事项

    本文(回归与相关分析 (2).ppt)为本站会员(赵**)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开