田间试验与统计方法--第七章-回归与相关优秀PPT.ppt
《田间试验与统计方法--第七章-回归与相关优秀PPT.ppt》由会员分享,可在线阅读,更多相关《田间试验与统计方法--第七章-回归与相关优秀PPT.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章回来与相关第七章回来与相关Regression and Regression and CorrelationCorrelation060120180施氮量施氮量(kg N/ha)2468植物的生长量植物的生长量直线回来和相关n n第一节 回来和相关的概念 n n其次节 直线回来n n第三节 直线相关n n第四节 直线回来与相关的内在关系n n 和应用要点n n引言引言n n 这一章探讨的对象:这一章探讨的对象:n n由一个变数由一个变数 两个或多个变数,因为在实际两个或多个变数,因为在实际生产实践和科学试验中所要探讨的变数往往不止生产实践和科学试验中所要探讨的变数往往不止一个,例如:一个
2、,例如:n n探讨温度凹凸和作物发育进度快慢的关系探讨温度凹凸和作物发育进度快慢的关系n n探讨每亩穗数、每穗粒数和每亩产量的关系探讨每亩穗数、每穗粒数和每亩产量的关系第一节 回来和相关的概念n n1.函数关系与统计关系 n n2.自变数与依变数 n n3.回来分析和相关分析n n4.两个变数资料的散点图 变量间的关系有两类:变量间的关系有两类:一类是变量间存在着完全确定性的关系,一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。可以用精确的数学表达式来表示。如长方形的面积如长方形的面积:S=ab。它们之间的关系是确定性的,只要知道了其中两个变它们之间的关系是确定性的,只要知道
3、了其中两个变它们之间的关系是确定性的,只要知道了其中两个变它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量的值就可以精确地计算出另一个变量的值,这类变量的值就可以精确地计算出另一个变量的值,这类变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为量间的关系称为量间的关系称为量间的关系称为函数关系函数关系函数关系函数关系。下一张下一张 主主 页页 退退 出出 上一张上一张 另一类是另一类是另一类是另一类是 变变变变 量量量量 间不存在完全的确定性关系,不间不存在完全的确定性关系,不间不存在完全的确定性关系,不间不存在完全的确定性关系,不能用
4、精确的数学公式来表示。能用精确的数学公式来表示。能用精确的数学公式来表示。能用精确的数学公式来表示。如施肥与产量的关系;身高与体重关系等如施肥与产量的关系;身高与体重关系等如施肥与产量的关系;身高与体重关系等如施肥与产量的关系;身高与体重关系等这些变量间都存在着特别亲密的关系,但不能由一个这些变量间都存在着特别亲密的关系,但不能由一个这些变量间都存在着特别亲密的关系,但不能由一个这些变量间都存在着特别亲密的关系,但不能由一个或几个变量的值精确地求出另一个变量的值。或几个变量的值精确地求出另一个变量的值。或几个变量的值精确地求出另一个变量的值。或几个变量的值精确地求出另一个变量的值。像这样一类关
5、系在生物界中是大量存在的,统计学中像这样一类关系在生物界中是大量存在的,统计学中像这样一类关系在生物界中是大量存在的,统计学中像这样一类关系在生物界中是大量存在的,统计学中把这些变量间的关系称为相关关系,把存在相关关系把这些变量间的关系称为相关关系,把存在相关关系把这些变量间的关系称为相关关系,把存在相关关系把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。的变量称为相关变量。的变量称为相关变量。的变量称为相关变量。统计关系统计关系统计关系统计关系下一张下一张 主主 页页 退退 出出 上一张上一张 相关变量间的关系一般分为两种相关变量间的关系一般分为两种:一种是因果关系,即一个
6、变量的变更受另一种是因果关系,即一个变量的变更受另一个或几个变量的影响。施肥影响产量,子代一个或几个变量的影响。施肥影响产量,子代的体高受亲本体高的影响;的体高受亲本体高的影响;另一种是平行关系,它们互为因果或共同另一种是平行关系,它们互为因果或共同受到另外因素的影响。如身高和体重之间的关受到另外因素的影响。如身高和体重之间的关系等都属于平行关系。系等都属于平行关系。下一张下一张 主主 页页 退退 出出 上一张上一张 统计学上接受回来分析统计学上接受回来分析(regression analysis)探讨呈因果关系的相关变量间的关)探讨呈因果关系的相关变量间的关系。表示缘由的变量称为自变量,表示
7、结果的系。表示缘由的变量称为自变量,表示结果的变量称为依变量。变量称为依变量。一元回来分析:探讨一元回来分析:探讨“一因一果一因一果”直线回来分析和曲线回来分析直线回来分析和曲线回来分析多元回来分析:探讨多元回来分析:探讨“多因一果多因一果”多元线性回来分析与多元非线性回来分析多元线性回来分析与多元非线性回来分析下一张下一张 主主 页页 退退 出出 上一张上一张 回来分析的任务:回来分析的任务:揭示出呈因果关系的相关变量揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回间的联系形式,建立它们之间的回来方程,利用所建立的回来方程,来方程,利用所建立的回来方程,由自变量(缘由)来预料、限制依
8、由自变量(缘由)来预料、限制依变量(结果)。变量(结果)。统计学上接受相关分析统计学上接受相关分析 (correlation analysis)探讨呈平行关系的相关变量之间的关探讨呈平行关系的相关变量之间的关系。系。简洁相关分析(直线相关分析):两个变量;简洁相关分析(直线相关分析):两个变量;复相关分析:探讨一个变量与多个变量间的线性复相关分析:探讨一个变量与多个变量间的线性相关;相关;偏相关分析:多个变量,探讨其余变量保持不变偏相关分析:多个变量,探讨其余变量保持不变的状况下两个变量间的线性相关。的状况下两个变量间的线性相关。下一张下一张 主主 页页 退退 出出 上一张上一张 函数关系函数
9、关系 有精确的数学表达式有精确的数学表达式 (确定性的关系)(确定性的关系)直线回来分析直线回来分析 一元回来分析一元回来分析 变量间的关系变量间的关系 因果关系因果关系 曲线回来分析曲线回来分析(回来分析)回来分析)多元回来分析多元回来分析 多元线性回来分析多元线性回来分析 统计关系统计关系 多元非线性回来分析多元非线性回来分析 (非确定性的关系)(非确定性的关系)简洁相关分析简洁相关分析 直线相关分析直线相关分析 平行关系平行关系 复相关分析复相关分析 (相关分析)(相关分析)多元相关分析多元相关分析 偏相关分析偏相关分析第一节第一节 直线回来直线回来 一、直线回来方程的建立一、直线回来方
10、程的建立 对于两个相关变量,一个变量用对于两个相关变量,一个变量用x表示,表示,另一个变量用另一个变量用y表示,假如通过试验或调查表示,假如通过试验或调查获得两个变量的获得两个变量的n对观测值:对观测值:(x1,y1),(),(x2,y2),),(,(xn,yn)下一张下一张 主主 页页 退退 出出 上一张上一张 为了直观地看出为了直观地看出x和和y间的变更趋势,可作出散间的变更趋势,可作出散点图点图 。例如,图是水稻方面的例如,图是水稻方面的3 3幅散点图幅散点图 x,单株产量(g)水稻单株生物产量与稻谷产量的散点图 x,每m2颖花数(万)水稻每m2颖花数和牢固率的散点图x x,最高叶面积指
11、数,最高叶面积指数水稻最高叶面积指数和亩产量的散点图水稻最高叶面积指数和亩产量的散点图 从散点图可以看出两个变量间:从散点图可以看出两个变量间:(2)关系性质:正相关?负相关?)关系性质:正相关?负相关?(3)相关程度:相关亲密?不亲密?)相关程度:相关亲密?不亲密?下一张下一张 主主 页页 退退 出出 上一张上一张 散点图散点图散点图散点图直观地、定性地直观地、定性地直观地、定性地直观地、定性地表示了两个变量之间的关系。表示了两个变量之间的关系。表示了两个变量之间的关系。表示了两个变量之间的关系。定量定量?(1 1)关系关系类型类型:直线型?曲线型?:直线型?曲线型?假如呈因果关系的两个相关
12、变量假如呈因果关系的两个相关变量y(依变量依变量)与与x(自变量自变量)间的关系是直线关系间的关系是直线关系 依变量依变量y的实际观测值的实际观测值yi i可用自变量可用自变量x的实际观的实际观测值测值xi i表示为:表示为:(由于依变量由于依变量y的实际观测值总的实际观测值总是带有随机误差是带有随机误差)(i i=1,2,=1,2,n n)(7 71 1)其中其中:x 为可以观测的一般变量为可以观测的一般变量(也可以是可以观测也可以是可以观测的随机变量的随机变量);y 为可以观测的随机变量为可以观测的随机变量;这就是直线回来的数学模型。我们可以依据这就是直线回来的数学模型。我们可以依据实际观
13、测值对实际观测值对,以及方差以及方差 做出估计。做出估计。i为相互独立,且都听从为相互独立,且都听从N(0,)的随机)的随机变量。变量。在在在在x x、y y直角坐标平面上可以作出多数直角坐标平面上可以作出多数直角坐标平面上可以作出多数直角坐标平面上可以作出多数 条直线,我们把条直线,我们把条直线,我们把条直线,我们把全部直线中最接近散点图中全部散点的直线用来表示全部直线中最接近散点图中全部散点的直线用来表示全部直线中最接近散点图中全部散点的直线用来表示全部直线中最接近散点图中全部散点的直线用来表示x x与与与与y y的直线关系,这条直线称为回来直线。的直线关系,这条直线称为回来直线。的直线关
14、系,这条直线称为回来直线。的直线关系,这条直线称为回来直线。下一张下一张 主主 页页 退退 出出 上一张上一张 设回归直线的方程为设回归直线的方程为:(7-2)其中,其中,其中,其中,a a是是是是 的估计值,的估计值,的估计值,的估计值,b b是是是是 的估计值。的估计值。的估计值。的估计值。确定直线回来方程的方法有最小二乘法、高斯牛顿法、麦夸特法、牛顿法、梯度法、正割法等等。这里重点给大家介绍最小二乘法。a、b应使回来估计值应使回来估计值 与实际观测值与实际观测值y的偏差的偏差平方和最小,即:平方和最小,即:依据微积分学中的求极值的方法,令依据微积分学中的求极值的方法,令 Q对对a、b的一
15、阶偏导数等于的一阶偏导数等于0,即:,即:最最 小小 整理得关于整理得关于a、b的的正规方程组正规方程组:下一张下一张 主主 页页 退退 出出 上一张上一张 解正规方程组,得:解正规方程组,得:(7-3)(7-4)分子是自变量分子是自变量分子是自变量分子是自变量x x的离均差的离均差的离均差的离均差 与与与与 依依依依 变变变变 量量量量 y y 的的的的 离离离离 均均均均 差差差差 的的的的 乘乘乘乘 积和积和积和积和 ,简简简简 称称称称 乘积和乘积和乘积和乘积和,记作,记作,记作,记作 分母是自变量分母是自变量分母是自变量分母是自变量x x的离均差的离均差的离均差的离均差 平方和平方和
16、平方和平方和 ,记作,记作,记作,记作SSSSXX。回归系数回归截距b 的符号反映了的符号反映了x影响影响y的性质,的性质,b的确定值大小的确定值大小反映了反映了 x 影响影响 y 的的 程度程度;的估计值。的估计值。叫做叫做回归估计值回归估计值,是当,是当x在在其研在在其研究究 范范 围围 内内 取某一个值时,取某一个值时,y值平均数值平均数 回来方程的基本性质:回来方程的基本性质:假如将(假如将(7-4)式代入()式代入(7-2)式,得到回来)式,得到回来方程的另一种形式方程的另一种形式(中心化形式中心化形式):下一张下一张 主主 页页 退退 出出 上一张上一张 性质性质1最小;最小;性质
17、性质2;性质性质3 回回 归归 直直 线线 通通 过过 点点。(7-5)【例【例7.1】在四川白鹅的生产性能探讨中,】在四川白鹅的生产性能探讨中,得到如下一组关于雏鹅重(得到如下一组关于雏鹅重(g)与)与70日龄重日龄重(g)的数据,试建立的数据,试建立70日龄重日龄重(y)与雏鹅重与雏鹅重(x)的直的直线回来方程。线回来方程。表表7-1 四川白鹅雏鹅重与四川白鹅雏鹅重与70日龄重测定结果日龄重测定结果 (单位:(单位:g)下一张下一张 主主 页页 退退 出出 上一张上一张 1、作散点图、作散点图 以雏鹅重(以雏鹅重(x)为横坐)为横坐标,标,70日龄重(日龄重(y)为纵坐标作散点图,)为纵坐
18、标作散点图,见见图图 2、计算回来截距、计算回来截距a,回来系数,回来系数b,建立直,建立直线回来方程线回来方程 首先依据实际观测值计算出首先依据实际观测值计算出 下下 列数据:列数据:下一张 主 页 退 出 上一张 进而计算出进而计算出b、a:得到四川白鹅的得到四川白鹅的70日龄重日龄重y对雏鹅重对雏鹅重x的的直线回归方程为:直线回归方程为:依据直线回来方程可作出回来直线。依据直线回来方程可作出回来直线。依据直线回来方程可作出回来直线。依据直线回来方程可作出回来直线。(作图)作图)作图)作图)制作直线回来图时,首先以制作直线回来图时,首先以制作直线回来图时,首先以制作直线回来图时,首先以x
19、x为横坐标,以为横坐标,以为横坐标,以为横坐标,以y y为纵坐标构建为纵坐标构建为纵坐标构建为纵坐标构建直角坐标系;然后取直角坐标系;然后取直角坐标系;然后取直角坐标系;然后取x x坐标上的一个小值坐标上的一个小值坐标上的一个小值坐标上的一个小值x1x1代入回来方程得代入回来方程得代入回来方程得代入回来方程得 ,取一个大值,取一个大值,取一个大值,取一个大值x2x2代入回来方程得代入回来方程得代入回来方程得代入回来方程得 ,连接坐标点,连接坐标点,连接坐标点,连接坐标点(x1(x1,)和和和和(x2(x2,)即成一条回来直线。即成一条回来直线。即成一条回来直线。即成一条回来直线。从图看出,并不
20、是全部的散点都恰好落在回来直线上,这说明从图看出,并不是全部的散点都恰好落在回来直线上,这说明从图看出,并不是全部的散点都恰好落在回来直线上,这说明从图看出,并不是全部的散点都恰好落在回来直线上,这说明用用用用 去估计去估计去估计去估计y y是有偏差的。是有偏差的。是有偏差的。是有偏差的。下一张下一张 主主 页页 退退 出出 上一张上一张 3、直线回来的偏离度估计、直线回来的偏离度估计 偏差平方和偏差平方和 的大小表示了实测点的大小表示了实测点与回来直线偏离的程度,因而偏差平方和又称与回来直线偏离的程度,因而偏差平方和又称为离回来平方和。为离回来平方和。离回来均方为:离回来均方为:离回来标准误
21、离回来标准误 (7-6)离回来标准误离回来标准误Syx的大小表示了回来直线的大小表示了回来直线与实测点偏差的程度,即回来估测值与实测点偏差的程度,即回来估测值 与与 实实 际观测值际观测值y偏差的程度,于是我们把离回来标偏差的程度,于是我们把离回来标准误准误Syx用来表示回来方程的偏离度。用来表示回来方程的偏离度。下一张下一张 主主 页页 退退 出出 上一张上一张 二、直线回来的显著性检验二、直线回来的显著性检验二、直线回来的显著性检验二、直线回来的显著性检验 上面介绍的方法求得一个回来方程上面介绍的方法求得一个回来方程上面介绍的方法求得一个回来方程上面介绍的方法求得一个回来方程 =a+bx
22、=a+bx。明显,这样的回来方程所反应的两个变量间明显,这样的回来方程所反应的两个变量间明显,这样的回来方程所反应的两个变量间明显,这样的回来方程所反应的两个变量间 的直线的直线的直线的直线关系是不真实的。关系是不真实的。关系是不真实的。关系是不真实的。如何推断直线回来方程所反应的两个变量间的直线关如何推断直线回来方程所反应的两个变量间的直线关如何推断直线回来方程所反应的两个变量间的直线关如何推断直线回来方程所反应的两个变量间的直线关系的真实性呢?这取决于变量系的真实性呢?这取决于变量系的真实性呢?这取决于变量系的真实性呢?这取决于变量x x与与与与y y间是否存在直线关间是否存在直线关间是否
23、存在直线关间是否存在直线关系。系。系。系。下一张下一张 主主 页页 退退 出出 上一张上一张 1、直线回来的变异来源、直线回来的变异来源 图图7-4 的分解图的分解图 从图从图7-4看到:看到:上式两端平方,然后对全部的上式两端平方,然后对全部的n点求和,则有点求和,则有 下一张下一张 主主 页页 退退 出出 上一张上一张 反映了反映了y的总变异程度,称为的总变异程度,称为y的总的总平方和,记为平方和,记为SSy;反映了由于反映了由于y与与x间存在直线关系间存在直线关系所引起的所引起的y的变异程度,称为回来平方和,的变异程度,称为回来平方和,记为记为SSR;反映了除反映了除y与与x存在直线关系
24、以外的存在直线关系以外的缘由,包括随机误差所引起的缘由,包括随机误差所引起的y的变异程度,的变异程度,称为离回来平方和或剩余平方和,记为称为离回来平方和或剩余平方和,记为SSr。(7-9)这表明这表明y的总平方和剖分为的总平方和剖分为 回来平方和回来平方和 与离回来与离回来平方和两部分。平方和两部分。下一张下一张 主主 页页 退退 出出 上一张上一张 y y的总自由度的总自由度的总自由度的总自由度dfydfy也划分为回来自由度也划分为回来自由度也划分为回来自由度也划分为回来自由度dfRdfR与离回来自由度与离回来自由度与离回来自由度与离回来自由度dfrdfr两部分,即两部分,即两部分,即两部分
25、,即 回来自由度等于自变量的个数,回来自由度等于自变量的个数,回来自由度等于自变量的个数,回来自由度等于自变量的个数,即即即即 离回来自由度离回来自由度离回来自由度离回来自由度 y y 的的的的 总总总总 自自自自 由度由度由度由度 回回回回 归归归归 均均均均 方方方方离回来均方离回来均方离回来均方离回来均方 。2、回来关系显著性检验、回来关系显著性检验F检验检验 无效假设无效假设HO:=0,备择假设,备择假设HA:0。在无效假设成立的条件下,回来均方与离回在无效假设成立的条件下,回来均方与离回来均方的比值听从来均方的比值听从 和和 的的F分布分布 (7-11)下一张下一张 主主 页页 退退
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 田间试验 统计 方法 第七 回归 相关 优秀 PPT
限制150内