《相关关系与回归分析.ppt》由会员分享,可在线阅读,更多相关《相关关系与回归分析.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学第九章第九章回回 归归 分分 析析 相关关系与回归分析相关关系与回归分析 9.2 一元回归分析一元回归分析 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学1 相关关系与回归分析相关关系与回归分析 球的直径球的直径 X 与球的体积与球的体积 V 之间有确定之间有确定的函数关系的函数关系 在现实世界中存在大量的变量在现实世界中存在大量的变量,它们有相它们有相互依存、相互制约的关系,一般分为两类:互依存、相互制约的关系,一般分为两类:确定性关系确定性关系与与非确定性关系非确定性关系
2、.一一.相关关系与回归函数相关关系与回归函数 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 随机信号随机信号由振幅由振幅 和初相角和初相角确定确定.(救救长江)(救救长江)江河上游地区森林覆盖面江河上游地区森林覆盖面积积Y与下游的水流量与下游的水流量X之间的关系之间的关系.还有另一类变量关系,如:还有另一类变量关系,如:农作物产量农作物产量Y与降雨量与降雨量 X1,氮、磷、钾的氮、磷、钾的施肥量施肥量X2、X3、X4 之间的关系之间的关系.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 EX.5 产品的价格产品的价格X与
3、需求量与需求量M之间存在之间存在关系关系.特点特点 变量间的关系无法用确定的函数来变量间的关系无法用确定的函数来明确表述明确表述.问题问题 如何描述变量间的各类关系?如何描述变量间的各类关系?将作为考察目标的变量称为将作为考察目标的变量称为因变量因变量(记为记为Y),而将影响它的各个变量称为而将影响它的各个变量称为自变量自变量或或可可控变量控变量,记为记为(X1,X2,.Xk)回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学1.确定性的函数关系确定性的函数关系用第三章方法可求随机变量函数的分布用第三章方法可求随机变量函数的分布.若已知随机变量若已知随机变量X的
4、分布就可以确定函数的分布就可以确定函数的分布的分布.由振幅和初相角的分布可以完全确定随由振幅和初相角的分布可以完全确定随机信号机信号的分布的分布.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学2.非确定性的相关关系非确定性的相关关系 EX.6 已测得已测得SCS系统的输入和输出信号,系统的输入和输出信号,如何确定输入和输出之间的关系?(如何确定输入和输出之间的关系?(P228非线非线性交调的频率设计)性交调的频率设计)设想设想 构造某种函数来描述输入和输出之构造某种函数来描述输入和输出之间的非确定关系间的非确定关系.SCS系统系统 回归分析回归分析电子科技大
5、学电子科技大学 回归分析回归分析电子科技大学电子科技大学 考虑单个因变量考虑单个因变量Y与单个自变量与单个自变量X的情形的情形.1)(x)可理解为在可理解为在“X=x”的条件下,随机的条件下,随机变量变量Y 取值的集中点;取值的集中点;随机变量的相关关系引进:随机变量的相关关系引进:在在“X=x”时,时,Y(连续型连续型)的条件数学期望为的条件数学期望为 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 对于对于X的不同取值的不同取值x1,x2,xnx1x2x3YX方程方程y=(x)回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技
6、大学 将可控变量将可控变量X1,X2,.Xk的取值记为的取值记为x1,x2.,xk,存在,称存在,称Y 与与X1,X2,.Xk具有具有相关关系相关关系.若条件数学期望若条件数学期望:2)方程方程 y=(x)描述了描述了Y 与与 X 间非确定性间非确定性的关系的关系.相关关系是一种相关关系是一种非确定性关系非确定性关系 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学定义定义9.1.1 称称为为Y 关于关于X1,X2,.Xk的的回归函数回归函数,称为称为Y 对对 X1,X2,.Xk的的回归方程回归方程.方程方程注注 回归函数是确定性的函数回归函数是确定性的函数.
7、回归分析回归分析是从回归函数出发处理相关关系是从回归函数出发处理相关关系的方法的方法.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学高尔顿,生物统计学派的奠基人,他的高尔顿,生物统计学派的奠基人,他的表哥达尔文的巨著物种起源问世以后,表哥达尔文的巨著物种起源问世以后,触动他用统计方法研究智力遗传进化问题,触动他用统计方法研究智力遗传进化问题,第一次将概率统计原理等数学方法用于生物第一次将概率统计原理等数学方法用于生物科学,明确提出科学,明确提出“生物统计学生物统计学”的名词的名词.统计学上的统计学上的“相关相关”和和“回归回归”的概念是由高的概念是由高尔顿首
8、先引进。尔顿首先引进。“回归回归”一词的由来一词的由来 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 高尔顿的学生卡尔高尔顿的学生卡尔皮尔逊(皮尔逊(Karl Pearson)测)测量了量了1078个父亲及其成年儿子的身高个父亲及其成年儿子的身高.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 1870年,高尔顿在研究人类身长的遗传问题年,高尔顿在研究人类身长的遗传问题时,发现下列关系:时,发现下列关系:1.高个子的父亲有着较高身材的儿子,而矮高个子的父亲有着较高身材的儿子,而矮个子父亲的儿子身材也比较矮个子父亲的儿子身
9、材也比较矮;2.高个子父母的子女,其身高有低于其父高个子父母的子女,其身高有低于其父母身高的趋势母身高的趋势;3.而矮个子父母的子女,其身高有高于其而矮个子父母的子女,其身高有高于其父母的趋势父母的趋势;即有即有“回归回归”到平均值的趋势,这就是统计学到平均值的趋势,这就是统计学上最初出现上最初出现“回归回归”时的涵义时的涵义.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学得数学模型得数学模型:设想设想:Y=+=+随机误差随机误差可视为随机误差,通常要求可视为随机误差,通常要求:其它未知的、其它未知的、未考虑的因素未考虑的因素以及随机因素以及随机因素的影响所
10、产生的影响所产生.3.回归模型的引进回归模型的引进若若Y 关于关于X1,X2,.Xk的回归函数为的回归函数为 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 建立模型涉及建立模型涉及三个问题三个问题:2 是用回归函数近似因变量是用回归函数近似因变量Y产生的产生的均方误均方误差差.1)确定对因变量确定对因变量Y 影响显著的自变量;影响显著的自变量;2)确定回归函数确定回归函数 (x)的类型;的类型;3)对对参数进行估计参数进行估计.1)E()=0;2)D()=E(2)=2 尽可能小尽可能小.本章内容本章内容 回归分析回归分析电子科技大学电子科技大学 回归分析回
11、归分析电子科技大学电子科技大学二二.回归函数类型的估计确定回归函数类型的估计确定实际问题中,通常未知回归函数形式实际问题中,通常未知回归函数形式.回归分析的回归分析的基本思想基本思想:根据自变量根据自变量X1,X2,.Xk与因变量与因变量Y的的观察值去观察值去估计估计回归函数回归函数.本节仅讨论最简单的情形:可控变量本节仅讨论最简单的情形:可控变量Y关关于单个因变量于单个因变量X的回归函数存在的回归函数存在 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 为估计回归函数,可依据问题的背景,为估计回归函数,可依据问题的背景,确确定或假定回归函数的形式定或假定回
12、归函数的形式.称称 问题的提法问题的提法 对两个变量对两个变量X、Y 间的回归函间的回归函数数 y=(x),选择某个函数选择某个函数S(x)作为其估计函作为其估计函数:数:常通过分析数据散布图获得对变量间相常通过分析数据散布图获得对变量间相关关系的初步认识关关系的初步认识.为为Y关于关于X的的经验回归方程经验回归方程.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学例例9.1.1 身高体重关系身高体重关系 希望根据某地区人的希望根据某地区人的15对身高对身高h 和体重数和体重数据据m,用简洁的函数关系式描述该地区人的,用简洁的函数关系式描述该地区人的身高体重的
13、对应关系身高体重的对应关系.呈现幂函数的呈现幂函数的增长趋势,可设增长趋势,可设其中其中a,b是待定参是待定参数数.回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学例例9.1.2 施肥效果分析施肥效果分析 某地区作物生长所需的营养素主要是氮某地区作物生长所需的营养素主要是氮(N)、钾、钾(K)、磷、磷(P).某作物研究所在某地区某作物研究所在某地区对土豆做了一定数量的实验对土豆做了一定数量的实验,实验数据如下实验数据如下列表所示列表所示,其中其中ha表示公顷表示公顷,试分析施肥量试分析施肥量与土豆产量之间关系与土豆产量之间关系.回归分析回归分析电子科技大学电子
14、科技大学 回归分析回归分析电子科技大学电子科技大学施肥量施肥量(kg/ha)产量产量(t/ha)015.183421.366725.7210132.2913534.0320239.4525943.1533643.4640440.8347130.75施肥量施肥量(kg/ha)产量产量(t/ha)034.462432.474936.067337.969841.0414740.0919641.2624542.1729440.3634242.73施肥量施肥量(kg/ha)产量产量(t/ha)018.984727.359334.8614039.9218638.4427937.7337238.434654
15、3.8755842.7765146.22N P K 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学土豆产量土豆产量氮肥量数据散布图氮肥量数据散布图 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学土豆产量土豆产量磷肥量数据散布图磷肥量数据散布图可选可选 回归分析回归分析电子科技大学电子科技大学 回归分析回归分析电子科技大学电子科技大学 思考思考 是否能由数据散布图完全确定回归函是否能由数据散布图完全确定回归函数的类型和形式?数的类型和形式?结论结论 仅是初步感性的认识,需进行检验仅是初步感性的认识,需进行检验.问题问题 观察法的依据?观察法的依据?根据小概率实际推断原理,做一次试验得根据小概率实际推断原理,做一次试验得到的数据最可能密集在其回归曲线及其附近到的数据最可能密集在其回归曲线及其附近.因回归函数因回归函数(x)为在为在“X=x”的条件下的条件下Y的的数学期望,随机变量数学期望,随机变量Y 取值的集中点取值的集中点.
限制150内