数学建模回归分析.ppt
《数学建模回归分析.ppt》由会员分享,可在线阅读,更多相关《数学建模回归分析.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、回归分析,山东建筑大学 贺长伟,引言,回归分析是处理很难用一种精确方法表示出来的变量之间关系的一种数学方法,它是最常用的数理统计方法,能解决预测、控制、生产工艺优化等问题。它在工农业生产和科学研究各个领域中均有广泛的应用。 回归分析一般分为线性回归分析和非线性回归分析。本节着重介绍线性回归分析的基本结论及其在Matlab中的相应命令。线性回归分析是两类回归分析中较简单的一类,也是应用较多的一类。,一 一元线性回归分析,针对一组(二维)数据 (其中 互不相同),其最简单的数据拟合形式为寻求直线 ,使 在最小二乘准则下与所有数据点最为接近。 但由于随机观测误差的存在,满足上述数据点的直线应该是 (
2、1.1) 其中x, y是准确的, 是两个未知参数, 是均值为零的随机观测误差,具有不可观测性, 可以合理地假设这种观测误差服从正态分布。,于是我们得到一元线性回归模型为 (1.2) 其中 未知,固定的未知参数 称为回归 系数,自变量x称为回归变量。 (1.1)式两边同时取期望得: 称为y 对x的回归直线方程。 在该模型下,第i个观测值可 以看作样本(这些样本相互独立但不同分布, i = 1,2,n)的实际抽样值,即样本值。,一元线性回归分析的主要任务是: a.用实验值(样本值)对 作点估计; b.对回归系数 作假设检验; c.在 处对y 作预测,并对y作区间估计。 1、 回归参数 估计 假设有
3、n组独立观测值: 则 由(1.2)有 (1.3),其中 相互独立。记 称 为偏离真实直线的偏差平方和。由最小二乘法得到的估计 称为 的最小二乘估计,其中 (经验)回归方程为 (1.4),这样我们得到 的无偏估计 , 其中 服从正态分布,2 模型的假设、预测、控制,1、回归方程的显著性检验 在实际问题中,因变量y 与自变量x之间是否有线性关系(1.1)只是一种假设,在求出回归方程之后,还必须对这种回归方程同实际观测数据拟合的效果进行检验。 由(1.1)可知, 越大,y 随x变化的趋势就 越明显;反之, 越小,y 随x变化的趋势就越不明显。特别当 =0时,则认为y 与x之间不存在线性关系,当 时,
4、则认为y与x之间有线性关系。因此,问题归结为对假设 进行检验。,假设: 被拒绝,则回归显著,认为y 与x之间存在线性关系,所求的线性回归方程有意义;否则回归不显著,y与x的关系不能用一元线性回归模型来描述,所得的回归方程也无意义。此时,可能有如下几种情况: (1)x对y没有显著影响,此时应丢掉变量x; (2)x对y 有显著影响,但这种影响不能用线性关 系来表示,应该用非线性回归; (3)除x之外,还有其他不可忽略的变量对y 有显 著影响,从而削弱了x对y 的影响。此时应用 多元线性回归模型。因此,在接受H0 的同 时,需要进一步查明原因以便分别处理。,检验方法:(a)F检验法 对样本方差 进行
5、分解,有 上式中的 是由实际观测值没有落在回归直线上 引起的(否则为零),U 是由回归直线引起的。因 此,U 越大, 就越小,表示y 与x的线性关系就越 显著;否则,U 越小, 就越大,表示y 与x的线性 关系就越不显著。这样我们就找到了一种判别回归 直线拟合程度好坏的方法:如果U /s接近于1,即 U / 较大时,则对拟合效果感到满意。,由F分布有 其中r称为相关系数。对给定的显著水平a ,有置信 水平为1-a 的临界值 ,从而F检验法 的检验准则为:当 时,拒绝 ;否则就接受,(b)t检验法 当成立时,由T分布的定义有 因此,对于给定的显著水平a ,用T统计量检验 , 有置信水平为1-a
6、的临界值 ,从而t检验法的检验准则为: 当 时,拒绝 ;否则就接受,2、预测与控制 当检验结果拒绝了: ,接下来的问题是如 何利用回归方程 进行预测和控制。 预测就是对固定的x值预测相应的y 值,控制就是通 过控制x的值,以便把y 的值控制在制定的范围内。 (a)预测 设y 与x满足模型(1.2)。令 表示x的某个固 定值,且 假设 相互独立,则 的预测值和预 测区间如下。,y 的预测值为 的回归值 。它是 的无偏估计,即 给定显著水平 , 的置信水平为1- 的预测区间 为 ,其中 由上式可知,剩余标准差 越小,预测区间越 小,预测值越精确;对于给定的样本观测值和置信 水平而言, 越靠近 时,
7、预测精度就越高。,(b)控制 若要 的值以1- 的概率落在 指定区间(c,d)之内,变量x应控制在什么范围内 的问题就是所谓的控制问题。它是预测问题的反 问题。 只要控制x满足以下两不等式 这要求 若方程 分别有解a,b,则(a,b)就是所求的x的控制区间。,二 可线性化的一元非线性回归(曲线回归),在工程技术中,自变量x与因变量y 之间有时呈现出非线性(或曲线)关系,这是通常出现两种情况:一种是呈现多项式的关系,这种情况通过变量替换可化为多元线性回归问题给予解决;另一种是呈现出其它非线性关系,通过变量替换可化为一元线性回归问题给予解决。 若匹配曲线(经验公式)为含参量a,b的非线性曲线,采用
8、的办法是通过变量替换把非线性回归化为线性回归。通常匹配的含参量a,b的非线性曲线有以下六类,具体的替换方法如下:,1 双曲线 作变量替换 得 2 幂函数曲线 两边取常用对数: ,再作 代换 则幂函 数曲线方程就变成直线方程 注:对于非线性回归问题的Matlab实现问题,一种方法是化为相应的线性模型实现,另种方法是直接应用Matlab中相应的命令,其结果是一致的。,三 多元线性回归分析,一般地,在实际问题中影响应变量y 的自变量往 往不止一个,不妨设有k 个为 。通 过观测得到一组(k +1维)相互独立的试验观测 数据 , 其中n k +1。假设变量y 与变量 之间有线性关系: (1.5) 其中
9、 是随机变量,一般假设 则观测数据满足 (1.6),其中 互不相关且均是与 同分布的随机变量。令 则(1.6)可简写为 其中X 为已知的n*(k +1)矩阵,称为回归设计矩阵或资料矩阵,Y 是n维观察值列向量, 为k +1维未知的列向量, 是满足 的n维随机列向量.,一般称 (1.7) 为k 线性回归模型(高斯马尔科夫线性模型) 对(1.7)取数学期望得到 称为线性回归方程。,对线性模型所要考虑的主要问题是: (i)用实验观测数据对未知参数 做点估计和假设检验,从而建立因变量y 和自 变量 之间的线性关系; (ii)在 处对y 的值作预测和 控制,并对y 作区间估计。本部分总是假设 n k +
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数学 建模 回归 分析
限制150内