建模讲座相关与回归分析讲稿.ppt
《建模讲座相关与回归分析讲稿.ppt》由会员分享,可在线阅读,更多相关《建模讲座相关与回归分析讲稿.ppt(82页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、建模讲座相关与回归分析第一页,讲稿共八十二页哦第一节变量间的相关关系第一节变量间的相关关系一、变量相关的概念一、变量相关的概念第二页,讲稿共八十二页哦变量之间的关系变量之间的关系确定性关系确定性关系 函数关系,例如商品销售额函数关系,例如商品销售额与销售量与销售量非确定性关系非确定性关系 相关关系,例如商品需求相关关系,例如商品需求量与价格量与价格第三页,讲稿共八十二页哦变量之间变量之间相关相关关系的示意图关系的示意图相关关系线性相关非线性相关正相关负相关第四页,讲稿共八十二页哦二、相关系数及其计算二、相关系数及其计算变量之间线性相关关系的密切程度的度量两个变量之间线性相关程度的度量,也称简单
2、相关系数根据总体全部数据计算而得的相关系数,称总体相关系数,记为根据样本数据计算而的得相关系数,称为样本相关系数,记为 r第五页,讲稿共八十二页哦样本相关系数样本相关系数(1)其中(2)(3)x 和 y 的样本相关系数为第六页,讲稿共八十二页哦相关系数的取值范围及意义相关系数的取值范围及意义r 的取值范围为1,1 ,称完全相关,既存在线性函数关系r 1,称完全正相关r 1,称完全负相关r 0,称零相关,既不存在相关关系 r 0,称负相关 r 0,称正相关愈大,表示相关关系愈密切第七页,讲稿共八十二页哦 例1 在研究我国人均消费水平的问题中,把人均消费金额记为 y;把人均国民收入记为 x。我们收
3、集到19811993 年 13 年的样本数据 。数据见表1。年份人均国民收入人均消费金额年份人均国民收入人均消费金额1981393.8024919881068.86431982419.1426719891169.26991983460.8628919901250.77131984544.1132919911429.58031985668.2940619921725.99471986737.7345119932099.511481987 859.97513表 1我国人均国民收入与人均消费金额数据第八页,讲稿共八十二页哦解:根据样本数据得得人均消费金额 y 与人均国民收入 x 的样本相关系数为第九
4、页,讲稿共八十二页哦相关系数的显著性检验相关系数的显著性检验检验两个变量之间是否存在线性关系检验步骤在 成立条件下,则对规定的显著性水平 ,若则拒绝 ,接受 。否则接受 。第十页,讲稿共八十二页哦例例 1 的相关系数检验的相关系数检验根据和 ,查表得由于因此,拒绝 ,认为 x 和 y 的相关系数 ,即人均消费金额 y 与人均国民收入 x 之间的相关关系显著。第十一页,讲稿共八十二页哦第二节第二节一元线性回归一元线性回归一元线性回归模型回归参数的最小二乘估计回归方程的显著性检验 预测第十二页,讲稿共八十二页哦回归分析与相关分析的区别回归分析与相关分析的区别相关分析中 x 和 y 都处于相同地位,
5、而回归分析中,y 称因变量,x 称自变量。相关分析中 x 和 y 都是随机变量,而在回归分析中,因变量 y 是随机变量,自变量 x 则可以是随机变量,也可以是非随机变量。相关分析主要是描述变量之间的相关关系,而回归分析主要是确定变量之间的内在联系。第十三页,讲稿共八十二页哦回归模型的类型示意图回归模型的类型示意图回归模型一元回归多元回归线性回归非线性回归线性回归非线性回归第十四页,讲稿共八十二页哦一、一、一元线性回归模型一元线性回归模型称为一元线性回归模型一元线性回归模型只含有一个自变量 x误差项为随机变量描述因变量 y 与自变量 x 和误差项的关系 和 称为模型的参数(10.4)第十五页,讲
6、稿共八十二页哦一元线性回归模型的基本假定一元线性回归模型的基本假定x 为确定性变量 误差项满足.(10.5)区间估计和假设检验时,还进一步假定 服从正态分布 即当 时,而 则是 x 变动一个单位时,的相应变化量第十六页,讲稿共八十二页哦样本回归方程样本回归方程和 是未知参数,可以根据样本数据作估计和 的估计记为 和 ,则称为样本回归方程 是样本回归方程的斜率,表示 x 每变动一个单位时,的相应变化量。而 则是样本回归方程的截距。即x0 时,设已取得样本量为 n 的随机样本 ,则(10.6)(10.11)第十七页,讲稿共八十二页哦二、二、参数参数0,1 的最小二乘估计的最小二乘估计最小二乘法是使
7、因变量的观察值 与估计值 之间的离差平方和达到最小来求 和 的估计 和 的方法,即使达到最小,称 和 为 和 的最小二乘估计。(10.12)第十八页,讲稿共八十二页哦根据微积分中求极值的原理,和 应满足下列方程组得正规方程组解正规方程组得(10.16)(10.17)第十九页,讲稿共八十二页哦例例根据例 10.1 的数据,建立人均消费金额 y 对人均国民收入的回归方程。已求得按(10.17)式,得从而样本回归方程为因此当人均国民收入增长 1 元时,则人均消费金额增长约 0.5 元。第二十页,讲稿共八十二页哦三、回归方程的显著性检验三、回归方程的显著性检验、F 检验检验平方和分解用 SST 表示因
8、变量的总离差平方和,反映 y 全部数据的离散程度,即并可分解成如下形式(10.21)(10.20)第二十一页,讲稿共八十二页哦续续而根据(10.16)式于是(10.22)其中称为残差平方和,是由随机因素和其他未加控制的因素引起的,反映除 x 以外的其他因素对 y 的影响大小。而称为回归平方和,是由 x 和 y 的线性关系引起的 y 的取值变化,反映 x 对 y 的影响大小。第二十二页,讲稿共八十二页哦计算平均平方计算平均平方三个平方和的自由度 SST 的自由度为 n1 SSR 的自由度为 1 SSE 的自由度为 n2关于自由度存在如下的关系式n1=(n2)+1第二十三页,讲稿共八十二页哦则 S
9、SE 的平均平方为 SSE/(n2)且(10.23)而 SSR 的平均平方为 SSR/1 且回归方程的显著性检验是用回归的平均平方与残差的平均平方作比较,判断因变量与自变量是否存在线性关系。续续(10.24)第二十四页,讲稿共八十二页哦方差分析表方差分析表一元线性回归方程的假设检验是当 为真时,则(10.26)前面的这些计算可以列成表格的形式,称为方差分析表。第二十五页,讲稿共八十二页哦方差来源平方和自由度均方F 统计量显著性水平回归SSR1SSR残差SSEn2SSE/(n-2)总和SSTn1方差分析表表表102第二十六页,讲稿共八十二页哦一元线性回归方程的显著性检验步骤一元线性回归方程的显著
10、性检验步骤 提出原假设计算检验统计量对规定的显著性水平,若则拒绝 ,认为,称回归方程显著。否则,接受 ,认为,称回归方程不显著。第二十七页,讲稿共八十二页哦例例对于例 10.1 的方差分析已知由于得SSR0.526381798122.644946495.8从而SSESSTSSR2453.3方差分析表见表 103第二十八页,讲稿共八十二页哦方差来源平方和自由度均方F 值回归946495.81946495.84244.4F0.05(1,11)=4.84残差2453.311223.0总和948949.112方差分析表表103从而拒绝 ,即回归方程显著。第二十九页,讲稿共八十二页哦、样本决定系数、样本
11、决定系数表示回归平方和占总离差平方和的比例(10.27)反映样本回归方程的拟合优度取值范围为 0,1 r2 愈大,说明回归方程拟合得愈好样本决定系数为样本相关系数 r 的平方第三十页,讲稿共八十二页哦例例例 10.1 的样本决定系数即回归平方和占总离差平方和的 99.74%第三十一页,讲稿共八十二页哦相关系数与回归系数之间的数量关系相关系数与回归系数之间的数量关系(10.28)这就是说 与 的正负号必定相同第三十二页,讲稿共八十二页哦四、四、预测及应用预测及应用根据自变量 x 的取值预测 y 的取值预测可分两种类型 点预测 区间预测第三十三页,讲稿共八十二页哦、点预测、点预测对于自变量 x 的
12、一个取值,根据样本回归方程用作为 的估计,称为点预测对于例 10.1,设,则(10.29)第三十四页,讲稿共八十二页哦、区间预测、区间预测对于自变量 x 的一个取值,根据样本回归方程给出 的一个估计区间,称为区间预测。在置信度时的预测区间为(10.30)对于例 10.1,根据方差分析表得其中第三十五页,讲稿共八十二页哦影响影响的因素的因素随的增大而增大随 n 的增大而减少随 的增大而增大第三十六页,讲稿共八十二页哦近似区间预测近似区间预测 当 n 较大,且时,则从而,由于,得则 0.95 的近似预测区间为第三十七页,讲稿共八十二页哦,由于,得则 0.99 的近似预测区间为续第三十八页,讲稿共八
13、十二页哦例例对于例 10.1,试求人均国民收入为 2300 时,人均消费金额的 0.95 预测区间。解:已知所以人均消费金额的 0.95 预测区间为(1223.51,1306.27)查表得从而第三十九页,讲稿共八十二页哦第三节第三节多元线性回归一、多元线性回归模型、多元线性回归模型的一般形式称为多元线性回归模型多元线性回归模型包含一个因变量与两个或两个以上自变量误差项为随机变量描述因变量 y 与自变量和误差项 的关系 为模型的参数,称偏回归系数(10.31)第四十页,讲稿共八十二页哦续续设已取得样本量为 n 的随机样本。则多元线性回归模型可以表示为(10.33)第四十一页,讲稿共八十二页哦多元
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 建模 讲座 相关 回归 分析 讲稿
限制150内