《回归分析的基本思想及其初步应用》.ppt
《《回归分析的基本思想及其初步应用》.ppt》由会员分享,可在线阅读,更多相关《《回归分析的基本思想及其初步应用》.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、必修必修3(3(第二章第二章 统计统计) )知识结构知识结构 收集数据收集数据 ( (随机抽样随机抽样) )整理、分析数据整理、分析数据估计、推断估计、推断简单随机抽简单随机抽样样分层抽样分层抽样系统抽样系统抽样用样本估计总体用样本估计总体变量间的相关关系变量间的相关关系 用样本用样本的频率的频率分布估分布估计总体计总体分布分布 用样本用样本数字特数字特征估计征估计总体数总体数字特征字特征线性回归分析线性回归分析1、两个变量的关系、两个变量的关系不相关不相关相关相关关系关系函数关系函数关系线性相关线性相关非线性相关非线性相关问题问题1:现实生活中两个变量间的关系有哪:现实生活中两个变量间的关系
2、有哪些呢?些呢?相关关系:相关关系:对于两个变量,当自变量取值一定对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量时,因变量的取值带有一定随机性的两个变量之间的关系。之间的关系。思考:相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况问题问题2:对于线性相关的两个变量用什么方法:对于线性相关的两个变量用什么方法来刻划之间的关系呢?来刻划之间的关系呢?2、最小二乘估计、最小二乘估计最小二乘估计下的线性回归方程:最小二乘估计下的线性回归方程:ybxa121
3、()()()niiiniixXyYbXX aYbX.,3.)analysisregression(.,行行预预报报并并用用回回归归直直线线方方程程进进直直线线方方程程求求回回归归点点图图其其步步骤骤为为画画散散进进行行了了研研究究的的方方法法系系的的变变量量利利用用回回归归分分析析性性相相关关关关我我们们对对两两个个具具有有线线中中数数学学在在方方法法析析的的一一种种常常用用分分系系的的两两个个变变量量进进行行统统计计是是对对具具有有相相关关关关析析回回归归分分定定性性关关系系而而相相关关关关系系是是一一种种非非确确性性关关系系函函数数关关系系是是一一种种确确定定我我们们知知道道.11,81所
4、示重数据如表其身高和体名女大学生从某大学中随机选取例5943616454505748kg/170155165175170157165165cm/87654321体体重重身身高高编编号号.cm172,的的女女大大学学生生的的体体重重并并预预报报一一名名身身高高为为归归方方程程身身高高预预报报她她的的体体重重的的回回求求根根据据一一名名女女大大学学生生的的: ) 11 . 1(.,图图作散点体重为因变量真实取身高为自变量因此选据身高预报体重由于问题中要求根解yx11 . 1图xy.,11 . 1画它们之间的关系刻性回归方程以用线因此可线性相关关系较好的重有比高和体身样本点呈条状分布中可以看出从图,
5、85.712,0.849.0.84985.712.abyx 根据线性回归方程中的系数公式 可以得到于是得到回归方程.kg316.60712.85172849.0y,cm172,预报其体重为由回归方程可以的女大学生对身高为所以11 . 1图xy:,y,x,y,x,y,xnn2211二乘估计公式分别为二乘估计公式分别为截距和斜率的最小截距和斜率的最小我们知道其回归方程的我们知道其回归方程的关系的数据关系的数据对于一组具有线性相关对于一组具有线性相关探究探究 1xbya 2,xxyyxxbn1i2in1iii111,.,nniiiixx yyx yn其中称为。样样本本点点的的中中心心.心心回回归归直
6、直线线过过样样本本点点的的中中0.849,1,0.849,.bxy是斜率的估计值说明身高 每增加个单位时体重 就增加个单位这表明体重与身高具有正的线性相关关系?,?kg316.60cm172其原因是什么其原因是什么不是不是如果如果吗吗是是女大学生的体重一定女大学生的体重一定的的身高身高探究探究.21 . 1.316.60316.60172,位置说明了这一点本点和回归直线的相互中的样图以认为她的体重接近于但一般可是大学生的体重不一定的女身高显然kgkgcm21 . 1图 ,:,1ybxae由于所有的样本点不共线 而只是散布在某一条直线的附近 所以身高和体重的关系可用下面的线性回归模型来表示.y,
7、x,yx,exy,称称为为预预报报变变量量把把称称为为解解释释变变量量因因此此我我们们把把的的变变化化只只能能解解释释部部分分即即共共同同确确定定素素和和随随机机因因的的值值由由在在回回归归模模型型中中与与函函数数关关系系不不同同,.,.:abeyybxae这里 和 为模型的未知参数 是 与之间的误差通常 为随机变量 称为这样线性回归模型的完整表达式为随机误差随机误差ybxae?e的的原原因因是是什什么么产产生生随随机机误误差差项项思思考考.,.,的产生差项误机随所有这些因素都会导致是一种近似的模型型往往只我们选用的线性模另外动、度量误差等食习惯、是否喜欢运例如饮许多其他因素的影响还受身高的影
8、响外一个人的体重值除了受实际上e,?ey探究在线性回归模型中 是用bx+a预报真实值 的随机误差 它是一个不可观测的量 那么应该怎样研究随机误差 如何衡量预报的精度 12 ,ybxa根据截距和斜率的估计公式和可以建立回归方程 1.,.yeyeyye因此 是中的 bx+a的估计值由于随机误差(bx+a)所以是 的估计量 1122,1,2, .nniiix yxyxyeybxa in对于样本点而言 相应它们的随机误差为,1,2, ,().iiiiiiiieyyybxa inex yresidual其估计值为称为相应于点的残差.,e ,e ,e ,.,n21这这方方面面的的分分析析工工作作称称为为在
9、在可可疑疑数数据据判判断断原原始始数数据据中中是是否否存存来来判判断断模模型型拟拟合合的的效效果果可可以以通通过过残残差差然然后后性性回回归归模模型型来来拟拟合合数数据据是是否否可可以以用用线线线线性性相相关关来来粗粗略略判判断断它它们们是是否否相相首首先先要要根根据据散散点点图图系系时时在在研研究究两两个个变变量量间间的的关关 残差分析残差分析.21相应的残差数据重的原始数据以及列出女大学生身高和体表 382.0883.2627.6137.1618.4419.2627.2373.6e 5943616454505748kg/170155165175170157165165cm/87654321
10、残残差差体体重重身身高高编编号号编号编号残差残差31 . 1图.31 .1.,.残差图坐标的样本编号为横是以图这样作出的图形为等或体重估计值高数据或身可选为样本编号横坐标纵坐标为残差作图时分析残差特性我们可以利用图形来残残差差图图编号编号残差残差31 . 1图.,.,;,.,61,31 .1越高回归方程的预报精确度拟合精度越高说明模型区域的宽度越窄均匀地落在水平的带状残差点比较另外则需要寻找其他的原因没有错误如果数据采集合数据归模型拟性回利用线然后再重新予以纠正就果数据采集有错误如是否有人为的错误点的过程中两个样本需要确认在采集这大个样本点的残差比较个样本点和第第出中可以看从图.yyy y1R
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析的基本思想及其初步应用 回归 分析 基本 思想 及其 初步 应用
限制150内