线性回归方程课件课件精选课件.ppt
关于线性回归方程课件第一页,本课件共有29页 有些教师常说:有些教师常说:“如果你的数学成绩好,那么你如果你的数学成绩好,那么你的物理学习就不会有什么大问题的物理学习就不会有什么大问题”按照这种说法,按照这种说法,似乎学生的物理成绩与数学成绩之间也存在着某种似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入:第二页,本课件共有29页 函数关系函数关系-变量之间是一种确定变量之间是一种确定性的关系性的关系.如如:圆的面积圆的面积S和半径和半径r之间的之间的关系关系.相关关系相关关系变量之间有一定的联变量之间有一定的联系系,但不能完全的用函数来表达但不能完全的用函数来表达.一般一般来说来说,身高越高身高越高,体重越重体重越重,但不能用一个但不能用一个函数来严格地表示身高与体重之间的关函数来严格地表示身高与体重之间的关系系.(非确定性关系非确定性关系)变量之间的关系变量之间的关系第三页,本课件共有29页函数关系是一种确定的关系;函数关系是一种确定的关系;相关关系与函数关系的异同点:相关关系与函数关系的异同点:均是指两个变量的关系均是指两个变量的关系问题:问题:举一两个现实生活中的问题,问题所涉及的举一两个现实生活中的问题,问题所涉及的变量之间存在一定的相关关系。变量之间存在一定的相关关系。(1 1)父母的身高与子女身高之间的关系)父母的身高与子女身高之间的关系(2 2)商品销售收入与广告支出经费之间的关系)商品销售收入与广告支出经费之间的关系(3 3)粮食产量与施肥量之间的关系)粮食产量与施肥量之间的关系 例例:相关关系是一种非确定关系相关关系是一种非确定关系.相同点:相同点:不同点:不同点:第四页,本课件共有29页问题:问题:某小某小卖卖部部为为了了解了了解热热茶茶销销售量与气温售量与气温之之间间的关系,随机的关系,随机统计统计并制作了某并制作了某6天天卖卖出出热热茶的杯数与当天气温的茶的杯数与当天气温的对对照表:照表:气温气温/0C261813104 -1杯数杯数202434385064如果某天的气温是如果某天的气温是-50C,你能根据,你能根据这这些些数据数据预测这预测这天小天小卖卖部部卖卖出出热热茶的杯数茶的杯数吗吗?第五页,本课件共有29页 为为了了解了了解热热茶茶销销量与量与气温的大致关系气温的大致关系,我我们们以横坐以横坐标标x x表示气温,表示气温,纵纵坐坐标标y y表示表示热热茶茶销销量,量,建立直角坐建立直角坐标标系系.将表将表中数据构成的中数据构成的6 6个数个数对对表示的点在坐表示的点在坐标标系内系内标标出,得到下出,得到下图图。今。今后我后我们们称称这样这样的的图为图为散点散点图图(scatterplot).(scatterplot).第六页,本课件共有29页 选择选择怎怎样样的直的直线线近似地表示近似地表示热热茶茶销销量与气量与气温之温之间间的关系的关系?我我们们有多种思考方案有多种思考方案:(1)选择选择能反映直能反映直线变线变化的两个点化的两个点,例如取例如取(2)取一条直)取一条直线线,使得位于使得位于该该直直线线一一侧侧和和另一另一侧侧的点的个数基本相同;的点的个数基本相同;(3)多取几)多取几组组点点,确定几条直确定几条直线线方程方程,再分再分别别算出各条直算出各条直线线斜率、截距的平均斜率、截距的平均值值,作作为为所求直所求直线线的斜率、截距;的斜率、截距;怎怎样样的直的直线线最好呢最好呢?这两点的直线;这两点的直线;第七页,本课件共有29页建构数学建构数学 1.最小二乘法:最小二乘法:用方程用方程为为的点,的点,应应使得使得该该直直线线与散点与散点图图中的点最接近中的点最接近那么,怎那么,怎样样衡量直衡量直线线 与图中六与图中六个点的接近程度呢?个点的接近程度呢?的直线拟合散点图中的直线拟合散点图中我我们们将表中将表中给给出的自出的自变变量量代入直代入直线线方程方程,得到相得到相应应的六个的六个值值:的的六个六个值值 它它们们与表中相与表中相应应的的实际值应该实际值应该越接近越好越接近越好.第八页,本课件共有29页所以所以,我我们们用用类类似于估似于估计计平均数平均数时时的的思想思想,考考虑虑离差的平方和离差的平方和 第九页,本课件共有29页与与图图中六个点的接近中六个点的接近程度程度,所以所以,设法设法取取 达到最小值达到最小值.的的值值,使使这这种方法叫做种方法叫做最小平方法最小平方法(又称又称最小最小二乘法二乘法).是直是直线线在垂直方向在垂直方向(纵轴纵轴方向方向)上的距离的平上的距离的平方和方和,可以用来衡量可以用来衡量直线直线与各散点与各散点第十页,本课件共有29页第十一页,本课件共有29页第十二页,本课件共有29页第十三页,本课件共有29页线线性相关关系性相关关系:像像这样这样能用直能用直线线方程方程近似表示的相关关系叫做近似表示的相关关系叫做线线性相关关系性相关关系.如果散点图中的点分布从整体如果散点图中的点分布从整体上看大致在一条直线附近我们就称上看大致在一条直线附近我们就称这两个变量之间具有这两个变量之间具有线性相关线性相关关系关系 第十四页,本课件共有29页线线性回性回归归方程:方程:一般地一般地,设设有有n个个观观察数据如下:察数据如下:当当a,b使使取得最小取得最小值时值时,就称就称这这n对对数据的数据的线线性回性回归归方程方程,该该方程所表方程所表示的直示的直线线称称为为回回归归直直线线.为拟合为拟合第十五页,本课件共有29页第十六页,本课件共有29页 类似地,我们可以推得,求回归方程类似地,我们可以推得,求回归方程 中系数中系数a,b的一般公式的一般公式:以上公式的推导较复杂,故不作推导,但它以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平方的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫和最小,这一方法叫最小二乘法最小二乘法。第十七页,本课件共有29页求解线性回归问题的步骤求解线性回归问题的步骤:1.列表列表(),画散点图,画散点图.2.计算计算:3.代入公式求代入公式求a,b4.列出直线方程列出直线方程第十八页,本课件共有29页例题例题1:下表为某地近几年机动车辆数与交通事故:下表为某地近几年机动车辆数与交通事故数的统计资料,请判断机动车辆数与交通事故数数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,求出线性回归方程之间是否具有线性相关关系,求出线性回归方程;如果不具有线性相关关系如果不具有线性相关关系,说明理由说明理由第十九页,本课件共有29页解:在直角坐标系中画出数据的散点图,直解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有线性相观判断散点在一条直线附近,故具有线性相关关系关关系第二十页,本课件共有29页第二十一页,本课件共有29页第二十二页,本课件共有29页回归分析的基本步骤回归分析的基本步骤:画散点图画散点图求回归方程求回归方程预报、决策预报、决策第二十三页,本课件共有29页问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?第二十四页,本课件共有29页相关系数相关系数 1.1.计算公式计算公式2 2相关系数的性质相关系数的性质(1)|r|1(1)|r|1(2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接越接近于近于0 0,相关程度越弱,相关程度越弱超级链接超级链接第二十五页,本课件共有29页散点图只是形象地描述点的分布情况,要想把握其特征,散点图只是形象地描述点的分布情况,要想把握其特征,必须进行定量的研究必须进行定量的研究第二十六页,本课件共有29页相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况小结:小结:1.1.变量之间的两种关系:变量之间的两种关系:确定性关系与确定性关系与相关关系相关关系第二十七页,本课件共有29页2。对于线性相关的两个变量用什么方法来刻。对于线性相关的两个变量用什么方法来刻画之间的关系呢?画之间的关系呢?最小二乘法最小二乘法最小二乘法估计线性回归方程:最小二乘法估计线性回归方程:第二十八页,本课件共有29页感感谢谢大大家家观观看看第二十九页,本课件共有29页