《《线性回归方程》课件1.ppt》由会员分享,可在线阅读,更多相关《《线性回归方程》课件1.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 有些教师常说:有些教师常说:“如果你的数学成绩好,那如果你的数学成绩好,那么你的物理学习就不会有什么大问题么你的物理学习就不会有什么大问题” 按照这种按照这种说法,似乎学生的物理成绩与数学成绩之间也存说法,似乎学生的物理成绩与数学成绩之间也存在着某种关系。你如何认识它们之间存在的关系?在着某种关系。你如何认识它们之间存在的关系?物理成绩物理成绩 数学成绩数学成绩 学习兴趣学习兴趣 学习时间学习时间 其他因素其他因素结论:变量之间除了函数关系外,还有结论:变量之间除了函数关系外,还有 。问题引入:问题引入: 函数关系函数关系-变量之间是一种确定变量之间是一种确定性的关系性的关系.如如:圆的面积
2、圆的面积S和半径和半径r之间之间的关系的关系. 相关关系相关关系变量之间有一定的联变量之间有一定的联系系,但不能完全的用函数来表达但不能完全的用函数来表达. 一般一般来说来说,身高越高身高越高,体重越重体重越重,但不能用一但不能用一个函数来严格地表示身高与体重之间个函数来严格地表示身高与体重之间的关系的关系.(非确定性关系非确定性关系)变量之间的关系变量之间的关系函数关系是一种确定的关系;函数关系是一种确定的关系;相关关系与函数关系的异同点:相关关系与函数关系的异同点:均是指两个变量的关系均是指两个变量的关系问题:问题:举一两个现实生活中的问题,问题所涉及的举一两个现实生活中的问题,问题所涉及
3、的变量之间存在一定的相关关系。变量之间存在一定的相关关系。(1 1)父母的身高与子女身高之间的关系)父母的身高与子女身高之间的关系(2 2)商品销售收入与广告支出经费之间的关系)商品销售收入与广告支出经费之间的关系(3 3)粮食产量与施肥量之间的关系)粮食产量与施肥量之间的关系 例例:相关关系是一种非确定关系相关关系是一种非确定关系. .相同点:相同点:不同点:不同点:问题:问题: 某小卖部为了了解热茶销售量与气温某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某之间的关系,随机统计并制作了某6天天卖出热茶的杯数与当天气温的对照表:卖出热茶的杯数与当天气温的对照表:气温气温/0C2
4、61813104 -1杯数杯数202434385064如果某天的气温是如果某天的气温是-50C,你能根据这些,你能根据这些数据预测这天小卖部卖出热茶的杯数吗数据预测这天小卖部卖出热茶的杯数吗? 为了了解热茶销量与为了了解热茶销量与气温的大致关系气温的大致关系, ,我们我们以横坐标以横坐标x x表示气温,表示气温,纵坐标纵坐标y y表示热茶销量,表示热茶销量,建立直角坐标系建立直角坐标系. .将表将表中数据构成的中数据构成的6 6个数对个数对表示的点在坐标系内表示的点在坐标系内标出,得到下图。今标出,得到下图。今后我们称这样的图为后我们称这样的图为散点图散点图(scatterplot).(sca
5、tterplot). 选择怎样的直线近似地表示热茶销量与气选择怎样的直线近似地表示热茶销量与气温之间的关系温之间的关系? ? 我们有多种思考方案我们有多种思考方案: :( (1) )选择能反映直线变化的两个点选择能反映直线变化的两个点, ,例如取例如取(4,50),(18,24)(2)取一条直线)取一条直线,使得位于该直线一侧和使得位于该直线一侧和另一侧的点的个数基本相同;另一侧的点的个数基本相同;(3)多取几组点)多取几组点,确定几条直线方程确定几条直线方程,再分再分别算出各条直线斜率、截距的平均值别算出各条直线斜率、截距的平均值,作为作为所求直线的斜率、截距;所求直线的斜率、截距; 怎样的
6、直线最好呢怎样的直线最好呢?这两点的直线;这两点的直线;建构数学建构数学 ybxa ybxa1.最小二乘法:最小二乘法: 用方程为用方程为的点,应使得该直线与散点图中的点最接近的点,应使得该直线与散点图中的点最接近那么,怎样衡量直线那么,怎样衡量直线 与图中六与图中六个点的接近程度呢?个点的接近程度呢? 的直线拟合散点图中的直线拟合散点图中 yx26,18,13,10,4,babababababa 我们将表中给出的自变量我们将表中给出的自变量代入直线方程代入直线方程, ,得到相应的六个值:得到相应的六个值:的的六个六个值值 它们与表中相应的实际值应该越接近越好它们与表中相应的实际值应该越接近越
7、好. 22222222( , )(2620)(1824)(1334)(1038)(450)(64)12866140382046010172Q a bb ab ab ab ab ab abaabba 所以所以, ,我们用类似于估计平均数时的我们用类似于估计平均数时的思想思想, ,考虑离差的平方和考虑离差的平方和 ybxa, a b( , )Q a b与图中六个点的接近与图中六个点的接近程度程度,所以所以,设法设法取取 达到最小值达到最小值.的值的值,使使这种方法叫做这种方法叫做最小平方法最小平方法(又称又称最小最小二乘法二乘法) . ( , )Q a b ybxa是直线是直线在垂直方向在垂直方向
8、(纵轴方向纵轴方向)上的距离的平上的距离的平方和方和,可以用来衡量可以用来衡量直线直线与各散点与各散点222222( , )128661403820460101721286(1403820)64601017214038201286(.)12867019101286().1286701910( )1286Q a bbaabbababaaabbababf b把a看作常数,那么Q是关于b的二次函数记为f(b)f(b)当时,取最小值2222( ) 6(140460)12863820101721404606(.)6702306().670230( )6f aababbbaababaf a把b看作常数,那
9、么Q是关于a的二次函数记为f(a)当时,取最小值070191012867023061.6477,57.55681.647757.5568566566abQbabayxxyC 当时,(a,b)取最小值解得所求直线方程为当时,故当气温为时,热茶销量约为杯。线性相关关系线性相关关系: 像这样能用直线方程像这样能用直线方程 ybxa近似表示的相关关系叫做近似表示的相关关系叫做线性相关关系线性相关关系. 如果散点图中的点分布从整体如果散点图中的点分布从整体上看大致在一条直线附近我们就称上看大致在一条直线附近我们就称这两个变量之间具有这两个变量之间具有线性相关线性相关关系关系 x1x2x3xnxy1y2y
10、3yny线性回归方程:线性回归方程:一般地一般地,设有设有n个观察数据如下:个观察数据如下:2221122()().()nnQybxaybxaybxa ybxa当当a,b使使取得最小值时取得最小值时,就称就称这这n对数据的对数据的线性回归方程线性回归方程,该方程所表该方程所表示的直线称为示的直线称为回归直线回归直线.为拟合为拟合2221122222211111()().()222nnnnnnniiiiiiiiiiiQybxaybxaybxaybx yaybxabxna 类似地,我们可以推得,求回归类似地,我们可以推得,求回归方程方程 中系数中系数a,b的一般公式的一般公式: ybxa11222
11、11()(),()nni iiiiinniiiixynxyxx yybxnxxxa y bx 以上公式的推导较复杂,故不作推导,但它以上公式的推导较复杂,故不作推导,但它的原理较为简单:即各点到该直线的距离的平的原理较为简单:即各点到该直线的距离的平方和最小,这一方法叫方和最小,这一方法叫最小二乘法最小二乘法。求解线性回归问题的步骤求解线性回归问题的步骤:1.列表列表( ),画散点图,画散点图.2.计算计算:3.代入公式求代入公式求a,b4.列出直线方程列出直线方程iiiiyxyx,211, ,nniiiiix yxx y例题例题1:下表为某地近几年机动车辆数与交通:下表为某地近几年机动车辆数
12、与交通事故数的统计资料,请判断机动车辆数与交事故数的统计资料,请判断机动车辆数与交通事故数之间是否具有线性相关关系,求出通事故数之间是否具有线性相关关系,求出线性回归方程线性回归方程;如果不具有线性相关关系如果不具有线性相关关系,说明说明理由理由解:在直角坐标系中画出数据的散点图,解:在直角坐标系中画出数据的散点图,直观判断散点在一条直线附近,故具有直观判断散点在一条直线附近,故具有线性相关关系线性相关关系88118821181822211031,128.875,71.6,8.95,137835,9611.79611.78 128.875 8.951378358 128.8758.95128.
13、875iiiiiiiiiiiiiixxyyxx yx ynxybxnxaybx 将它们代入*式:0.07740.0774-1.0241所以,所求线性回归方程为 y0.0774x-1.0241回归分析的基本步骤回归分析的基本步骤:画散点图画散点图求回归方程求回归方程预报、决策预报、决策问题:有时散点图的各点并不集中在一条直线的附近,仍然可以按照求回归直线方程的步骤求回归直线,显然这样的回归直线没有实际意义。在怎样的情况下求得的回归直线方程才有实际意义?即建立的线性回归模型是否合理?如何对一组数据之间的线性相关程度作出定量分析?相关系数相关系数 1.1.计算公式计算公式 2 2相关系数的性质相关系
14、数的性质 (1)|r|1(1)|r|1 (2)|r|(2)|r|越接近于越接近于1 1,相关程度越强;,相关程度越强;|r|r|越接越接近于近于0 0,相关程度越弱,相关程度越弱n niiiii=1i=1nnnn2222iiiii=1i=1i=1i=1(x - x)(y - y)(x - x)(y - y)r =r =(x - x)(y - y)(x - x)(y - y)2 2_ _n n1 1i i2 2i i2 2_ _n n1 1i i2 2i in n1 1i i_ _ _i ii iy yn ny yx xn nx xy yx xn ny yx x超级链接超级链接散点图只是形象地描
15、述点的分布情况,要想把握其特征,散点图只是形象地描述点的分布情况,要想把握其特征,必须进行定量的研究必须进行定量的研究相关关系与函数关系有怎样的不同?函数关系中的两个变量间是一种确定性关系相关关系是一种非确定性关系 函数关系是一种理想的关系模型 相关关系在现实生活中大量存在,是更一般的情况小结:小结:1.1.变量之间的两种关系:变量之间的两种关系:确定性关系与确定性关系与相关关系相关关系2。对于线性相关的两个变量用什么方法来刻。对于线性相关的两个变量用什么方法来刻画之间的关系呢?画之间的关系呢?最小二乘法最小二乘法最小二乘法估计线性回归方程:最小二乘法估计线性回归方程: ybxa1122211()(),()nniiiiiinniiiix ynxyxxyybxnxxxaybx数学统计 画散点图画散点图 了解最小二乘法的思想了解最小二乘法的思想 求回归直线方程求回归直线方程1. 用回归直线方程解决应用问题用回归直线方程解决应用问题结束结束
限制150内