选修2-33.1回归分析的基本思想及其初步应用ppt课件.ppt
《选修2-33.1回归分析的基本思想及其初步应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《选修2-33.1回归分析的基本思想及其初步应用ppt课件.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2022-6-203.1回归分析的基回归分析的基本思想及其初步本思想及其初步应用(一)应用(一)高二数学高二数学 选修选修2-2022-6-20数学数学统计内容统计内容1. 画散点图画散点图2. 了解最小二乘法的思想了解最小二乘法的思想3. 求回归直线方程求回归直线方程 ybxa4. 用回归直线方程解决应用问题用回归直线方程解决应用问题2022-6-20问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否之间是否 有一个确定性的关系?有一个确
2、定性的关系?复习复习 变量之间的两种关系变量之间的两种关系 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。2022-6-20 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规之间大致有何规律?律?2022-6-2010 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些点附近可画直线不止一条,哪条直:在这些点附近
3、可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?xy散点图散点图施化肥量施化肥量水稻产量水稻产量施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 4552022-6-20称为样本点称为样本点的中心,线性回归直线一定过的中心,线性回归直线一定过样本中心。样本中心。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxybxxxnxaybxy1、所求、所求直线方程直线方程 叫做叫做回归
4、直线方程回归直线方程; 相应的直线叫做相应的直线叫做回归直线回归直线。ybxa1111,.nniiiixxyynn其 中( ,)x y2022-6-20求求回归直线方程的步骤:回归直线方程的步骤:1111(1),nniiiixxyynn求211(2),.nniiiiixx y求(3)代入公式)代入公式1122211()(),(),nniiiiiinniiiixx yyx ynxybxxxnxay bx(4)写出直线)写出直线方程为方程为 ,即为所求的回归直线方程。即为所求的回归直线方程。ybxa2022-6-20例例1 1、观察两相关量得如下数据、观察两相关量得如下数据: :x-1-2-3-4
5、-553421y-9-7-5-3-115379求两变量间的回归方程求两变量间的回归方程. .解:解:列表:列表:i12345678910 xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi9141512551512149101010221110,0,110,3010.3,1iiiiiiixyyyxx2022-6-201 011 02211 01 1 01 0011 1 01 001 0iiiiixybyxxx000aybxb .yx所求回归直线方程为所求回归直线方程为2022-6-20例题例题 从某大学中随机选出从某大学中随机选出8 8名女大学生,其身名女大学生,其身
6、高和体重数据如下表:高和体重数据如下表:编号12345678身高165165157170175165155170体重4857505464614359 求根据一名女大学生的身高预报她的体重的回求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为归方程,并预报一名身高为172172的女大学生的的女大学生的体重。体重。2022-6-20172.85849.0 xy分析:由于问题中分析:由于问题中要求根据身高预报要求根据身高预报体重,因此选取身体重,因此选取身高为自变量,体重高为自变量,体重为因变量为因变量学学身身 高高 1 17 72 2c cm m女女 大大生生 体体 重重y y =
7、= 0 0. .8 84 49 91 17 72 2 - - 8 85 5. .7 71 12 2 = = 6 60 0. .3 31 16 6( (k kg g) )2.2.回归方程:回归方程:1. 散点图;散点图;2022-6-20 探究:身高为探究:身高为172cm的女大学生的体重一定是的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?吗?如果不是,你能解析一下原因吗? 答:身高为答:身高为172cm的女大学生的体重不一定的女大学生的体重不一定是是60.316kg,但一般可以认为她的体重接近于,但一般可以认为她的体重接近于60.316kg。2022-6-20例例1
8、从某大学中随机选取从某大学中随机选取8名女大学生,其身高和体重数据如表名女大学生,其身高和体重数据如表1-1所示。所示。编号12345678身高/cm165 165 157 170 175 165 155 170体重/kg4857505464614359求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。的女大学生的体重。案例案例1:女大学生的身高与体重:女大学生的身高与体重解:解:1、选取身高为自变量、选取身高为自变量x,体重为因变量,体重为因变量y,作散点图:,作散点图:2、由散点图知道
9、身高和体重有比较、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。回归方程刻画它们之间的关系。3、从散点图还看到,样本点散布在某、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线一条直线的附近,而不是在一条直线上,所以不能用一次函数上,所以不能用一次函数y=bx+a描述描述它们关系。它们关系。2022-6-在线性回归模型在线性回归模型(4)中,随机误差中,随机误差e的方差的方差 越小。越小。2s由于样本点不在同一条直线上,只是散布在某一条直线附近,由于样本点不在同一条直线上,只是散布在某一条直线附近,所以身高
10、与体重的关系可用所以身高与体重的关系可用线性回归模型线性回归模型:y=bx+a+e, (3) 来表示,其中来表示,其中a和和b为模型的未知参数,为模型的未知参数,e是是y与与bx+a之间的误差之间的误差.通常通常e为随机变量,称为随机误差为随机变量,称为随机误差(random error),即即e称为随机称为随机误差误差.它的均值它的均值E(e)=0,方差方差D(e)=2.这样线性回归模型的完整表这样线性回归模型的完整表达式为:达式为:2022-6-20思考思考:产生随机误差项产生随机误差项e的原因是什么?的原因是什么?随机误差随机误差e e的来源的来源( (可以推广到一般):可以推广到一般)
11、:1、忽略了其它因素的影响:影响身高、忽略了其它因素的影响:影响身高 y 的因素不只的因素不只是体重是体重 x,可能还包括遗传基因、饮食习惯、生,可能还包括遗传基因、饮食习惯、生长环境等因素;长环境等因素;2、用线性回归模型近似真实模型所引起的误差;、用线性回归模型近似真实模型所引起的误差;3、身高、身高 y 的观测误差。的观测误差。 以上三项误差越小,说明我们的回归模型的拟合以上三项误差越小,说明我们的回归模型的拟合效果越好。效果越好。2022-6-20探究探究3:在线性回归模型中,:在线性回归模型中,e是用是用bx+a预报真实值预报真实值y的随机的随机误差,它是一个误差,它是一个不可观测的
12、量,不可观测的量,那么怎样研究随机误差呢?那么怎样研究随机误差呢?是真实值是真实值与估计值与估计值的差!的差!2022-6-20思考:如何发现数据中的错误?如何衡量模型的拟合效果?思考:如何发现数据中的错误?如何衡量模型的拟合效果?0.84985.712,iiyx,iiieyy3335047.5812.419eyy如2022-6-20382.0883.2627.6137.1618.4419.2627.2373.6e 5943616454505748kg/170155165175170157165165cm/87654321残残差差体体重重身身高高编编号号残残差差图图2022-6-20编编号号残
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选修 3.1 回归 分析 基本 思想 及其 初步 应用 ppt 课件
限制150内