2020高中数学第三章统计案例.1回归分析的基本思想及其初步应用讲义.pdf
《2020高中数学第三章统计案例.1回归分析的基本思想及其初步应用讲义.pdf》由会员分享,可在线阅读,更多相关《2020高中数学第三章统计案例.1回归分析的基本思想及其初步应用讲义.pdf(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学必求其心得,业必贵于专精 -1-3.1 回归分析的基本思想及其初步应用 知识点 线性回归模型(1)函数关系是一种错误!确定性关系,而相关关系是一种错误!非确定性关系(2)回归分析是对具有,03相关关系的两个变量进行统计分析的一种常用方法(3)对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),回归直线错误!错误!x错误!的斜率和截距的最小二乘估计公式分别为错误!错误!错误!错误!,错误!错误!错误!错误!错误!,其中错误!(错误!,错误!)称为样本点的中心(4)线性回归模型ybxae,其中a和b是模型的未知参数,e称为错误!随机误差,自变量x称为错误!解释变量,因变
2、量y称为错误!预报变量 知识点 线性回归分析 1残差平方和法(1)错误!i错误!错误!(i1,2,n)称为相应于点(xi,yi)学必求其心得,业必贵于专精 -2-的错误!残差(2)残差平方和错误!错误!(yi错误!i)2越小,模型拟合效果越好 2残差图法 残差点错误!比较均匀地落在水平的带状区域内,说明选用的模型比较合适,其中这样的带状区域宽度错误!越窄,说明模型的精确度越高 3利用相关指数R2刻画回归效果 其计算公式为:R21错误!错误!。其几何意义:错误!R2越接近于 1,表示回归效果越好 1建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出解释
3、变量和预报变量的散点图,观察它们之间的关系(如是否存在线性相关关系等)(3)由经验确定回归方程的类型(如观察到数据呈线性相关关系,则选用线性回归方程错误!错误!x错误!)(4)按一定规则估计回归方程中的参数(如最小二乘法)学必求其心得,业必贵于专精 -3-(5)得出结果后分析残差图是否有异常,若存在异常,则检查数据是否有误或模型是否合适等 2线性回归模型中随机误差的主要来源(1)用线性回归模型作为真实模型的近似所引起的误差可能存在非线性的函数能够更好地描述y与x之间的关系,但是现在却用线性函数来表述这种关系,结果会产生误差(2)忽略了某些因素的影响影响变量y的因素不仅有变量x,可能还包括其他许
4、多因素,例如,在描述身高和体重关系的模型中,体重不仅受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响(3)观测误差由于测量工具等原因,导致y的观测值产生误差 3残差分析的结果(1)残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高(2)若是有个别样本点的残差比较大,需要确认在采集这些样本点的过程中是否有人为的错误如果数据采集有错误,就予以纠正,然后再重新利用线性回归模型拟合数据;如果数据采集没有错学必求其心得,业必贵于专精 -4-误,则需要寻找其他的原因 4对R2的理解(1)预报变量的变化与解释变
5、量和随机误差的关系 预报变量的变化程度可以分解为解释变量引起的变化程度与残差变量的变化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R2的值决定的在线性回归模型中,R2表示解释变量对预报变量变化的贡献率R2越接近于 1,表示解释变量和预报变量的线性相关性越强;反之,R2越小,说明随机误差对预报变量的效应越大(2)R2与r的关系 相关系数可较好地反映变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果;R2是相关系数的平方,其变化范围为0,1,而相关系数的变化范围为1,1;当相关系数|r|接近于 1 时说明两变量的相关性较强,当r接近于 0 时说明两
6、变量的相关性较弱,而当R2接近于 1 时,说明线性回归方程的拟合效果较好 学必求其心得,业必贵于专精 -5-1判一判(正确的打“”,错误的打“”)(1)残差平方和越小,线性回归方程的拟合效果越好()(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上()(3)R2越接近于 1,线性回归方程的拟合效果越好()答案(1)(2)(3)2做一做(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为_(2)在残差分析中,残差图的纵坐标为 _(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于_,解释变量和预报变量之间的相关系数等于_ 答案(1)正相关(
7、2)残差(3)0 1 或1 解析(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为学必求其心得,业必贵于专精 -6-残差图(3)设样本点为(xi,yi),i1,2,3,n,回归直线为错误!错误!x错误!;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程 所以有yiy i;残差平方和错误!(yi错误!i)20;解释变量和预报变量之间的相关系数R满足R21错误!1,所以R1.探究错误!求线性回归方程 例1 某研究机构对高三学生的
8、记忆力x和判断力y进行统计分析,得下表数据 x 6 8 10 12 y 2 3 5 6(1)请画出上表数据的散点图;(要求:点要描粗)(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y,错误!x错误!;(3)试根据求出的线性回归方程,预测记忆力为9 的同学的判断力(相关公式:b,错误!,错误!错误!错误!错误!)学必求其心得,业必贵于专精 -7-解(1)如图:(2)错误!xiyi6283105126158,错误!错误!9,错误!错误!4,错误!x错误!6282102122344,错误!错误!错误!0.7,错误!错误!错误!错误!40。792.3,故线性回归方程为错误!0.7x
9、2.3。(3)由(2)中线性回归方程当x9 时,错误!0.792.34,预测记忆力为 9 的同学的判断力约为4。拓展提升 求线性回归方程的步骤(1)列出散点图从直观上分析数据间是否存在线性相关关系 学必求其心得,业必贵于专精 -8-(2)计算错误!,错误!,错误!x错误!,错误!y错误!,错误!xiyi.(3)代入公式求出错误!错误!x错误!中参数错误!,错误!的值(4)写出回归方程并对实际问题作出估计 错误!某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2 3 4 5 加工的时间y(小时)2。5 3 4 4。5(1)在给定的坐标系中
10、画出表中数据的散点图;(2)求出y关于x的线性回归方程,错误!错误!x错误!,并在坐标系中画出回归直线;(3)试预测加工 10 个零件需要多少时间?注:错误!错误!,错误!错误!错误!错误!.学必求其心得,业必贵于专精 -9-解(1)散点图如图 (2)由表中数据得i14xiyi52。5,错误!3.5,错误!3.5,错误!错误!54,所以b 错误!0。7。所以错误!错误!错误!错误!1。05.所以错误!0。7x1。05。回归直线如图中所示(3)将x10 代入回归直线方程,得错误!0.7101。058.05(小时),所以预测加工 10 个零件大约需要 8。05 小时 探究错误!线性回归分析 例 2
11、 已知某种商品的价格x(元)与需求量y(件)之间的关系学必求其心得,业必贵于专精 -10-有如下一组数据:x 14 16 18 20 22 y 12 10 7 5 3 求y对x的回归直线方程,并说明回归模型拟合效果的好坏 解 错误!错误!(1416182022)18,错误!错误!(1210753)7.4,错误!x错误!1421621822022221660,错误!xiyi14121610187205223620,所以,错误!错误!错误!1.15,错误!错误!错误!错误!7.41.151828.1,所以所求回归直线方程是错误!1.15x28.1。列出残差表:yi错误!i 0 0。3 0。4 0。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2020 高中数学 第三 统计 案例 回归 分析 基本 思想 及其 初步 应用 讲义
限制150内