人教B版高中数学ppt课件选修12第一章统计案例1《回归分析》课时.ppt
3.13.1回归分析的基回归分析的基本思想及其初步应用本思想及其初步应用 1 1通通过过典典型型案案例例的的探探究究,进进一一步步了了解解回回归归分分析析的的基基本本思思想想、方法及其初步应用方法及其初步应用 2 2让让学学生生经经历历数数据据处处理理的的过过程程,培培养养他他们们对对数数据据的的直直观观感感觉觉,体体会会统统计计方方法法的的特特点点,认认识识统统计计方方法法的的应应用用,通通过过使使用用转转化化后后的的数数据据,求求相相关关指指数数,运运用用相相关关指指数数进进行行数数据据分分析析、处处理理的的方方法法 3 3从从实实际际问问题题中中发发现现已已有有知知识识的的不不足足,激激发发好好奇奇心心,求求知知欲欲,通通过过寻寻求求有有效效的的数数据据处处理理方方法法,开开拓拓学学生生的的思思路路,培培养养学学生生的的探探索索精精神神和和转转化化能能力力,通通过过案案例例的的分分析析使使学学生生了了解解回回归归分分析析在在实实际际生生活活中中的的应应用用,增增强强数数学学取取之之生生活活,用用于于生生活活的的意意识识,提提高高学习兴趣学习兴趣 本本节节课课通通过过例例题题线线性性相相关关关关系系知知识识,通通过过实实际际问问题题中中发发现现已已有有知知识识的的不不足足,引引导导学学生生寻寻找找解解决决非非线线性性回回归归问问题题思思想想与与方方法法,培培养养学学生生化化归归数数学学思思想想。通通过过知识的整理,通过例题讲解掌握解决非线性回归问题。知识的整理,通过例题讲解掌握解决非线性回归问题。本本节节内内容容学学生生内内容容不不易易掌掌握握,通通过过知知识识整整理理与与比比较较引引导导学学生生进进行行区区分分、理理解解。通通过过对对典典型型案案例例的的探探究究,练练习习进进行行巩巩固固解解决决非非线线性性回回归归基基本本思思想想方方法法及及初初步步应应用用建立回归模型的基本步骤建立回归模型的基本步骤(1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量(2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等)(3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程)(4)按一定规则(如最小二乘法)估计回归方程中的参数(5)得出结果后分析残差图是否有异常(如个别数据对应残差过大,或残差呈现不随机的规律性等)若存在异常,则检查数据是否有误,或模型是否合适等(6)(6)参数参数R R2 2与相关系数与相关系数r r提示提示:它们都是刻画两个变量之间的的相关关系的它们都是刻画两个变量之间的的相关关系的,区区别是别是R R2 2表示解释变量对预报变量变化的贡献率表示解释变量对预报变量变化的贡献率,其表其表达式为达式为R R2 2=1-;=1-;相关系数相关系数r r是检验两个变量相关性的强弱程度是检验两个变量相关性的强弱程度,其表达式为其表达式为 (7 7)相关系数)相关系数r r与与R R2 2(1)R(1)R2 2是是相相关关系系数数的的平平方方,其其变变化化范范围围为为0,1,0,1,而而相相关关系系数的变化范围为数的变化范围为-1,1.-1,1.(2)(2)相相关关系系数数可可较较好好地地反反映映变变量量的的相相关关性性及及正正相相关关或或负负相关相关,而而R R2 2反映了回归模型拟合数据的效果反映了回归模型拟合数据的效果.(3)(3)当当|r|r|接接近近于于1 1时时说说明明两两变变量量的的相相关关性性较较强强,当当|r|r|接接近近于于0 0时时说说明明两两变变量量的的相相关关性性较较弱弱,而而当当R R2 2接接近近于于1 1时时,说说明线性回归方程的拟合效果较好明线性回归方程的拟合效果较好.例:一只红铃虫产卵数例:一只红铃虫产卵数y和温度和温度x有关,现收集到的一有关,现收集到的一组数据如下表组数据如下表1-3表,试建立表,试建立y与与x之间的回归方程。之间的回归方程。画出确定好的解释变量画出确定好的解释变量和预报变量的散点图,和预报变量的散点图,观察它们之间的关系观察它们之间的关系(1)是否存在线性关系?(2)散点图具有哪种函数特征?(3)以指数函数模型为例,如何设模型函数?非线性关系非线性关系指数函数、二次函数、三次函数指数函数、二次函数、三次函数cc21设指数函数曲线其中和是待定参数。ecyxc12=我们可以通过对数变换把指数关系变为线性关系()这样就可以利用线性回归模型来建立z 与x回归模型,进而找到y与x的非线性回归方程。*则变换后样本点分布在直线的周围。令)cb,clna(abxz21=+=ylnz=现在问题变为如何估计待定参数和?cc21非非线性回性回归模型模型(6)ey0.272x-3.843(1)=另一方面另一方面,可以认为图可以认为图11-411-4中样本点集中在某二次曲线中样本点集中在某二次曲线因因此此可可以以对对温温度度变变量量做做变变换换,即即令令 然然后后建建立立y y与与t t之之间间的的线线性性回回归归方方程程,从从而而得得到到y y与与x x之之间间的的排排线线性性回回归方程。归方程。,2xt=的附近的附近,其中其中 和和 为待定参数为待定参数.43cc423cxcy+=表表1-51-5是是红红铃铃虫虫的的产产卵卵数数和和对对应应的的温温度度的的平平方方,图图1.1-61.1-6是相应的散点图是相应的散点图.()()()(),b,xgya,xfy21=和和对于给定的样本点,两个含有未知数的模型其中a和b都是未知参数,可以按如下的步骤来比较它们的拟合效果.ba 其中和分别是参数a、b的估计值(1)分别建立对应于两个模型的回归方程()(),b,xgy 2=()()a ,xfy 1=()()();y yQn1i22ii2=-=()Q1()()y yn1i21ii=-=与(2)分别计算两个回归方程的残差平方和()()()()()()()()()().b,xgy a ,xfy ,;b,xgy a ,xfy,QQ212121的好的效果不如反之的好的效果比则(3)若=非线性回归问题的处理方法(1)两个变量不呈线性关系,不能直接利用线性回归方程建立两个变量的关系,可以通过变换的方法转化为线性回归模型,如y=,我们可以通过对数变换把指数关系变为线性关系.令z=lny,则变换后样本点应该分布在直线z=bx+a(a=lnc1,b=c2)的周围.(2)非线性回归方程的求法根据原始数据(x,y)作出散点图;根据散点图,选择恰当的拟合函数;作恰当的变换,将其转化成线性函数,求线性回归方程;在的基础上通过相应的变换,即可得非线性回归方程.(3)非线性相关问题中常见的几种线性变换在实际问题中,常常要根据一批实验数据绘出曲线,当曲线类型不具备线性相关关系时,可以根据散点分布的形状与已知函数的图象进行比较,确定曲线的类型,再作变量替换,将曲线改为直线.下面是几种容易通过变量替换转化为直线的函数模型:y=a+,令令t=,则有有y=a+bt;y=axb,令,令z=ln y,t=ln x,m=ln a,则有有z=m+bt;y=aebx,令,令z=ln y,m=ln a,则有有z=m+bt;y=,令令z=ln y,t=,m=ln a,则有有z=m+bt;y=a+bln x,令,令t=ln x,则有有z=a+bt;y=bx2+a,令令t=x2,则有有y=bt+a.例例某种食品每公斤的生产成本y(元)与该食品生产的重量x(公斤)有关,经生产统计得到以下数据:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15通过以上数据判断该食品的成本y(元)与生产的重量x(公斤)的倒数1/x之间是否具有线性相关关系?若有,求出y关于1/x的回归直线方程,并借此估计一下生产该食品500公斤时每公斤的生产成本是多少?(精确到0.01)于是y与1x的回归方程为y8.973x1.125.当x500(公斤)时,y8.9735001.1251.14.即估计生产该食品500公斤时每公斤的生产成本是1.14元 X x2.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y关于x的线性回归方程为().A.y=x-1 B.y=x+1C.y=88+12x D.y=176父亲身高父亲身高x(cm)174176176176178儿子身高儿子身高y(cm)175175176177177答案:C解析:方法一:由线性回归直线方程过样本中心(176,176),排除A,B答案,结合选项可得C为正确答案.方法二:将表中的五组数值分别代入选项验证,可知y=88+12x最适合.xxxx 非非线性回性回归问题有有时并不并不给出出经验公式公式,这时我我们可以画可以画出已知数据的散点出已知数据的散点图,把它与学把它与学过的各种函数的各种函数(幂函数、指数函函数、指数函数、数、对数函数数函数)等等图象作比象作比较,挑挑选一种跟一种跟这些散点些散点拟合得最好合得最好的函数的函数,然后采用适当的然后采用适当的变量置量置换,把把问题化化为线性回性回归分析分析问题,使之得到解决使之得到解决.敬请指导敬请指导.结束谢谢观赏!