高中数学统计案例回归分析苏教.pptx
栏目索引 CONTENTS PAGE 1 预习导学 挑战自我,点点落实2 课堂讲义 重点难点,个个击破3 当堂检测 当堂训练,体验成功第1页/共57页 知识链接 1.什么叫回归分析?答回归分析是对具有相关关系的两个变量进行统计分析的一种方法.第2页/共57页2.回归分析中,利用线性回归方程求出的函数值一定是真实值吗?答不一定是真实值,利用线性回归方程求的值,在很多时候是个预报值,例如,人的体重与身高存在一定的线性关系,但体重除了受身高的影响外,还受其他因素的影响,如饮食,是否喜欢运动等.第3页/共57页 预习导引 1.线性回归方程第4页/共57页(2)将yabx称为线性回归模型,其中abx是确定性函数,称为 .随机误差第5页/共57页2.相关系数r的性质(1)|r|;(2)|r|越接近于1,x,y的线性相关程度越;(3)|r|越接近于0,x,y的线性相关程度越.强弱1第6页/共57页3.显著性检验(1)提出统计假设H0:变量x,y ;(2)如果以95%的把握作出判断,可以根据10.950.05与 n2在附录2中查出一个r的(其中10.950.05称为);不具有线性相关关系临界值r0.05检验水平第7页/共57页相关系数第8页/共57页第9页/共57页(4)作出统计推断:若,则否定H0,表明有 的把握认为x与y之间具有;若 ,则没有理由拒绝原来的假设H0,即就目前数据而言,没有充分理由认为x与y之间有.|r|r0.0595%|r|r0.05线性相关关系线性相关关系第10页/共57页 课堂讲义 重点难点,个个击破要点一线性相关的判断例1某校高三(1)班的学生每周用于数学学习的时间x(单位:h)与数学平均成绩y(单位:分)之间有表格所示的数据.x24152319161120161713y92799789644783687159第11页/共57页(1)画出散点图;第12页/共57页(2)作相关性检验;第13页/共57页第14页/共57页而n10时,r0.050.632,所以|r|r0.05,所以有95%的把握认为数学成绩与学习时间之间具有线性相关关系.第15页/共57页(3)若某同学每周用于数学学习的时间为18 h,试预测其数学成绩.第16页/共57页规律方法判断变量的相关性通常有两种方式:一是散点图;二是相关系数r.前者只能粗略的说明变量间具有相关性,而后者从定量的角度分析变量相关性的强弱.第17页/共57页跟踪演练1暑期社会实践中,小闲所在的小组调查了某地家庭人口数x与每天对生活必需品的消费y的情况,得到的数据如下表:x/人24568y/元2030505070第18页/共57页(1)利用相关系数r判断y与x是否线性相关;解由表中数据,利用科学计算器计算得:第19页/共57页因为rr0.050.878,所以y与x之间具有线性相关关系.第20页/共57页(2)根据上表提供的数据,求出y关于x的线性回归方程.解 根据以上数据可得,第21页/共57页第22页/共57页要点二求线性回归方程例2某班5名学生的数学和物理成绩如下表:学生编号12345学科编号ABCDE数学成绩(x)8876736663物理成绩(y)7865716461第23页/共57页(1)画出散点图;解散点图如图.第24页/共57页(2)求物理成绩y对数学成绩x的线性回归方程;第25页/共57页第26页/共57页第27页/共57页(3)一名学生的数学成绩是96,试预测他的物理成绩.即可以预测他的物理成绩是82.第28页/共57页规律方法(1)散点图是定义在具有相关关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析.(2)求线性回归方程,首先应注意到,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.第29页/共57页跟踪演练2某研究机构对高三学生的记忆力x和判断力y进行统计分析,得下表数据:x681012y2356第30页/共57页请画出上表数据的散点图(要求:点要描粗);解如图:第31页/共57页第32页/共57页第33页/共57页试根据求出的线性回归方程,预测记忆力为9的同学的判断力.第34页/共57页要点三非线性回归分析例3某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510y10.155.524.082.852.11x203050100200y1.621.411.301.211.15第35页/共57页检验每册书的成本费y与印刷册数的倒数 之间是否具有线性相关关系;如有,求出y对x的回归方程.解令u ,原题中所给数据变成如下表示的数据:u10.50.330.20.1y10.155.524.082.852.11u0.050.030.020.010.005y1.621.411.301.211.15第36页/共57页第37页/共57页查表得r0.050.632,因为rr0.05,从而认为u与y之间具有线性相关关系.第38页/共57页规律方法对非线性回归问题,若给出经验公式,采用变量代换把问题转化为线性回归问题.若没有经验公式,需结合散点图挑选拟合得最好的函数.第39页/共57页跟踪演练3在试验中得到变量y与x的数据如下表:试求y与x之间的回归方程,并预测x40时,y的值.x1923273135y41124109325第40页/共57页解作散点图如图所示,从散点图可以看出,两个变量x,y不呈线性相关关系,根据学过的函数知识,样本点分布的曲线符合指数型函数 ,通过对数变化把指数关系变为线性关系,令zln y,则zbxa(aln c1,bc2).第41页/共57页列表:x1923273135z1.3862.3983.1784.6915.784第42页/共57页作散点图如图所示,第43页/共57页从散点图可以看出,两个变量x,z呈很强的线性相关关系.由表中的数据得到线性回归方程为 0.277x3.998.所以y关于x的指数回归方程为:e0.277x3.998.所以,当x40时,ye0.277403.9981 190.347.第44页/共57页栏目索引 CONTENTS PAGE 1.在下列各量之间,存在相关关系的是_.正方体的体积与棱长之间的关系;一块农田的水稻产量与施肥量之间的关系;人的身高与年龄之间的关系;家庭的支出与收入之间的关系;某户家庭用电量与电价之间的关系.1 2 3 4第45页/共57页2.如图是x和y的一组样本数据的散点图,去掉一组数据_后,剩下的4组数据的相关指数最大.解析经计算,去掉D(3,10)这一组数据后,其他4组数据对应的点都集中在某一条直线附近,即两变量的线性相关性最强,此时相关指数最大.1 2 3 4D(3,10)第46页/共57页3.对具有线性相关关系的变量x和y,由测得的一组数据已求得回归直线的斜率为6.5,且恒过(2,3)点,则这条回归直线的方程为_.1 2 3 4第47页/共57页答案106.5x1 2 3 4第48页/共57页4.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:1 2 3 4推销员编号12345工作年限x/年35679推销金额y/万元23345第49页/共57页(1)求年推销金额 y关于工作年限x的线性回归方程;1 2 3 4第50页/共57页所以年推销金额y关于工作年限x的线性回归方程为 0.5x0.4.1 2 3 4第51页/共57页(2)若第6名推销员的工作年限为11年,试估计他的年推销金额.解 当x11时,0.5x0.40.5110.45.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元.1 2 3 4第52页/共57页课堂小结1.相关系数rr的大小与两个变量之间线性相关程度的强弱关系:(1)当r0时,表明两个变量正相关;当r0时,表明两个变量负相关.当r1时,两个变量完全正相关;当r1时,两个变量完全负相关.第53页/共57页(2)|r|1,并且|r|越接近1,表明两个变量的线性相关程度越强,它们的散点图越接近于一条直线,这时用线性回归模型拟合这组数据的效果就越好;|r|越接近0,表明两个变量的线性相关程度越弱,通常当|r|r0.05时,认为两个变量有很强的线性相关程度.此时建立的回归模型是有意义的.第54页/共57页2.回归分析用回归分析可以预测具有相关关系的两个随机变量的取值.但要注意:回归方程只适用于我们所研究的样本的总体.我们建立的回归方程一般都有时间性.第55页/共57页样本取值的范围影响了回归方程的适用范围.回归方程得到预报值不是变量的精确值,是变量可能取值的平均值.第56页/共57页感谢您的欣赏第57页/共57页