回归分析的基本思想及其初步应用》课件10人教A版选修.ppt
-
资源ID:91093932
资源大小:1.42MB
全文页数:26页
- 资源格式: PPT
下载积分:18金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
回归分析的基本思想及其初步应用》课件10人教A版选修.ppt
问题1:正方形的面积y与正方形的边长x之间 的函数关系是y=x2确定性关系问题2:某水田水稻产量y与施肥量x之间是否-有一个确定性的关系?例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得到如下所示的一组数据:施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455复习、变量之间的两种关系自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。1、定义:1):相关关系是一种不确定性关系;注对具有相关关系的两个变量进行统计分析的方法叫回归分析。2):2、现实生活中存在着大量的相关关系。如:人的身高与年龄;产品的成本与生产数量;商品的销售额与广告费;家庭的支出与收入。等等探索:水稻产量y与施肥量x之间大致有何规律?10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?xy施化肥量水稻产量施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455散点图10 20 30 40 50500450400350300 xy施化肥量水稻产量最小二乘法:称为样本点的中心。3、对两个变量进行的线性分析叫做线性回归分析。2、回归直线方程:2.相应的直线叫做回归直线。1、所求直线方程 叫做回归直-线方程;其中相关系数 1.计算公式 2相关系数的性质(1)|r|1(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小 问题:达到怎样程度,x、y线性相关呢?它们的相关程度怎样呢?负相关 正相关相关系数正相关;负相关通常,r-1,-0.75-负相关很强;r 0.75,1正相关很强;r-0.75,-0.3-负相关一般;r 0.3,0.75正相关一般;r-0.25,0.25-相关性较弱;10 20 30 40 50500450400350300 xy施化肥量水稻产量施化肥量x 15 20 25 30 35 40 45水稻产量y 330 345 365 405 445 450 455解:1.画出散点图2.求出3.写出回归方程4.计算相关系数例题1 从某大学中随机选出8名女大学生,其身高和体重数据如下表:编号 1 2 3 4 5 6 7 8身高 165 165 157 170 175 165 155 170体重 48 57 50 54 64 61 43 59求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172的女大学生的体重。分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量3.通过探究栏目引入“线性回归模型”。此处可以引导学生们体会函数模型与回归模型之间的差别。函数模型与回归模型之间的差别函数模型:回归模型:线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和随机误差项e共同确定,即自变量x只能解析部分y的变化。在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。探究P4:身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重在60.316kg左右。函数模型与回归模型之间的差别函数模型:回归模型:如何描述两个变量之间线性相关关系的强弱?在数学3 中,我们学习了用相关系数r 来衡量两个变量之间线性相关关系的方法。相关系数r相关关系的测度(相关系数取值及其意义)-1.0+1.0 0-0.5+0.5完全负相关完全负相关无线性相关无线性相关完全正相关完全正相关负相关程度增加负相关程度增加r正相关程度增加正相关程度增加线性回归模型+其中和为模型的未知参数,e是y与 之间的误差,通常称为随机误差。例1假设某设备的使用年限x(年)和所支出的维修费用y(万元)有如下的统计资料:x 2 3 4 5 6y 2.2 3.8 5.5 6.5 7.0试求:(1)y与x之间的回归方程;(2)当使用年限为10年时,估计维修费用是多少?思路点拨先作出散点图,再根据散点图分析支出的维修费用与使用年限是否线性相关,若相关,再利用线性回归方程求解,最后根据求得的方程估计10年时的维修费用思考P3产生随机误差项e的原因是什么?随机误差e的来源(可以推广到一般):1、其它因素的影响:影响身高 y 的因素不只是体重 x,可能 还包括遗传基因、饮食习惯、生长环境等因素;2、用线性回归模型近似真实模型所引起的误差;3、身高 y 的观测误差。(1)根据散点图来粗略判断它们是否线性相关。(2)是否可以用线性回归模型来拟合数据(3)通过残差 来判断模型拟合的效 果这种分析工作称为残差分析 使学生了解残差图的制作及作用。P98 坐标纵轴为残差变量,横轴可以有不同的选择;若模型选择的正确,残差图中的点应该分布在以横轴为心的带形区域;对于远离横轴的点,要特别注意。错误数据 模型问题身高与体重残差图异常点