31回归分析一.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《31回归分析一.ppt》由会员分享,可在线阅读,更多相关《31回归分析一.ppt(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、3.1回归分析的基本思想回归分析的基本思想及其初步应用(一)及其初步应用(一)数学数学统计内容统计内容1. 画散点图画散点图2. 了解最小二乘法的思想了解最小二乘法的思想3. 求回归直线方程求回归直线方程 ybxa4. 用回归直线方程解决应用问题用回归直线方程解决应用问题问题问题1:正方形的面积:正方形的面积y与正方形的边长与正方形的边长x之间之间 的的函数关系函数关系是是y = x2确定性关系确定性关系问题问题2:某水田水稻产量:某水田水稻产量y与施肥量与施肥量x之间是否之间是否 有一个确定性的关系?有一个确定性的关系?例如:在例如:在 7 块并排、形状大小相同的试验田上块并排、形状大小相同
2、的试验田上 进行施肥量对水稻产量影响的试验,得进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:到如下所示的一组数据:施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455复习复习 变量之间的两种关系变量之间的两种关系10 20 30 40 50500450400350300施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy施化肥量施化肥量水稻产量水稻产量 自变量取值一定时,因变量的取值带有一定自变量取值一定时,因变量的
3、取值带有一定随机性的两个变量之间的关系叫做随机性的两个变量之间的关系叫做相关关系相关关系。1、定义、定义: 1):相关关系是一种不确定性关系;):相关关系是一种不确定性关系;注注对具有相关关系的两个变量进行统计对具有相关关系的两个变量进行统计分析的方法叫分析的方法叫回归分析回归分析。2):): 现实生活中存在着大量的相关关系。现实生活中存在着大量的相关关系。探索:水稻产量探索:水稻产量y与施肥量与施肥量x之间大致有何规之间大致有何规律?律?10 20 30 40 50500450400350300发现:图中各点,大致分布在某条直线附近。发现:图中各点,大致分布在某条直线附近。探索探索2:在这些
4、点附近可画直线不止一条,哪条直:在这些点附近可画直线不止一条,哪条直线最能代表线最能代表x与与y之间的关系呢?之间的关系呢?施化肥量施化肥量x 15 20 25 30 35 40 45水稻产量水稻产量y 330 345 365 405 445 450 455xy散点图散点图施化肥量施化肥量水稻产量水稻产量10 20 30 40 50500450400350300 xy施化肥量施化肥量水稻产量水稻产量yx探究探究对于一组具有线性相关关系的数据对于一组具有线性相关关系的数据1122( ,),(,),.,(,),nnx yxyxy我们知道其回归方程的截距和斜率的最小二乘估计公式分别为:我们知道其回归
5、方程的截距和斜率的最小二乘估计公式分别为:1122211()(),.(2)()nniiiiiinniiiixxyyxnxyybxxxnx,.(1)aybx1111,.nniiiixx yynn其中( , )x y称为样本点的中心。称为样本点的中心。你能推导出这个公式吗?你能推导出这个公式吗?1122( ,),(,),.,(,)nnx yxyxy假设我们已经得到两个具有相关关系的变量的一组数据假设我们已经得到两个具有相关关系的变量的一组数据 且回归方程是:且回归方程是:y=bx+a,(1,2,., )ix in()iiiiyyybxa其中,其中,a,b是待定参数。当变量是待定参数。当变量x取取
6、时时 它与实际收集到的它与实际收集到的 之间的偏差是之间的偏差是iyoxy11( ,)x y22(,)xy( ,)iix yiiyy21( ,)()()niiiQyxyxyx 221()2() () () niiiiiyxyxyxyxyxyx2211()2() ()() ,nniiiiiiyxyxyxyxyxn yx11() ()()()nniiiiiiyxyxyxyxyxyx注意到,11()()nniiiiyxyxn yx()()0,yxnyn xn yx221( ,)()()niiiQyxyxn yx 因此,2222111()2()()()()nnniiiiiiixxxxyyyyn yx2
7、222211221111()()()()()()()()()nniiiinniiiinniiiiiixxyyxxyyn yxxxyyxxxx易知,截距易知,截距 和斜率和斜率 分别是使分别是使取最小值时取最小值时 的值。由于的值。由于2211( ,)()()nniiiiiiQyyyx b, a121()()()niiiniixxyyxxyx这正是我们所要推导的公式。这正是我们所要推导的公式。在上式中,后两项和在上式中,后两项和 无关,而前两项为非负无关,而前两项为非负数,因此要使数,因此要使Q取得最小值,当且仅当前两项的值取得最小值,当且仅当前两项的值均为均为0,即有,即有, 1、所求直线方程
8、叫做、所求直线方程叫做回归直线方程回归直线方程; 相应的直线叫做相应的直线叫做回归直线回归直线。2、对两个变量进行的线性分析叫做、对两个变量进行的线性分析叫做线性回归分析线性回归分析。1122211()(),()nniiiiiinniiiixx yyxnxyybxxxnxay bx 1、回归直线方程、回归直线方程最小二乘法:最小二乘法:ybxa( , )x y称为样本点的中心称为样本点的中心。1122211()(),.(1)(),.(2)nniiiiiinniiiixxyyxnxyybxxxnxayb x 1111,.nniiiixx yynn其中2、求回归直线方程的步骤:、求回归直线方程的步
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 31 回归 分析
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内