统计学直线回归与相关.pptx
《统计学直线回归与相关.pptx》由会员分享,可在线阅读,更多相关《统计学直线回归与相关.pptx(36页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1统计学直线回归与相关统计学直线回归与相关第一节第一节 直线回归直线回归n n一、概述n n1、函数关系与回归关系n n函数关系:自变量取某一数值时,应变量有一函数关系:自变量取某一数值时,应变量有一个完全确定的数值与之对应。(多见于物理、个完全确定的数值与之对应。(多见于物理、化学等学科,生物医学界不少变量间有一定的化学等学科,生物医学界不少变量间有一定的关系,但不是十分明确)关系,但不是十分明确)n n回归关系:应变量随自变量的变化而变化,且回归关系:应变量随自变量的变化而变化,且呈直线趋势,但并非所有的点子都在一直线上。呈直线趋势,但并非所有的点子都在一直线上。第1页/共36页n
2、n直线回归分析的任务:找出一条直线回归分析的任务:找出一条最能代表这些数据关系的一条直最能代表这些数据关系的一条直线。线。n n方法:一般采用最小二乘法方法:一般采用最小二乘法least least square methodsquare method找出一条各实测点与找出一条各实测点与它的纵向距离的平方和为最小的它的纵向距离的平方和为最小的直线回归方程。又称作最小二乘直线回归方程。又称作最小二乘回归回归n n变量变量y y随变量随变量x x而变化,称而变化,称x x为自变为自变量量independent variableindependent variable,y y为应变量为应变量depe
3、ndent variable.dependent variable.第2页/共36页n n2、直线回归方程n n直线方程:直线方程:y=a+bxy=a+bxn n直线回归方程:直线回归方程:n na a:为回归直线在为回归直线在Y Y轴上的截距轴上的截距interceptintercept,a0a0表示直线与纵轴的表示直线与纵轴的交点在原点的上方,交点在原点的上方,a0aobo直线从直线从左下走向右上左下走向右上,b0b0从左上走向右从左上走向右下下,b=0b=0直线与横轴平行。意义:直线与横轴平行。意义:x x每增每增(减减)一单位,一单位,Y Y平均改变平均改变b b个个单位单位第3页/共
4、36页n n3、最小二乘法n n样本含量为样本含量为n n的的样本资料标在的的样本资料标在(x,y)x,y)平面上,可得平面上,可得n n个点,故可个点,故可确定很多直线,直线回归的主要确定很多直线,直线回归的主要目标之一是用实测的目标之一是用实测的x x估计估计y y,所所以希望估计的以希望估计的y y与实测的与实测的y y间的误间的误差愈小愈好。即从所有直线中找差愈小愈好。即从所有直线中找到一条直线使估计误差平方和达到一条直线使估计误差平方和达最小。最小。n n即即 最小最小第4页/共36页二、求直线回归方程的基本方法二、求直线回归方程的基本方法第5页/共36页n nP110例91:n n
5、1)由原始数据绘散点图,各点分布呈直线趋势,故作下列计算n n2)求x,y,x2,y2,xyn n3)计算x,y的均数,lxx、lyy和lxyn4)求回归系数b和截距an n5)列出回归方程第6页/共36页n n6)直线回归方程图示:在自变量x的实测全距范围内任取相距较远且易读的两x值,代入回归方程求y的估计值,在图绘出两点连成直线。n n注意:所绘直线必然通过 ,若纵坐标、横坐标无折断号时,将此直线左端延长与纵轴相交,交点的纵坐标必然等于截距a,这两点可用来核对回归线绘制是否正确。第7页/共36页第二节第二节 直线回归分析中误差及直线回归分析中误差及可信区间可信区间n n一、标准估计误差n
6、n估计误差估计误差error of estimateerror of estimate:在直线回归中,各实在直线回归中,各实际值际值y y与由回归方程计算出的估计值之间有一定与由回归方程计算出的估计值之间有一定的误差,称。这种离差可以用类似标准差的的误差,称。这种离差可以用类似标准差的式子进行计算,称为标准估计误差式子进行计算,称为标准估计误差standard error standard error of estimateof estimate。由于由于 决定于均数和回归系数,所决定于均数和回归系数,所以自由度为以自由度为n-2n-2第8页/共36页n nlyy的分析:n np点的纵坐标被回
7、归线、均数y 截成三段n nSS总SS回SS剩第9页/共36页YXP y-y y-y -y-yy第10页/共36页n n各实测点离回归直线越近,剩余平方和愈小,说明直线回归的估计误差愈小n n总回剩n n总n1,回1,剩n2第11页/共36页n n二、实测值围绕回归线的离散度n n回归分析时假设:X取某一值时,Y围绕回归线x呈正态分布,Sy.x是其标准差的估计值。n n故可估计出约有95观测值y在总体回归线y=x上下1.96个标准估计误差范围内,见P112图93第12页/共36页n n三、回归系数的标准误n n表示:样本回归系数b对总体回归系数进行估计时误差的大小n n求的95可信区间n nb
8、t0.05()Sb,自由度=n-2第13页/共36页n n四、的标准误n ny的标准误本应由Sy/n求得,但因在直线回归当中x的影响被扣除后,y方面的变异减小,故y的标准误,即x=x时y的标准误为n n五、的可信区间n n 是总体均数 的估计值第14页/共36页n n95可信区间:n n六、的标准误n n当xix时,的变异不仅决定于y的误差,也与回归系数b的误差有关第15页/共36页n n七、(个体y值)的可信区间n n理论上,每个xi对应的y估计值都有一个区间估计,把这些可信区间的上限和下限连起来,为两条曲线。把这两条曲线间的空间称为回归直线的可信区间。第16页/共36页n n八、截距的误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 直线 回归 相关
限制150内