第四章相关回归分析.ppt
第四章第四章 相关回归分析相关回归分析相关与回归分析概述相关与回归分析概述相关分析相关分析回归分析回归分析第一节第一节 相关与回归分析概述相关与回归分析概述 一、相关的概念 事物或现象间在数量上存在着相互依存、相互制约的关系。可分为两种类型:确定性关系和非确定性关系。1、确定性关系:现象间存在着一一对应的严格的数量依存关系。对于某一个变量的每一个数值,都有另一个变量的确定数值与之对应,又称为函数关系。2、非确定性关系:现象间存在的不严格的数量依存关系。对于某一个变量的每一个数值可以有另一个变量的若干个数值与之对应,又称为相关关系,简称相关。函数关系与相关关系的联系:(1)由于测量误差存在,现实生活中函数关系常表现为相关关系;(2)由于现象间数量关系规律性,相关关系常借助函数关系近似描述。对现象间相关关系的研究,称为相关分析。相关分析常研究现象间因果关系、共变关系、依存关系等。二、相关的分类 1、按表现形式直线相关(线性)曲线相关(非线性)2、按变化方向正相关负相关 3、按因素多少单相关(一元)复相关(多元)4、按相关程度完全相关不完全相关完全不相关完全正相关不完全正相关完全负相关不完全负相关非线性相关完全不相关三、回归的概念 将具有相关关系的各个变量区分为自变量和因变量,研究自变量数值的变化对因变量数值的影响,根据自变量的数值推算因变量的数值,揭示相关关系现象间数量变动的统计规律性。四、回归的分类 1、按自变量个数简单回归(一元)复回归(多元)2、按表现形式直线回归(线性)曲线回归(非线性)五、相关与回归分析的主要内容 1、考察现象间是否存在相关关系 2、分析现象间相关关系 的种类 3、分析现象间相关密切程度 4、建立回归方程 5、测定因变量估计值与实际值的误差程度,并作有关估计推断第二节第二节 相关分析相关分析 一、相关分析 1、相关分析定义 2、相关分析目的 找出现象间相关关系的密切程度和变化规律,以便进行统计预测和推算。3、相关分析步骤 (1)确定现象间有无相关关系 (2)确定相关关系的表现形式 (3)确定相关关系的密切程度及方向 二、相关关系的测定 1、定性分析。依据研究者的理论知识、专业知识和实践经验,通过观察试验进行深入研究,才能作出正确的结论。在定性分析的基础上,进一步编制相关表、绘制相关图,便于直观判断现象间相关形态、方向及密切程度。相关表将某一变量的变量值按大小顺序排列,另一变量的变量值与之对应排列的一种统计表。相关图对于具有相关关系的两个变量,将其中一个作为X变量,另一个作为Y变量绘制的用来描述现象间相关关系的散点图。2、定量分析。通过相关系数的计算,进一步了解现象间相关关系的确切情况。相关系数用来测定变量间相关密切程度的指标。有简单相关系数、复相关系数、非线性相关系数等。简单相关系数是用以描述在直线相关条件下,变量间相关密切程度的综合指标,用r表示(公式见教材P191)相关系数的取值范围:-1r1。r0时,X与Y正相关;r0时,X与Y负相关;r=0时,X与Y不相关;r=1时,X与Y完全相关;0|r|1时,X与Y不完全相关;|r|越接近1时,X与Y相关程度越高。判定系数相关系数的平方。用以判断回归方程的拟合优度。判定系数的取值范围:=1时,观察值与回归值完全拟合 =0时,观察值与回归值完全不拟合 越接近1时,观察值与回归值拟合得越好;反之越差。第三节第三节 回归分析回归分析 一、回归分析 根据回归方程式与给定的自变量,揭示因变量在数量上的平均变化以及求得因变量预测值的统计分析方法,称为回归分析。尽管在相关关系描述中,对于给定自变量的值,有若干个因变量值与之对应,但这些值总是围绕因变量的均值上下波动。二、一元线性回归方程的建立 1、总体线性回归方程 y=+x 2、样本线性回归方程(一元线性回归方程)yc=a+bx 3、观察值与回归值间存在误差 yi yci=yi a-bxi(i=1,2,n)4、最小平方法:使离差平方和最小 即:Q=(yi a bxi)为最小2 根据微积分求极值原理,分别对a,b求偏导数,并令它们得零,Q/a=2(yiabxi)(-1)=0 Q/b=2(yiabxi)(-xi)=0即:yi=na+bxixiyi=axi+bxi2 b=nxy-xynx -(x)22a=y-bx 当 x=x 时,有 yc=y,即回归直线必通过(x,y),即各散点的中心。yc=a+bx=y bx+bx 回归系数b和相关系数r的符号都取决于分子的协方差,所以同一组资料的b、r符号是一致的。b、r的计算式可互推 b=r(y/x)r=b(x/y)三、回归估计标准差 反映各实际观察值与其估计值之间的平均偏差程度。回归估计标准差计算公式和简化公式见教材P197 回归估计标准差表明估计值对各实际观察值的代表性强弱。值越大,回归方程的代表性越差;反之,回归方程的代表性越强。四、回归估计标准差与相关系数的关系 一个实际观察值差异大小可通过离差(y-y)来表示;而全部n个实际观察值的总差异可通过离差平方和(y-y)来表示。一个实际观察值的离差可分解为:y y=(y-yc)+(yc-y)则全部n个实际观察值的离差平方和:(y-y)=(y-yc)+(yc-y)反映x以外的因素对y的影响反映x与y线性关系对y的影响2222 回归效果好坏取决于回归平方和在总离差平方和中的比重,比重大小可衡量相关密切程度和回归拟合优度,也就是判定系数 。判定系数 计算公式和简化公式见教材P200 相关系数r又可表示为 大样本条件下,回归估计标准差与相关系数间关系见教材P201