第4章 相关与回归分析.pdf
《第4章 相关与回归分析.pdf》由会员分享,可在线阅读,更多相关《第4章 相关与回归分析.pdf(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君第第第第4 4章章章章相相关关与与回回归归分分析析相相关关与与回回归归分分析析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、相关分析一、相关分析二、简单线性回归分析二、简单线性回归分析三、多元线性回归分析三、多元线性回归分析四、曲线估计四、曲线估计*主主要要内内容容PDF 文件使用 pdfFactory Pro 试用版本创
2、建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君4.1 相关分析相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君人们在实践中发现,变量之间的关系存在两种类型:人们在实践中发现,变量之间的关系存在两种类型:v函数关系:变量间的一种确定性的关系函数关系:变量间的一种确定性的关系v相关关系相关关系(统计关系统计关系):变量间的不确定性关系:变量间的不确定性关系统计关系有
3、强有弱,程度各异,研究这种关系通常利用统计关系有强有弱,程度各异,研究这种关系通常利用相关分析和回归分析,这两种方法相互结合和渗透,又各有相关分析和回归分析,这两种方法相互结合和渗透,又各有侧重和不同的应用:相关分析是测定变量之间的关系的侧重和不同的应用:相关分析是测定变量之间的关系的密切密切程度程度,所使用的工具是相关系数;回归分析则是侧重于考察,所使用的工具是相关系数;回归分析则是侧重于考察变量之间的数量变量之间的数量变化规律变化规律,并通过一定的数,并通过一定的数学表达式来描述学表达式来描述变量之间的关系变量之间的关系。进而。进而确定一确定一个或几个个或几个变量的变化变量的变化对另对另一
4、一个个特特定变量的定变量的影响影响程度程度。PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君1 1、连续连续变量的相关变量的相关指标指标连续连续变量的相关变量的相关指标指标这种这种情况情况是是最最常常见见的,的,此时此时一一般般使用使用积差积差相关系数,相关系数,又又称称Pearson相关系数相关系数表示其表示其相关性的相关性的大小。作为参大小。作为参数方数方法,法,积差积差相关分析有一定的使用相关分析有一定的使用条件条件:v线性相关的线性相关的情况情况
5、v样本样本中不存在中不存在极端值极端值如果如果数数据据不不能满足能满足这这些条件时些条件时,分析,分析者可者可考考虑虑使用使用Spearman等级等级相关系数相关系数,它对原始它对原始变量的分变量的分布布不不做要做要求求,属属于于非参非参数统计方法,数统计方法,适适用用范围比范围比Pearson相关系数相关系数广泛得广泛得多多。一、相关分析概述一、相关分析概述一、相关分析概述一、相关分析概述PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君1 1、连续连续
6、变量的相关变量的相关指标指标连续连续变量的相关变量的相关指标指标相关系数用相关系数用r表示表示,其值其值在在-1到到1之间,之间,根据根据相关的方相关的方向向分分为负为负相关相关(-1r0)和和正正相关相关(0r1);在在说明说明变量之间的线性关系强弱变量之间的线性关系强弱时时,可可将将相关程度分相关程度分为以下几为以下几种:种:vr0.8,视为高视为高度相关度相关。v0.5r0.8,视为视为中度相关中度相关。v0.3r0.5,视为低视为低度相关度相关。一、相关分析概述一、相关分析概述一、相关分析概述一、相关分析概述PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计
7、软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君2 2、有有序序变量的相关变量的相关指标指标有有序序变量的相关变量的相关指标指标有有序序变量的变量的等级资料等级资料的相关性的相关性就就是是指行指行变量变量等级高等级高的的列列变量变量等级等级也也高高,行行变量变量等级低等级低的的列列变变量量等级等级也也低。低。SPSS所所提供提供的有的有序序变量的相关变量的相关指标指标有有Kendalls Tau-b,理论上取理论上取值范围值范围也也是是1。一、相关分析概述一、相关分析概述一、相关分析概述一、相关分析概述PDF 文件使用 pdfFa
8、ctory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君v基基本本方法方法绘制散点图绘制散点图:比比较直观较直观的的体体现变量间的关系,现变量间的关系,体体现现了了正正(负负)相关相关趋势趋势,但较但较为为粗略粗略;相关系数:相关系数:精精确确体体现两现两个个变量间的线性相关程度变量间的线性相关程度例例4.1:近近来来国家教育部决国家教育部决定定将将各各高高校校的的后勤后勤社会社会化化。某从事饮食业某从事饮食业的的企业家认企业家认为为这是一这是一个个很好很好的的投投资资机会机会,他他得到得
9、到十组十组高高校校人数与人数与周边饭店周边饭店的的季季销售额销售额资料资料,(见见销售额销售额.sav),并,并想想根据高根据高校校的的数数据据估计估计其其投投资资规规模模。试试对此进行对此进行分析分析。二、简单相关分析二、简单相关分析二、简单相关分析二、简单相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君v基基本本操操作作步骤步骤:(1)菜菜单单选项选项:analyzecorrelatebivariate.(2)选择选择计计算算相关系数的变量相
10、关系数的变量到到variables框框.(3)选择选择相关系数类型相关系数类型(correlation coefficients).(4)显著显著性性检验检验(test of significance)二、简单相关分析二、简单相关分析二、简单相关分析二、简单相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君v相关系数相关系数检验检验原原假设假设H0:两:两个个总体总体相关系数相关系数为为0,即即不相关不相关“*”表示表示t检验检验值值发发生生的的概
11、率概率小小于于等等于于0.05,即总即总体无体无相关的相关的可能可能性性小小于于0.05;“*”表示表示t检验检验值值发发生生的的概率概率小小于于等等于于0.01,即即总体无总体无相关的相关的可能可能性性小小于于0.01;*比比*更严格更严格二、简单相关分析二、简单相关分析二、简单相关分析二、简单相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君相关分析是分析两相关分析是分析两个个变量之间的线性相关的程变量之间的线性相关的程度,度,但但是是因因为为
12、往往因往往因为为第三第三个个变量存在所变量存在所起起的的作作用,使的相关系数不用,使的相关系数不能能真真实实地反映地反映两两个个变量之间的变量之间的线性相关程度,这线性相关程度,这样样也也就就决决定定了了二元变量的相关分二元变量的相关分析的不析的不准准确性确性。三、偏相关分析三、偏相关分析三、偏相关分析三、偏相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君消除消除其其他他变量的变量的影响影响后后来来研究两研究两个个变量之间的变量之间的相互关系,这
13、种相关分析相互关系,这种相关分析叫偏叫偏相关分析相关分析。即即衡衡量量任任何何两两个个变量之间关系变量之间关系时时,控控制制与这两与这两个个变量有变量有联联系系的的其其他他变量变量保持保持不变不变。例例4.2:根据根据调查问卷调查问卷.sav中的数中的数据据,试试分析分析年龄年龄和和身身高高的相关性的相关性。三、偏相关分析三、偏相关分析三、偏相关分析三、偏相关分析PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君4.2 简单线性回归分析简单线性回归分析PD
14、F 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、一元(简单)线性回归分析概述一、一元(简单)线性回归分析概述一、一元(简单)线性回归分析概述一、一元(简单)线性回归分析概述1 1、一元线性回归一元线性回归模模型型一元线性回归一元线性回归模模型型y=0+1x+模模型型表明表明,因因变量变量Y的变化的变化可以可以由由两两部部分分来来解释解释,一,一部部分是分是由自由自变量变量X的变化的变化引引起起的的Y的线性变化,的线性变化,另另一一部部分是分是由由其其他他
15、随随机因机因素引素引起起Y的变化,的变化,即即,是是随随机机扰动扰动项项。PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述2 2、基基本本假假定定、基基本本假假定定误误差差项项是一是一个个期望期望值为值为0的的随随机机变量,变量,即即E()=0。(零均零均值值)对对于所有的于所有的 x 值值,的方的方差差2相同相同(同方同方差差)误误差差项项是一是一个个服服从
16、从正正态态分分布布的的随随机机变量,变量,且且相互相互独独立立。即即N(0,2)(正正态态性,性,无无自自相关相关)独立独立性性意味着意味着对对于一于一个特个特定的定的 x 值值,它它所所对对应的应的与与其其他他 x 值值所所对对应的应的不相关不相关对对于一于一个特个特定的定的 x 值值,它它所所对对应的应的 y 值值与与其其他他 x 所所对对应的应的 y 值值也也不相关不相关PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、一元线性回归分析概述一、一
17、元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述,10 xYE)(3 3、一元线性回归方程、一元线性回归方程、一元线性回归方程、一元线性回归方程称称一元线性回归方程,是一元线性回归方程,是对对应于应于自自变量变量X某某一一取取值时值时因因变量变量Y的的均均值。值。0、1是是未知未知参参数,数,0是常数是常数项项,1为为回归系数,回归系数,它它表示表示自自变量变量X每每变化一变化一个个单单位位,因因变量变量Y的的平均平均变化量变化量。PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院
18、兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述4 4、一元线性回归分析一元线性回归分析步骤步骤一元线性回归分析一元线性回归分析步骤步骤v作作散点图散点图v利用利用样本样本数数据据建立建立回归方程回归方程v回归方程的回归方程的显著显著性性检验检验(t检验检验和和F检验检验)v回归方程的回归方程的拟拟和和优优度度检验检验v残残差差分析分析v预预测测PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经
19、管学院侯玉君侯玉君侯玉君侯玉君一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述5 5、一元线性回归方程的、一元线性回归方程的检验检验、一元线性回归方程的、一元线性回归方程的检验检验v回归方程的回归方程的显著显著性性检验检验目目的:的:检验检验自自变量与变量与因因变量之间的线性关系变量之间的线性关系是是否否显著显著,是,是否否可可用线性用线性模模型型来表示来表示.检验检验方法:方法:t检验检验和和F检验检验(一元线性回归一元线性回归中中,F检验检验与与t检验检验可以可以相互相互替代替代)PDF 文件使用 pdfFactory Pro 试用版本创建
20、统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述一、一元线性回归分析概述5 5、一元线性回归方程的、一元线性回归方程的检验检验、一元线性回归方程的、一元线性回归方程的检验检验v回归方程回归方程优劣优劣的的评价评价(拟拟和和优优度度)目目的的:检验检验样本样本观观察察点点聚集聚集在回归在回归直直线线周周围围的密的密集集程度,程度,评价评价回归方程回归方程对样本对样本数数据据点点的的拟拟和程度和程度。统计量:统计量:判判定系数定系数(R2)v残残差
21、差分析分析残残差序差序列列的的正正态态检验检验残残差序差序列列的的随随机机性性检验检验残残差序差序列列的的独立独立性性检验检验异常异常值值诊断诊断PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君二、二、二、二、SPSSSPSS的一元线性回归分析的一元线性回归分析的一元线性回归分析的一元线性回归分析(一一)基基本本操操作作步骤步骤(1)菜菜单单选项选项:Analyzeregressionlinear(2)选择选择一一个个变量变量为为因因变量变量进进入入de
22、pendent框框(3)选择选择一一个个变量变量为为自自变量变量进进入入independent框框(4)选择选择变量变量筛筛选选方法:方法:其其中中Enter表示表示所所选选变量变量全全部部进进入入回归方程回归方程(默默认认方法方法)PDF 文件使用 pdfFactory Pro 试用版本创建 统计软件实习统计软件实习兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院兰州理工大学经管学院侯玉君侯玉君侯玉君侯玉君(二二)statistics选项选项(1)基基本本统计量统计量输出输出(基(基本本不不需需要要改改变变)Estimates:默默认认.显显示示回归系数相关统计量回归系数相关统计
23、量.confidence intervals:每每个非标个非标准准化的回归系数化的回归系数95%的的置信置信区区间间.Descriptive:各变量各变量均均值值、标标准准差差和相关系数单侧和相关系数单侧检验概率检验概率.Model fit:默默认认.判判定系数、估计定系数、估计标标准误准误差差、方、方差差分析分析表表、容忍容忍度度(2)Residual框框中的中的残残差差分析分析 Durbin-waston:D-W值值 casewise diagnostic:异常异常值值(奇奇异异值值)检检测测(输出预输出预测测值值及残及残差差和和标标准准化化残残差差)二、二、二、二、SPSSSPSS的一元
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第4章 相关与回归分析 相关 回归 分析
限制150内