相关与回归分析《统计学》.ppt
《相关与回归分析《统计学》.ppt》由会员分享,可在线阅读,更多相关《相关与回归分析《统计学》.ppt(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第八章第八章相关与回归分析相关与回归分析第一节第一节相关分析相关分析一、函数关系和相关关系一、函数关系和相关关系(一)函数关系和相关关系的区别与联系。(一)函数关系和相关关系的区别与联系。客观现象总是普遍联系、相互依存、相互制约客观现象总是普遍联系、相互依存、相互制约的,当我们用变量来反映这些现象的特征时,的,当我们用变量来反映这些现象的特征时,便表现为变量之间的依存关系。变量之间就其便表现为变量之间的依存关系。变量之间就其关系的变化来说可分为关系的变化来说可分为函数关系和相关关系函数关系和相关关系。(二)相关关系的分类(二)相关关系的分类客观现象间的相关关系相当复杂,表现为各种客观现象间的相
2、关关系相当复杂,表现为各种形态,可以按不同的标志加以分类。形态,可以按不同的标志加以分类。1按按相关程度相关程度划分,相关关系可分为划分,相关关系可分为完全相完全相关、不完全相关和不相关关、不完全相关和不相关。当一种现象的数量变化完全由另一种现象的数量变化当一种现象的数量变化完全由另一种现象的数量变化所决定时,称这两种现象之间的关系为所决定时,称这两种现象之间的关系为完全相关完全相关(即函即函数关系数关系)。例如上述的圆的周长与圆的半径之间的关系等。例如上述的圆的周长与圆的半径之间的关系等。在这在这种情况下,相关关系即为函数关系,种情况下,相关关系即为函数关系,也可以说函数关也可以说函数关系是
3、相关关系的一种特例。系是相关关系的一种特例。当两个现象彼此互不影响,其数量各自独立时,称这当两个现象彼此互不影响,其数量各自独立时,称这两个现象之间的关系为两个现象之间的关系为不相关或零相关不相关或零相关。例如,学生的学习成绩与其身高、体重之间一般认是例如,学生的学习成绩与其身高、体重之间一般认是不相关的,同样,一个人的收入与其血压之间也是不不相关的,同样,一个人的收入与其血压之间也是不相关的。相关的。若两个现象之间的关系介于完全相关和不相关之间,若两个现象之间的关系介于完全相关和不相关之间,就称为就称为不完全相关不完全相关。一般的相关关系就是指这种不完。一般的相关关系就是指这种不完全相关,全
4、相关,它是相关分析的研究对象它是相关分析的研究对象。2按相关方向划分,相关关系可分为正按相关方向划分,相关关系可分为正相关和负相关。相关和负相关。两个相关变量间,当一个变量的数值增加(或两个相关变量间,当一个变量的数值增加(或减少)时,另一个变量的数值也随之增加(或减少)时,另一个变量的数值也随之增加(或减少),这种相关称为减少),这种相关称为正相关正相关。例如家庭消费与收入、身高与体重。例如家庭消费与收入、身高与体重。当一个变量的数值增加(或减少)时,另一个当一个变量的数值增加(或减少)时,另一个变量的数值反而表现出减少(或增加)的趋势变量的数值反而表现出减少(或增加)的趋势变化,称这种相关
5、为变化,称这种相关为负相关负相关。例如价格与需求量、劳动生产率与单位产品成本等。例如价格与需求量、劳动生产率与单位产品成本等。或者说,正相关是变量数值之间表现出的同方向变化,或者说,正相关是变量数值之间表现出的同方向变化,而负相关是变量数值之间的反向变化。而负相关是变量数值之间的反向变化。3按相关形式划分,相关关系可分为线按相关形式划分,相关关系可分为线性相关与非线性相关。性相关与非线性相关。当一个变量发生变动,另一个变量随之发生大当一个变量发生变动,另一个变量随之发生大致均等的变动(增加或减少),从图形上看,致均等的变动(增加或减少),从图形上看,其相应观测点的分布近似地表现为直线形式,其相
6、应观测点的分布近似地表现为直线形式,就是就是线性关系线性关系。而当一个变量发生变动时,另一个变量也随之而当一个变量发生变动时,另一个变量也随之发生变动(增加或减少),但这种变动不是均发生变动(增加或减少),但这种变动不是均等的,从图形上看,其相应观测点的分布近似等的,从图形上看,其相应观测点的分布近似地表现为各种不同的曲线形式,这种相关关系地表现为各种不同的曲线形式,这种相关关系称为称为非线性相关非线性相关。4按变量多少划分,相关关系可分为单按变量多少划分,相关关系可分为单相关、复相关和偏相关相关、复相关和偏相关单相关又称一元相关单相关又称一元相关,是指两个现象之间的相关,即,是指两个现象之间
7、的相关,即一个变量对另一个变量之间的相关关系。一个变量对另一个变量之间的相关关系。复相关又称多元相关复相关又称多元相关,是指三个或三个以上变量之间,是指三个或三个以上变量之间的相关关系。的相关关系。例如家庭的消费水平与家庭收入、家庭财产及市场价例如家庭的消费水平与家庭收入、家庭财产及市场价格水平之间的关系便是一种复相关。格水平之间的关系便是一种复相关。在某一变量与多个变量相关时,当假定其他变量不变,在某一变量与多个变量相关时,当假定其他变量不变,仅研究两个变量的相关关系时,称为仅研究两个变量的相关关系时,称为偏相关偏相关。例如在假定家庭收入、家庭财产不变的条件下,市场例如在假定家庭收入、家庭财
8、产不变的条件下,市场价格水平与家庭消费支出的关系就是一种偏相关,同价格水平与家庭消费支出的关系就是一种偏相关,同样,在假定家庭收入和市场价格水平不变的条件下,样,在假定家庭收入和市场价格水平不变的条件下,家庭财产与家庭消费支出的关系也是一种偏相关。家庭财产与家庭消费支出的关系也是一种偏相关。5按相关的性质分,相关关系可分为真按相关的性质分,相关关系可分为真实相关和虚假相关。实相关和虚假相关。当两个现象之间的相关确实具有内在联系时,当两个现象之间的相关确实具有内在联系时,称之为称之为真实相关真实相关。例如上述的消费与收入、价格与需求量等的相关,都例如上述的消费与收入、价格与需求量等的相关,都可以
9、说是真实相关。可以说是真实相关。当两个现象之间的相关只是表面存在,实质上当两个现象之间的相关只是表面存在,实质上并没有内在联系时,称其为并没有内在联系时,称其为虚假相关虚假相关。一个国家的国内生产总值与其精神病患者人数之间、一个国家的国内生产总值与其精神病患者人数之间、一个股票市场的股票价格水平与气温之间的关系就是一个股票市场的股票价格水平与气温之间的关系就是典型的虚假相关。典型的虚假相关。判断真实相关与虚假相关,必须依靠有关的实判断真实相关与虚假相关,必须依靠有关的实质性科学提供的知识做定性分析,而不能靠数质性科学提供的知识做定性分析,而不能靠数学公式或简单的数学图表来作出判断。学公式或简单
10、的数学图表来作出判断。二、相关关系的分析二、相关关系的分析相关分析相关分析就是对变量之间相关关系的描述与度量。就是对变量之间相关关系的描述与度量。其基本内容包括:其基本内容包括:1、直观地判断变量之间是否存在相关关系及其相关关、直观地判断变量之间是否存在相关关系及其相关关系的具体形式。一般是通过绘制统计图表来实现,这系的具体形式。一般是通过绘制统计图表来实现,这也是也是相关分析的出发点。相关分析的出发点。2、定量地刻画变量之间相关关系的程度或强度。定量地刻画变量之间相关关系的程度或强度。线性线性相关关系一般是通过相关系数来说明,非线性相关关相关关系一般是通过相关系数来说明,非线性相关关系可以通
11、过相关指数来说明,系可以通过相关指数来说明,这是相关分析的中心内这是相关分析的中心内容。容。3、相关系数的显著性检验。在实际进行相关分析时,、相关系数的显著性检验。在实际进行相关分析时,相关系数都是利用样本数据计算的,因而带有一定的相关系数都是利用样本数据计算的,因而带有一定的随机性。因此,也需要进行显著性检验。随机性。因此,也需要进行显著性检验。(一)相关表和相关图(一)相关表和相关图相关表和相关图是研究相关关系的简单、直观相关表和相关图是研究相关关系的简单、直观工具。工具。利用它们可对现象之间存在的相关关系利用它们可对现象之间存在的相关关系的方向、表现形式和密切程度做出大致的判断。的方向、
12、表现形式和密切程度做出大致的判断。相关表相关表是一种反映变量之间相关关系的统计表,是一种反映变量之间相关关系的统计表,根据资料是否分组,相关表有简单相关表和分根据资料是否分组,相关表有简单相关表和分组相关表两种。组相关表两种。简单相关表简单相关表就是先将自变量的数值按从小到大就是先将自变量的数值按从小到大的顺序排列出来,然后将因变量数值对应列上的顺序排列出来,然后将因变量数值对应列上而形成的表格。而形成的表格。【例【例8-1】(二)相关系数(二)相关系数(Coefficientofcorrelation)1相关系数的意义相关系数的意义在各种相关中,单相关是基本的相关关系,它是复相在各种相关中,
13、单相关是基本的相关关系,它是复相关和偏相关的基础。单相关有线性相关和非线性相关关和偏相关的基础。单相关有线性相关和非线性相关两种表现形式。测定线性相关系数的方法是最基本的两种表现形式。测定线性相关系数的方法是最基本的相关分析,是测定其他相关系数方法的基础。相关分析,是测定其他相关系数方法的基础。单相关系数或简单相关系数可简称相关系数。单相关系数或简单相关系数可简称相关系数。相关系数是在直线相关条件下,对变量之间相关关系相关系数是在直线相关条件下,对变量之间相关关系密切程度的度量。把若干个相关系数加以比较,可以密切程度的度量。把若干个相关系数加以比较,可以发现现象发展中具有决定意义的因素,因而相
14、关系数发现现象发展中具有决定意义的因素,因而相关系数在多个因素的作用判断中亦有重要作用。在多个因素的作用判断中亦有重要作用。2相关系数的计算相关系数的计算【例【例8-2】3相关系数的取值及意义相关系数的取值及意义4相关系数的显著性检验相关系数的显著性检验【例【例8-3】根据例根据例8-2中计算的相关系数,检验人均消费性中计算的相关系数,检验人均消费性支出与人均可支配收入之间的相关系数是否显支出与人均可支配收入之间的相关系数是否显著(著()第二节第二节一元线性回归分析一元线性回归分析一、回归与回归分析一、回归与回归分析(一)回归与回归分析的概念及种类(一)回归与回归分析的概念及种类在现代统计学中
15、,在现代统计学中,回归分析回归分析是指根据相关关系是指根据相关关系的具体形态,选择一个合适的数学模型(回归的具体形态,选择一个合适的数学模型(回归模型)来近似的表达变量之间的平均变化关系,模型)来近似的表达变量之间的平均变化关系,以便对因变量进行估计或预测的一种统计方法。以便对因变量进行估计或预测的一种统计方法。按自变量的多少不同,可将回归分析分为按自变量的多少不同,可将回归分析分为一元一元回归和多元回归回归和多元回归。在回归分析中,只有一个自。在回归分析中,只有一个自变量的称为一元回归或单回归;有两个或两个变量的称为一元回归或单回归;有两个或两个以上自变量的称为多元回归或复回归。以上自变量的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 相关 回归 分析
限制150内