统计学相关与回归分析白含检验.pptx
《统计学相关与回归分析白含检验.pptx》由会员分享,可在线阅读,更多相关《统计学相关与回归分析白含检验.pptx(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、学习目标学习目标1.1.变量间的相关关系与相关系数的计算变量间的相关关系与相关系数的计算2.2.总体回归函数与样本回归函数总体回归函数与样本回归函数3.3.线性回归的基本假定线性回归的基本假定4.4.简单线性回归参数的估计与检验简单线性回归参数的估计与检验5.5.常用的可以转换为线性回归的非线性函数常用的可以转换为线性回归的非线性函数6.6.非线性相关指数非线性相关指数第1页/共77页学习重点相关系数的计算相关系数的计算相关分析与回归分析的联系与区别相关分析与回归分析的联系与区别总体回归函数与样本回归函数总体回归函数与样本回归函数线性回归的基本假定线性回归的基本假定简单线性回归参数的估计与检验
2、简单线性回归参数的估计与检验非线性相关指数非线性相关指数第2页/共77页学习难点总体回归函数与样本回归函数的联系与区别总体回归函数与样本回归函数的联系与区别线性回归的基本假定线性回归的基本假定简单线性回归参数的估计与检验简单线性回归参数的估计与检验常用的可以转换为线性回归的非线性函数常用的可以转换为线性回归的非线性函数第3页/共77页授课学时6学时第4页/共77页10.1 10.1 相关与回归的基本概念相关与回归的基本概念一、变量间的相互关系变量间的相互关系二、相关关系的类型二、相关关系的类型三、相关分析与回归分析三、相关分析与回归分析第5页/共77页 一、变量间的相互关系一、变量间的相互关系
3、 确定性的函数关系确定性的函数关系 Y=f(X)不确定性的统计关系相关关系相关关系 相关关系是指变量之间存在一定的相依关系,但又不是确定的和严格依存的。Y=f(X,u)(u为随机变量)如广告费用(X)与销售收入(Y)之间的关系,居民的可支配收入(X)与居民的消费支出(Y)之间的关系没有关系没有关系 变量间关系的图形描述:坐标图(散点图)第6页/共77页二、相关关系特点(1)变量间关系不能用函数关系精确表达;(2)一个变量的取值不能由另一个变量唯一确定;当变量 x 取某个值的时候,变量 y 的取值可能有几个;(3)各观测点(x,y)分布在某条线的周围。x xy y第7页/共77页 相关关系的例子
4、相关关系的例子商品的消费量商品的消费量(y)与居民收入与居民收入(x)之间的关系之间的关系商品的消费量商品的消费量(y)与物价与物价(x)之间的关系之间的关系商品销售额商品销售额(y)与广告费支出与广告费支出(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温温度度(x3)之间的关系之间的关系收入水平收入水平(y)与受教育程度与受教育程度(x)之间的关系之间的关系相关关系举例第8页/共77页三、相关关系的类型第9页/共77页(1)不完全相关。介于完全相关与不相关之间(2)完全相关(函数关系)一个变量的变化完全由另一个变量的变化所确定(3)不相关
5、两个变量的变化相互之间完全没有关系1.按相关的程度划分第10页/共77页(1)线性相关。(2)非线性相关。2.按相关的形式划分第11页/共77页3.按相关的方向划分(1)正相关 例如收入与消费的关系。(2)负相关 例如物价与消费的关系。第12页/共77页(1)单相关(又称一元相关)。指两个变量之间的相互关系(2)复相关(又称多元相关)。指三个变量及以上变量之间的相互关系 例如,某种商品的需求与其价格水平以及收入水平之间的相关关系便是一种复相关。(3)偏相关。在某一变量与多个变量相关时,当假定其他变量不变,其中两个变量的相关关系。例如,在假定人们的收入水平、偏好等不变的条件下,某种商品的需求与其
6、价格水平的关系就是一种偏相关。4.按相关关系涉及的变量多少划分第13页/共77页相关关系的图示 不相关不相关不相关 负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关 第14页/共77页定性分析是依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。定量分析在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。四、相关关系的判断第15页/共77页研究现象之间的依存关系的一种表格。
7、首先要通过实际调查取得一系列成对数据作为相关分析的原始资料。然后将某一变量按其数值的大小顺序排列,再将与其相关的另一变量的对应值平行排列,即可得到简单的相关表。(一)相关表第16页/共77页 例:为了研究分析某种产品完成量与其单位产品成本之间的关系,调查30个同类公司得到的原始数据如表。整理后有第17页/共77页(二)相关图又称散点图,是以直角坐标系的横轴代表变量x,纵轴代表变量y,将两个变量相对应的成对数据用坐标点的形式描绘出来,用于反映两个变量之间相关关系的图形。第18页/共77页销售收入与广告费相关图 第19页/共77页五、相关分析与回归分析五、相关分析与回归分析 回归的古典意义古典意义
8、:高尔顿遗传学的回归概念高尔顿遗传学的回归概念 父母身高与子女身高的关系父母身高与子女身高的关系:无论高个子或低个子的子女无论高个子或低个子的子女 都有向人的平均身高回归的都有向人的平均身高回归的 趋势趋势第20页/共77页回归的现代意义回归的现代意义一个因变量对若干解释变量依存关系的研究回归的目的目的(实质)(实质):由固定的自变量去估计因变量的平均值样样本本总总体体自变量固定值自变量固定值自变量固定值估计因变量平均值第21页/共77页回归分析:是指对具有相关关系的变量,依据其关系性质,选择一个合适的数学模型(回归方程),用来近似地表示变量间数量平均变化关系的一种统计方法。回归分析按分析变量
9、的多少可分为一元回归分析和多元回归分析;按分析变量间的表现形式可分为现性回归分析和非线性回归分析;第22页/共77页相关分析与回归分析的关系相关分析与回归分析的关系联系:(1)共同的研究对象:都是对变量间相关关系的分析;共同的研究对象:都是对变量间相关关系的分析;(2)相关分析是回归分析的基础和前提。只有当变量间存在相关关只有当变量间存在相关关系时,用回归分析去寻求相关的具体数学形式才有实际意义;(系时,用回归分析去寻求相关的具体数学形式才有实际意义;(3 3)相关分析只表明变量间相关关系的性质和程度,要确定变量间相关相关分析只表明变量间相关关系的性质和程度,要确定变量间相关的具体数学形式依赖
10、于回归分析的具体数学形式依赖于回归分析区别:(1)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是,相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关系的具体形式,它对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学方程式,根据这个数学方程式可以从已知量来推测未知量,从而为估算和预测提供了一个重要的方法(2)相关分析可以不必确定变量中哪个是自变量,哪个是因变量,而回归分析则必须事先研究确定具有相关关系的变量中哪个为自变量,哪个为因变量。(3)相关分析所涉及的变
11、量可以都是随机变量。一般地说,回归分析中因变量是随机的,而把自变量作为研究时给定的非随机变量。第23页/共77页六、回归模型的类型一个自变量两个及两个以上自变量两个及两个以上自变量回归模型多元回归一元回归线性回归非线性回归线性回归非线性回归第24页/共77页102 简单线性相关与回归分析简单线性相关与回归分析一、简单线性相关系数及检验一、简单线性相关系数及检验二、总体回归函数与样本回归函数二、总体回归函数与样本回归函数三、回归系数的估计三、回归系数的估计四、简单线性回归模型的检验四、简单线性回归模型的检验 五、简单线性回归模型预测五、简单线性回归模型预测第25页/共77页一、简单线性相关系数及
12、检验一、简单线性相关系数及检验(一)相关系数的定义(一)相关系数的定义 单相关分析是对两个变量之间的线性相关程度进行分析。线性相关程度可用总体相关系数总体相关系数 特点:特点:对于特定的总体来说,总体相关系数是客观存在的特定数值,表现为一个常数。第26页/共77页 样本相关系数样本相关系数通常用 表示 特点:样本相关系数是根据从总体中抽取的随机样本 的观测值计算出来的,是对总体相关系数的估 计,它是个随机变量。第27页/共77页(二)相关系数的特点:o相关系数的取值在-1与1之间。o当r=0时,表明X与Y没有线性相关关系,但可能存在其他类型关系。o当 时,表明X与Y存在一定的线性相关关系:若
13、表明X与Y 为正相关 若 表明X与Y 为负相关。o当 时,表明X与Y完全线性相关:若r=1,称X与Y完全正相关;若r=-1,称X与Y完全负相关。第28页/共77页(三)相关系数的计算(三)相关系数的计算第29页/共77页序号序号能源消耗量(十万能源消耗量(十万吨)吨)x工业总产值(亿工业总产值(亿元)元)yx2y2xy12345678910111213141516353840424952545962646568697172762425242832313740414047504951485812251444160017642401270429163481384440964225462447615
14、04151845776576625576784102496113691600168116002209250024012601230433648409509601176156816121998236025422560305534003381362134564408合计合计916625550862617537887【例例】计算工业总产值与能源消耗量之间的相关系数计算工业总产值与能源消耗量之间的相关系数第30页/共77页结论:结论:工业总产值与能源消耗量之间存在高度的正相关关系,能源消耗量x的变化能够解释工业总产值y变化的95.2。第31页/共77页(四)使用相关系数的注意事项:X和Y 都是相互对称
15、的随机变量,所以相关系数只反映只反映变量间的线性相关程度,不 能说明非线性相关关系。相关系数不能确定变量的因果关系,也不能 说明相关关系具体接近于哪条直线。第32页/共77页(五)相关系数的检验 1.1.为什么要检验?为什么要检验?样本相关系数是随抽样而变动的随机变量,相关系数的统计显著性还有待检验。2.检验的依据:检验的依据:如果X和Y都服从正态分布,在总体相关系数 的假设下,可采用t检验来确定变量之间相关关系的显著性。与样本相关系数 r 有关的 t统计量服从自由度为n-2的 t 分布:第33页/共77页3.相关系数的检验方法相关系数的检验方法给定显著性水平 ,查自由度为 n-2 的临界值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 相关 回归 分析 检验
限制150内