2022年薪酬设计回归分析.doc
《2022年薪酬设计回归分析.doc》由会员分享,可在线阅读,更多相关《2022年薪酬设计回归分析.doc(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、相关与回归分析第一节 简单线性相关分析 一、相关关系的概念与品种(一)相关关系的概念在自然界和人类社会中,普遍着存在现象之间的互相依赖、互相制约的关系。一些现象在数量上的开展变化经常伴随着另一些现象数量上的开展变化。现象间的数量关系可分为两种根本类型:函数关系。它是指现象间存在的严格依存的、确定的因果关系,一种现象的数量变化必定决定着另一种现象的数量变化,这种关系可通过精确的数学表达式来反映,比方,圆面积同其半径的关系为s=r2,自由落体落下的间隔同时间的关系为h=gt2,等等。相关关系。指的是现象之间确实存在着数量关系,但这种关系不是严格确定的,当一种现象的数量发生变化时,另一种现象的数量可
2、能在一定范围内发生变化,出现不同的数值。比方,单位产品本钱同产量之间的关系,一般说来,当工厂规模扩大,产品产量增加时,单位产品本钱会随之下降,这种变化趋势表达了规模经济的效应,具有客观性和普遍性。但由于妨碍产品本钱的要素众多,有主要的,也有次要的,有必定的,也有偶尔的,有随机的,也有非随机的,有观察得到的,也有观察不到的,等等。同一产量水平下,可能会出现各种各样的单位本钱,或者某一确定的单位本钱对应着不同的产量,两者的关系不是唯一确定的。粮食收获量与施肥量之间、商品价格与需求量之间、身高与体重之间等都具有类似的特征,这种关系确实是相关关系。函数关系与相关关系既有区别,又有联络。由于观察和实验中
3、的误差,函数关系往往通过相关关系表现出来;而当对现象之间的内在联络和规律性理解得更加清晰的时候,相关关系又可能转化为函数关系。在社会经济领域里,一般说来,函数关系反映了现象间关系的理想化状态,相关关系则反映了现象间关系的现实化状态,只有在大量观察时,在平均的意义上,它才能被描绘。综上所述,相关关系是现象之间确实存在的,但关系数值不固定的互相依存关系。相关分析则是研究一个变量与另一个变量或另一组变量之间相关亲密程度和相关方向的一种统计分析方法。(二)相关关系的品种现象之间的相关关系是非常复杂的,从不同的角度看,相关关系有不同的品种。1.固定相关和随机相关。按变量的性质(是否是随机变量),相关关系
4、可分固定相关和随机相关。固定相关是指一个随机变量与另一个或一组非随机变量之间的的相关关系。例如,农作物的施肥量是一个可操纵的变量,农作物收获量是一个不确定的变量,两个变量之间的关系表现为一个随机变量与另一个非随机变量之间的固定相关。随机相关是指一个随机变量与另一个或一组随机变量之间的相关关系。例如,大学生的身高和体重之间的关系确实是两个随机变量之间的随机相关关系,假如观察某一身高的一组学生时,其体重各不一样,会构成一个分布;假如观察某一体重的一组学生时,其身高也不一样并构成一个分布,两个变量均为随机变量。2.简单相关和多元相关。按变量的多少,相关关系可分为简单相关和多元相关。简单相关,又称单相
5、关,是指一个随机变量与另一个随机变量或非随机变量之间的相关关系;多元相关,又称复相关,是指一个随机变量与另一组随机变量或非随机变量之间的相关关系。按变量之间的相关方向不同,简单相关又可分为正相关和负相关。当自变量的值增加,因变量的值也相应地增加;自变量的值减少,因变量的值也随之减少时,如此的相关关系确实是正相关。反之,当自变量的值增加时,因变量的值随之减少;自变量的值减少时,因变量的值反而增加,具有这种特点的相关关系确实是负相关。多元相关可进一步分解为简单相关和偏相关。偏相关是指在测定一个随机变量与某个或某些随机变量或非随机变量之间的互相关系后,该随机变量与某一新增加的随机量或非随变量之间的相
6、关关系,又称之为净相关。3.线性相关和非线性相关。按变量之间的相关方式,相关关系可分为线性相关和非线性相关。假设一随机变量与另一个或一组随机变量或非随机变量之间的相关关系表现为线性组合时,则称它们之间的相关关系为线性相关。反之,假设一随机变量与另一个或一组随机变量或非随机变量之间的相关关系不能表现为线性组合,而只能表现为非线性组合时,则称它们之间的相关关系为非线性相关。4.完全相关、不完全相关和不相关。按变量之间的相关程度不同,相关关系可分为完全相关、不完全相关和不相关。假设一个变量的值完全由另一个或一组变量的值所决定,则称变量之间的这种相关关系为完全相关,即函数关系。假设一个变量的值与另一个
7、或一组变量的值有关,但其中要遭到随机要素的妨碍,则称变量之间的这种相关关系为不完全相关。假设一个变量的值完全不受另一个或一组变量值的妨碍,则称变量之间不相关。大量社会经济现象之间的相关关系都属于不完全相关,不完全相关是相关分析的根本内容。完全相关和不相关可视为相关关系中的特例。二、简单线性相关图表断定两变量之间的相关程度和相关方向是简单线性相关分析的重要内容之一。其最简单、最直观的方法确实是列相关表、绘制相关图。简单线性相关关系有固定简单线性相关与随机简单线性相关之分。简单线性相关图表可用于直观地说明这两类简单线性相关变量之间的相关程度和相关方向。(一)固定简单线性相关图表已经明白有两个变量,
8、设y是随机变量,x是非随机变量,对应于x的每一个给定的取值,y有多个可能的取值,但在一次试验中,y只取其中一个可能值。由于x是非随机变量,在实验中其取值能够操纵并重复进展,因而在n次试验中,x可能取n个一样或不同的值,相应地也有n个y的值,即得到一一对应的样本材料(x,y)。将这些数据按x的取值由小到大依次对应陈列,即构成固定简单线性相关表,又称之为一维相关表。例9.1 某地区居民人均收入水平(x)与其食品支出占生活费支出比重(y)之间具有相关关系,编制相关表如下(见表9-1):表9-1 一维相关表人均收入水平(元)x2803203905306506707908809101050食品支出占生活
9、费支出比重(%)y68.367.566.264.956.760.254.449.050.543.6从表9-1能够粗略看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重有下降的趋势。将一一对应的(x,y)描点于坐标系上,即构成散点图,又称相关图。在相关图上,以横轴表示非随机变量(x),以纵轴表示随机变量(y),通过观察各对变量值坐标点的分布情况,能够大致推断变量之间相关的形态、方向和亲密程度。利用表9-1材料,可绘制相关图如下(见图9-1):图9-1 居民人均收入水平与其食品支出的关系图从图9-1能够看出,随着居民人均收入水平的提高,食品支出占生活费支出的比重明显降低,并大致呈线性下降
10、趋势,即负线性相关。一些常见的相关分布状态可用下述各图表示(见图9-2): 较明显的线性正相关 较明显的线性负相关 不明显的线性负相关 不相关图9-2 几种常见的相关散点图(二)随机简单线性相关图表设x 、y为两个随机变量,将观测值(x,y)分组之后按顺序陈列,x从小到大陈列,y从大到小陈列,构成一棋盘式平衡表,称之为二维相关表。例9.2 某地区为研究降雨量和农作物平均每亩收获量的关系,从40个降雨量不同的试验田中获得40对数据。用x表示降雨量,y表示平均每亩收获量。据此可编出二维相关表如下(见表9-2)。该表中,中间每一格列出的是x、y的结合频数,它说明x和y同时取某值的次数;最后一列每一格
11、是每一行的结合频数的和,它说明y取某值的次数;最后一行每一格则是每一列的结合频数的和,它说明x取某值的次数。表9-2 二维相关表 降雨量(毫米)xi频数fij81012141618行和(fj)收获量(公斤)yj260121424022262202351112001363131801231601113列和(fi)3614115140从表9-2能够粗略看出,降雨量与收获量之间大致呈线性正相关关系。利用表9-2材料,可绘制相关图如下(见图9-3):图9-3 降雨量与收获量之间相关图三、简单相关系数(一)简单相关系数的意义简单线性相关图表尽管直观,但不能精确地描绘现象间的相关关系。测量两个变量之间线性
12、相关程度和相关方向的指标,称为简单相关系数。总体相关系数一般用R表示,定义式为 (式9.1)式中,和表示变量X和Y的标准差,对有限总体而言,其计算公式为 (式9.2) (式9.3)表示两个变量X和Y之间的协方差,计算公式为 (式9.4)这里,变量X和Y 为总体变量,N为总体单位数,和分别为变量X及Y的总体平均数,计算式为 (式9.5) (式9.6)要理解相关系数R的意义,首先要明确协方差和标准差、在反映变量之间相关关系中的作用。协方差反映了变量X和Y的共变性,能够显示两个变量的相关方向和相关关系的亲密程度,它可能出现以下几种情况:第一,所有相关点均为正相关,则 0,说明两个变量之间正线性相关。
13、第二,所有相关点均为负相关,则 0,说明两个变量之间负线性相关。第三,在全部相关点中,既有正相关、又有负相关和零相关,在计算协方差时就会出现正负抵销。抵销的结果如为正数则是正相关,如为负数则是负相关。数值大表示相关程度强,数值小则表示相关关系弱。假设正、负全部低销掉了,结果为零,则表示不相关。第三种情况是实际经济生活中最常见到的情况。此外,还有两种极端的情况:当所有相关点都是零相关时,抵销结果为零,表示两个变量完全没有相关关系。当所有相关点全部落在直线上时,表示两个变量完全线性相关,即存在函数关系。进一步,相关系数是一个界于+1和-1之间的数,即-1R1,假设R=1,说明两个变量之间存在完全正
14、线性相关;假设R=-1说明两个变量之间存在完全负线性相关;假设0 R 1,说明两个变量之间存在一定程度的正线性相关;假设-1 R 0,说明两个变量之间存在一定程度的负线性相关;假设R=0,说明两个变量之间没有线性相关关系。(二)简单相关系数的计算在实际工作中,总体相关系数R一般是未知的,往往需要用样本材料推断总体的相关情况,因而需要计算样本相关系数。1.固定简单线性相关系数的计算设x和y 为样本变量,其中y为随机变量,x为非随机变量, n为样本容量,、分别为变量x及y的样本平均数,、和分别表示变量x和y的样本标准差及它们之间的样本协方差,其计算为 (式9.7) (式9.8) (式9.9) (式
15、9.10) (式9.11)因而,就可得到与总体相关系数计算方式一样的样本相关系数(记为r)的公式 (式9.12)通过简单的推导,上式还可变化为下面易于计算的方式 (式9.13)依照表9-1的材料计算相关系数如表9-3所示:表9-3 固定简单线性相关系数计算表序号人均收入水平(元)x食品支出占生活费支出比重(%)yx2y2xy128068.3784004664.8919124232067.51024004556.2521600339066.21521004382.4425818453064.92809004212.0134397565056.74225003214.8936855667060.2
16、4489003624.0440334779054.46241002959.3642976888049.07744002401.0043120991050.58281002550.254595510105043.611025001900.9645780合计6470581.3481430034466.09355959将表9-3数字代入上述相关系数计算公式,得:= - 0.982.随机简单线性相关系数的计算假如x和y均为随机变量,计算样本相关系数的根本式仍为但由于存在结合频数(fij),其详细的计算略有变化,通过不复杂的类推可得下式(式9.14)依照表9-2材料计算相关系数,计算过程如表9-4、表9
17、-5、表9-6所示:表9-4 降雨量(x)数据的计算表降雨量(毫米)xifixi2xifixi2fi83642419210610060600121414416820161411196154215616525680128018132418324合计405046568表9-5 平均每亩收获量(y)数据的计算表平均每亩收获量(公斤)yjfjyj2yjfjyj2fj1603256004807680018033240054097200200134000026005200002201148400242053240024065760014403456002604676001040270400合计408520
18、1842400表9-6 平均每亩收获量(y)数据的计算表降雨量(毫米)xi平均每亩收获量(公斤)yjfij xiyjfij816011280818011440820011600101601160010200360001022024400121601192012180243201220061440012220379201224025760142003840014220515400142402672014260136401622013520162402768016260283201626014680合计40109000依照以上各表材料可得: = = 0.67四、相关系数的统计推断总体相关系数R一般
19、是未知的,能够计算出的只是样本相关系数r,r尽管能够提供关于总体相关程度与方向的某种信息,r愈大,在一定程度上说明总体相关程度愈高,但也可能犯错误。这就需要依照样本材料对总体相关系数R进展检验和可能。(一)关于总体相关系数R的检验由于相关系数r的分布复杂,不能直截了当利用它去进展统计推断,但假如设ZR= (式9.15)zr= (式9.16)能够证明,当样本(x,y)抽自正态分布总体时,zr近似服从平均值为ZR,方差为的正态分布,因而z=(zr-ZR) (式9.17)近似服从标准正态分布。据此能够检验H0:R=R0(R00)利用例9.1材料,计算的样本相关系数r=-0.98,是否能够认为总体相关
20、系数R=-0.90,统计假设为H0:R=-0.90H1:R-0.90如今,ZR=-1.472zr=-2.298因而,检验统计量z=(zr-ZR) =(-2.298+1.472) =-2.185当明显水平=5%时,查正态分布表可得,故否认H0,接受H1,即不能认为总体的相关系数R=-0.90。同理,也能够对总体相关系数进展单边检验。(二)关于总体相关系数R的区间可能首先,求出ZR的可能区间。假设与可能保证程度对应的概率度为Z,ZR的可能区间就为zr-ZR zr+关于例9.1,ZR的95%置信可能区间为-2.298-ZR-2.298+ 即 -3.039ZR-1.557依照ZR的置信区间,能够换算出
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022 年薪 设计 回归 分析
限制150内