统计学第十一章.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学第十一章.ppt》由会员分享,可在线阅读,更多相关《统计学第十一章.ppt(38页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第十一章第十一章 相关与回归分析相关与回归分析l变量间关系的度量变量间关系的度量l一元线性回归分析一元线性回归分析第一节第一节 变量间关系的度量变量间关系的度量l变量间的关系变量间的关系l相关关系的描述与测度相关关系的描述与测度一、变量间的关系一、变量间的关系l在生产经营活动中,我们经常要对在生产经营活动中,我们经常要对变量之间的关变量之间的关系系进行分析。进行分析。l比如,在企业生产中,我们要对影响生产成本的比如,在企业生产中,我们要对影响生产成本的各种因素进行分析,以达到控制成本的目的;在各种因素进行分析,以达到控制成本的目的;在农业生产中,我们需要研究农作物产量与施肥量农业生产中,我们需
2、要研究农作物产量与施肥量的关系,以便分析施肥量对产量的影响,进而确的关系,以便分析施肥量对产量的影响,进而确定合理的施肥量;商业活动中,我们需要分析广定合理的施肥量;商业活动中,我们需要分析广告费支出与销售量之间的关系,进而通过广告费告费支出与销售量之间的关系,进而通过广告费支出来预测销售量等。支出来预测销售量等。l变量之间的关系形态可分为两种类型:变量之间的关系形态可分为两种类型:函数关系函数关系和相关关系。和相关关系。我们比较熟悉的我们比较熟悉的一、变量间的关系一、变量间的关系l例:某种产品的销售额和销售量之间的例:某种产品的销售额和销售量之间的关系。设销售额为关系。设销售额为y,销售量为
3、,销售量为x,销售价,销售价格为格为p,则,则x与与y之间的关系可表示为之间的关系可表示为y=px。这就是说,在销售价格不变的情况下,对这就是说,在销售价格不变的情况下,对于该商品的某一销售量,总有一个销售额于该商品的某一销售量,总有一个销售额与之对应,即销售额完全由销售量所确定,与之对应,即销售额完全由销售量所确定,二者之间为二者之间为线性函数关系线性函数关系。l例:企业的原材料消耗额(例:企业的原材料消耗额(y)与产量)与产量(x1),单位产品消耗(),单位产品消耗(x2),原材料价格),原材料价格(x3)之间的关系可表示为)之间的关系可表示为y=x1x2x3。这里。这里的的y与与x1、x
4、2、x3之间是一种确定的函数关系,之间是一种确定的函数关系,但它们不是线性函数关系。但它们不是线性函数关系。函数关系是一一对应的确定关系。函数关系是一一对应的确定关系。l但实际问题中,变量之间的关系往往不那但实际问题中,变量之间的关系往往不那么简单。么简单。例如:我们考察例如:我们考察家庭储蓄与家庭收入家庭储蓄与家庭收入这两个变量,这两个变量,它们之间不存在完全确定的关系。它们之间不存在完全确定的关系。l定义:我们把变量之间存在的定义:我们把变量之间存在的不确定不确定的数量关系的数量关系称为称为相关关系相关关系。l例:从遗传学角度看,例:从遗传学角度看,子女的身高(子女的身高(y)与其父母的身
5、高(与其父母的身高(x)有很大关系)有很大关系。一般来说,父母身高较高时,其子女的身高通常也一般来说,父母身高较高时,其子女的身高通常也高,父母身高较低时,其子女的身高通常也较低。但实际高,父母身高较低时,其子女的身高通常也较低。但实际情况并不完全如此,因为它们之间不是完全确定的关系。情况并不完全如此,因为它们之间不是完全确定的关系。显然,子女的身高并不完全由父母身高一个因素所决定,显然,子女的身高并不完全由父母身高一个因素所决定,还还受其他许多因素的影响受其他许多因素的影响,因此,因此二者之间属于相关关系二者之间属于相关关系。总结:从上面的例子可以看出,总结:从上面的例子可以看出,相关关系的
6、特点是相关关系的特点是:一个变量的:一个变量的取值不能由另一个变量唯一确定,当变量取值不能由另一个变量唯一确定,当变量x取某个值时,变量取某个值时,变量y的的取值可能有几个。对这种关系不确定的变量显然不能用函数关系取值可能有几个。对这种关系不确定的变量显然不能用函数关系进行描述,但也不是无规律可循。进行描述,但也不是无规律可循。通过大量数据的观察与研究,我们会发现许多变量之间确定存在通过大量数据的观察与研究,我们会发现许多变量之间确定存在着一定的客观规律。如:平均来说,父母身高较高时,其子女的着一定的客观规律。如:平均来说,父母身高较高时,其子女的身高一般也较高;收入水平高的家庭,其家庭储蓄一
7、般也较多。身高一般也较高;收入水平高的家庭,其家庭储蓄一般也较多。l相关与回归分析相关与回归分析正是描述与探索这类变量正是描述与探索这类变量之间关系及其规律的统计方法。之间关系及其规律的统计方法。二、相关关系的描述与测度二、相关关系的描述与测度l(一)散点图(一)散点图l(二)相关系数(二)相关系数(一)散点图(一)散点图l相关分析就是对两个变量之间相关分析就是对两个变量之间线性线性关系的关系的描述与度量描述与度量。对于两个变量。对于两个变量x和和y,通过观,通过观察或试验我们可以得到若干组数据,记为察或试验我们可以得到若干组数据,记为(xi,yi)()(i=1,2,3)。)。l相关分析所要解
8、决的问题是,根据这些数相关分析所要解决的问题是,根据这些数据确定变量之间是否存在相关关系,如果据确定变量之间是否存在相关关系,如果存在的话,如何存在的话,如何描述出它们之间的关系描述出它们之间的关系并并对其对其关系强度关系强度进行测度。进行测度。l定义:用坐标的水平轴代表变量定义:用坐标的水平轴代表变量x x,纵轴,纵轴代表因变量代表因变量y y,每组数据(,每组数据(x xi i,y,yi i)在坐标)在坐标系中用一个点表示,系中用一个点表示,n n组数据在坐标系中形组数据在坐标系中形成的成的n n个点称为散点,由坐标及散点形成的个点称为散点,由坐标及散点形成的二维数据图称为二维数据图称为散
9、点图散点图。(e)非线性相关非线性相关(f)不相关不相关不同形态的散点图不同形态的散点图l例例:一家大型商业银行在多个地区设有分行一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例提高,这给银行业良贷款额也有较大比例提高,这给银行业务的发展带来压力。为弄清楚不良贷款形务的发展带来压力。为弄清楚不良贷款形成的原因,研究人员希望利用银行业务的成的原因,研究人员希望利用银行业务
10、的有关的有关数据作些定量分析,以便找出有关的有关数据作些定量分析,以便找出控制不良贷款的办法。下表是该银行所属控制不良贷款的办法。下表是该银行所属2525家分行家分行20022002年的有关业务数据。年的有关业务数据。某商业银行某商业银行2002年的主要业务数据年的主要业务数据研究人员想研究人员想知道,不良知道,不良贷款是否与贷款是否与与贷款余额、与贷款余额、应收贷款,应收贷款,贷款项目的贷款项目的多少、固定多少、固定资产投资等资产投资等因素有关?因素有关?是什么样的是什么样的关系?关系关系?关系强度如何?强度如何?l由散点图可以看出:不良贷款与贷款余额、由散点图可以看出:不良贷款与贷款余额、
11、应收贷款、贷款项目个数、固定资产投资应收贷款、贷款项目个数、固定资产投资额之间都具有一定的线性关系,但从各散额之间都具有一定的线性关系,但从各散点的分布情况看,与点的分布情况看,与贷款余额线性关系比贷款余额线性关系比较密切较密切,而,而与固定资产投资额关系最不密与固定资产投资额关系最不密切切。(二)相关系数(二)相关系数l通过散点图可以判断两个变量之间有无相通过散点图可以判断两个变量之间有无相关关系,并对变量间的关系形态作出大致关关系,并对变量间的关系形态作出大致描述,但描述,但散点图不能准确反映变量之间的散点图不能准确反映变量之间的关系密切程度关系密切程度。因此,为准确度量两个变。因此,为准
12、确度量两个变量之间的关系密切程度,需要计算相关系量之间的关系密切程度,需要计算相关系数。数。l定义定义3 3:根据样本数据计算的对两个变量之:根据样本数据计算的对两个变量之间线性关系强度的度量值,称为相关系数。间线性关系强度的度量值,称为相关系数。l若相关系数是根据总体全部数据计算的,若相关系数是根据总体全部数据计算的,称为总体相关系数,记为称为总体相关系数,记为;若是根据样;若是根据样本数据计算的,则称为样本相关系数,记本数据计算的,则称为样本相关系数,记为为r r。样本相关系数的计算公式为:。样本相关系数的计算公式为:l简化公式为:简化公式为:l例:根据表中数据,计算不良贷与贷款余例:根据
13、表中数据,计算不良贷与贷款余额之间的相关系数。额之间的相关系数。各相关系数的各数值说明了什么?各相关系数的各数值说明了什么?l可以证明:相关系数的取值范围在可以证明:相关系数的取值范围在+1-1之间,即之间,即-1r1。l若若0r1,x与与y之间存在正线性相关关系;之间存在正线性相关关系;l-1r0,x与与y之间存在负线性相关关系;之间存在负线性相关关系;lr=+1,表明表明x与与y之间为完全正线性相关关系;之间为完全正线性相关关系;r=-1,表明表明x与与y之间为完全负线性相关关系;之间为完全负线性相关关系;lr=0时,表示两个变量不存在线性相关关系。时,表示两个变量不存在线性相关关系。注:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第十一
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内