第4讲相关分析优秀PPT.ppt
《第4讲相关分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第4讲相关分析优秀PPT.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、变量间的关系变量间的关系函数关系:函数关系:函数关系:函数关系:变量间有完全确定的关系,可用函数表变量间有完全确定的关系,可用函数表变量间有完全确定的关系,可用函数表变量间有完全确定的关系,可用函数表示。示。示。示。相关关系:相关关系:相关关系:相关关系:变量之间存在的一种不确定的数量关系,变量之间存在的一种不确定的数量关系,变量之间存在的一种不确定的数量关系,变量之间存在的一种不确定的数量关系,此关系此关系此关系此关系无法用确定的函数无法用确定的函数无法用确定的函数无法用确定的函数形式表示。形式表示。形式表示。形式表示。函数关系函数关系1.1.是一一对应的确定关系是一一对应的确定关系是一一对
2、应的确定关系是一一对应的确定关系2.2.设设设设有有有有两两两两个个个个变变变变量量量量 x x 和和和和 y y,变变变变量量量量 y y 随随随随变变变变量量量量 x x 一一一一起起起起变变变变更更更更,并并并并完完完完全全全全依依依依靠靠靠靠于于于于 x x,当当当当变变变变量量量量 x x 取取取取某某某某个个个个数数数数值值值值时时时时,y y 依依依依确确确确定定定定的的的的关关关关系系系系取取取取相相相相应应应应的的的的值值值值,则则则则称称称称 y y 是是是是 x x 的的的的函函函函数数数数,记记记记为为为为 y y=f f(x)(x),其其其其中中中中 x x 称为自变
3、量,称为自变量,称为自变量,称为自变量,y y 称为因变量称为因变量称为因变量称为因变量3.3.各观测点落在一条线上各观测点落在一条线上各观测点落在一条线上各观测点落在一条线上 x xy y函数关系函数关系(几个例子几个例子)函数关系的例子函数关系的例子函数关系的例子函数关系的例子某某某某种种种种商商商商品品品品的的的的销销销销售售售售额额额额(y y)与与与与销销销销售售售售量量量量(x x)之之之之间间间间的的的的关关关关系系系系可表示为可表示为可表示为可表示为 y=px (p p 为单价为单价为单价为单价)圆的面积圆的面积圆的面积圆的面积(S)(S)与半径之间的关系可表示为与半径之间的关
4、系可表示为与半径之间的关系可表示为与半径之间的关系可表示为S=R2 企企企企业业业业的的的的原原原原材材材材料料料料消消消消耗耗耗耗额额额额(y y)与与与与产产产产量量量量(x x1 1)、单单单单位位位位产产产产量量量量消消消消耗耗耗耗(x x2 2)、原原原原材材材材料料料料价价价价格格格格(x x3 3)之之之之间间间间的的的的关关关关系系系系可可可可表表表表示示示示为为为为y=x1 x2 x3 相关关系相关关系1.1.1.1.变变变变量量量量间间间间关关关关系系系系不不不不能能能能用用用用函函函函数数数数关关关关系精确表达系精确表达系精确表达系精确表达2.2.2.2.一一一一个个个个
5、变变变变量量量量的的的的取取取取值值值值不不不不能能能能由由由由另另另另一个变量唯一确定一个变量唯一确定一个变量唯一确定一个变量唯一确定3.3.3.3.当当当当变变变变量量量量x x x x取取取取某某某某个个个个值值值值时时时时,变变变变量量量量 y y y y 的取值可能有几个的取值可能有几个的取值可能有几个的取值可能有几个4.4.4.4.各观测点分布在直线四周各观测点分布在直线四周各观测点分布在直线四周各观测点分布在直线四周 x xy y相关关系相关关系(几个例子几个例子)相关关系的例子相关关系的例子父亲身高父亲身高(y)与子女身高与子女身高(x)之间的关系之间的关系收入水平收入水平(y
6、)与受教化程度与受教化程度(x)之间的关系之间的关系粮粮食食亩亩产产量量(y)与与施施肥肥量量(x1)、降降雨雨量量(x2)、温度、温度(x3)之间的关系之间的关系商商品品的的消消费费量量(y)与与居居民民收收入入(x)之之间间的的关关系系商商品品销销售售额额(y)与与广广告告费费支支出出(x)之之间间的的关关系系相关关系的描述与测度相关关系的描述与测度-散点图散点图 不相关不相关不相关不相关 负线性相关负线性相关负线性相关负线性相关 正线性相关正线性相关正线性相关正线性相关 非线性相关非线性相关非线性相关非线性相关 完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正
7、线性相关完全正线性相关完全正线性相关 什么是相关分析什么是相关分析用统计方法揭示变量之间是否存在相互关用统计方法揭示变量之间是否存在相互关系及如何将相关的亲密程度及相关的方向系及如何将相关的亲密程度及相关的方向描述出来描述出来 相关分析常用的方法:相关分析常用的方法:散点图散点图统计指标(相关系数)统计指标(相关系数)相像性或距离相像性或距离 怎样分析变量间的相关关系?怎样分析变量间的相关关系?分析变量之间的关系须要解决下面的问题分析变量之间的关系须要解决下面的问题变量之间是否存在关系?变量之间是否存在关系?假如存在,它们之间是什么样的关系?假如存在,它们之间是什么样的关系?变量之间的关系强度
8、如何?变量之间的关系强度如何?样样本本所所反反映映的的变变量量之之间间的的关关系系能能否否代代表表总总体体变量之间的关系?变量之间的关系?相关分析的分类相关分析的分类简洁相关分析简洁相关分析简洁相关分析简洁相关分析 探讨两个变量之间的关系探讨两个变量之间的关系探讨两个变量之间的关系探讨两个变量之间的关系复相关分析复相关分析复相关分析复相关分析探讨一个因变量与两个以上自变量之间的关系探讨一个因变量与两个以上自变量之间的关系探讨一个因变量与两个以上自变量之间的关系探讨一个因变量与两个以上自变量之间的关系 偏相关分析偏相关分析偏相关分析偏相关分析限制一个变量,探讨其他变量之间的关系限制一个变量,探讨
9、其他变量之间的关系限制一个变量,探讨其他变量之间的关系限制一个变量,探讨其他变量之间的关系 距离相关分析距离相关分析距离相关分析距离相关分析相像性或距离相像性或距离相像性或距离相像性或距离 三种相关分析对应着相应的相关系数三种相关分析对应着相应的相关系数简洁相关分析简洁相关分析PearsonPearson相关系数相关系数相关系数相关系数 测度两数值变量的线性相关性测度两数值变量的线性相关性测度两数值变量的线性相关性测度两数值变量的线性相关性 SpearmanSpearman等级相关系数等级相关系数等级相关系数等级相关系数 测度两依次变量的相关性测度两依次变量的相关性测度两依次变量的相关性测度两
10、依次变量的相关性 (非参数方法)(非参数方法)(非参数方法)(非参数方法)Kendalls tau-bKendalls tau-b相关系数相关系数相关系数相关系数测度两依次变量的相关性测度两依次变量的相关性测度两依次变量的相关性测度两依次变量的相关性 (非参数方法)(非参数方法)(非参数方法)(非参数方法)数学家的年工资额问题数学家的年工资额问题 某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事数学探讨工作的中等或较高水平的数学家的年工资额作的中等或较高水平的数学家的年工资额作的中等或
11、较高水平的数学家的年工资额作的中等或较高水平的数学家的年工资额y y y y与他们与他们与他们与他们的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标x1x1x1x1,从事,从事,从事,从事探讨工作的时间探讨工作的时间探讨工作的时间探讨工作的时间x2x2x2x2以及能成功获得资助的指标以及能成功获得资助的指标以及能成功获得资助的指标以及能成功获得资助的指标x3x3x3x3之间的关系,为此按确定的试验设计方法调查了之间的关系,为此按确定的试验设计方法调查了之间的关系,为此按确定的试验设计方法调查了之间的关系,为
12、此按确定的试验设计方法调查了24242424位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量度量变量之间线性关系强度的一个统计量若若若若相相相相关关关关系系系系数数数数是是是是依依依依据据据据总总总总体体体体全全全全部部部部数数数数据据据据计计计计算算算算的的的的,称称称称为为为为总总总总体体体体相相相相关关关关系数,记为系数,记为系数,记为系数,记为 若若若若是是是是依依依依
13、据据据据样样样样本本本本数数数数据据据据计计计计算算算算的的的的,则则则则称称称称为为为为样样样样本本本本相相相相关关关关系系系系数数数数,简简简简称称称称为相关系数,记为为相关系数,记为为相关系数,记为为相关系数,记为 r r r r是一种简洁相关系数是一种简洁相关系数是一种简洁相关系数是一种简洁相关系数样本相关系数的计算公式样本相关系数的计算公式样本相关系数的计算公式样本相关系数的计算公式 PearsonPearson相关系数(含义)相关系数(含义)PearsonPearson相关系数相关系数(取值及其意义取值及其意义)-1.0+1.00-0.5+0.5完全负相关完全负相关完全负相关完全负
14、相关无线性相关无线性相关无线性相关无线性相关完全正相关完全正相关完全正相关完全正相关负相关程度增加负相关程度增加负相关程度增加负相关程度增加r正相关程度增加正相关程度增加正相关程度增加正相关程度增加PearsonPearson相关系数相关系数(取值及其意义取值及其意义)1.1.r r 的取值范围是的取值范围是的取值范围是的取值范围是-1,1-1,12.2.|r|=1|r|=1,为完全相关,为完全相关,为完全相关,为完全相关3.3.r=1r=1,为完全正相关,为完全正相关,为完全正相关,为完全正相关4.4.r=-1r=-1,为完全负正相关,为完全负正相关,为完全负正相关,为完全负正相关5.5.r
15、=0 r=0,不存在线性,不存在线性,不存在线性,不存在线性 相关关系相关关系相关关系相关关系6.6.-1-1 r0r0,为负相关,为负相关,为负相关,为负相关7.7.0r 0r 1 1,为正相关,为正相关,为正相关,为正相关8.8.|r|r|越越越越趋趋趋趋于于于于1 1表表表表示示示示关关关关系系系系越越越越亲亲亲亲密密密密;|r|r|越越越越趋趋趋趋于于于于0 0表表表表示示示示关关关关系越不亲密系越不亲密系越不亲密系越不亲密PearsonPearson相关系数(相关程度)相关系数(相关程度)高度高度线性相关线性相关显著显著线性相关线性相关低度低度线性相关线性相关非线性非线性相关相关Pe
16、arsonPearson相关系数的检验相关系数的检验假设形式假设形式假设形式假设形式 H0:=0 H0:=0,H1:0 H1:0检验的统计量检验的统计量检验的统计量检验的统计量在两随机变量在两随机变量在两随机变量在两随机变量X X和和和和Y Y听从正态分布及原假设为真时,统计量听从正态分布及原假设为真时,统计量听从正态分布及原假设为真时,统计量听从正态分布及原假设为真时,统计量tt(n-2)tt(n-2)决策规则决策规则决策规则决策规则当当当当 (或或或或p)p)时拒绝原假设,表明样本相关系数时拒绝原假设,表明样本相关系数时拒绝原假设,表明样本相关系数时拒绝原假设,表明样本相关系数r r是显著
17、的是显著的是显著的是显著的 ;否则表明;否则表明;否则表明;否则表明r r在统计上是不显著的,两总体不存在显著的相关在统计上是不显著的,两总体不存在显著的相关在统计上是不显著的,两总体不存在显著的相关在统计上是不显著的,两总体不存在显著的相关关系。关系。关系。关系。SPSSSPSS中中PearsonPearson相关系数的计算相关系数的计算SPSSANALYZECorrelateBivariate数学家的年工资额问题数学家的年工资额问题 某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事数学探讨工某科学基金会的管理人员欲分析从事
18、数学探讨工作的中等或较高水平的数学家的年工资额作的中等或较高水平的数学家的年工资额作的中等或较高水平的数学家的年工资额作的中等或较高水平的数学家的年工资额y y y y与他们与他们与他们与他们的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标的探讨成果(论文、著作)的质量指标x1x1x1x1,从事,从事,从事,从事探讨工作的时间探讨工作的时间探讨工作的时间探讨工作的时间x2x2x2x2以及能成功获得资助的指标以及能成功获得资助的指标以及能成功获得资助的指标以及能成功获得资助的指标x3x3x3x3之间的关系,为此按确定的试验设计方法调查了之间的
19、关系,为此按确定的试验设计方法调查了之间的关系,为此按确定的试验设计方法调查了之间的关系,为此按确定的试验设计方法调查了24242424位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。位此类型的数学家。请分析变量间的相关性。SPSSSPSS中中PearsonPearson相关系数的输出结果相关系数的输出结果申请打字人员的口试与实际操作的相关关系申请打字人员的口试与实际操作的相关关系 有一家公司聘请打字员,接受口试与实际操作两有一家公司聘请打字员,接受口试与实际操作两种考核方式。现有种考核方式。现有6 6个申请人的口试与实际
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 相关 分析 优秀 PPT
限制150内