经济应用统计学第七章相关与回归分析优秀PPT.ppt
《经济应用统计学第七章相关与回归分析优秀PPT.ppt》由会员分享,可在线阅读,更多相关《经济应用统计学第七章相关与回归分析优秀PPT.ppt(127页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经济应用统计学第七章相关与回归分析现在学习的是第1页,共127页 学习目标l能够正确判断客观现象之间存在的关系及其密切程度l要正确掌握回归分析的概念及回归模型的确定方法现在学习的是第2页,共127页 主要内容l相关分析的一般问题l定性数据的相关分析l定量数据的相关分析l一元线性回归分析l多元线性回归分析l曲线回归分析现在学习的是第3页,共127页第一节 相关分析的一般问题河北大学统计学系现在学习的是第4页,共127页第一节 相关分析的一般问题相关分析的概念相关分析的概念相关分析的主要内容相关分析的主要内容相关分析的种类和特点相关分析的种类和特点相关分析的方法选择相关分析的方法选择现在学习的是第
2、5页,共127页一、相关分析的概念相关分析是研究一个变量与另一个相关分析是研究一个变量与另一个变量或另一组变量之间相互关系密变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析切程度和相关方向的一种统计分析方法方法.yx现在学习的是第6页,共127页现象间存在普遍的联系与相互影响现象间存在普遍的联系与相互影响受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率事物间的这种依存关系可以用数量关事物间的这种依存关系可以用数量关系表现出来系表现出来.有两种类型有两种类型:相关关系(非确定性依存关系)函数关系(确定性依存关系)现在学习的是第7页,共1
3、27页1、函数关系 变量间存在完全对应的相互依存关系.当自变量的值确定时,因变量就有一个完全确定的值和它相对应.销售额与销售量:销售额与销售量:销售额销售额=销售量销售量 单价单价确定性关系确定性关系函数关系函数关系现在学习的是第8页,共127页2、相关关系 变量间客观存在的,在数量变化上受随机因素影响的、不严格、不确定的相互依存关系。家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。非确定性关系现在学习的是第9页,共127页自变量自变量因变量因变量有时现象之间自变量和因变量的确定要根据研究的目的在具有相关关系的现象或变量中在具有相关关系的现象或变量中,作为变化根据的变量作为变化根据的变量产生
4、相应变化的变量产生相应变化的变量现在学习的是第10页,共127页二、相关分析的主要内容确定现象间有无依存关系确定相关关系的表现形式是什么确定相关关系的表现形式是什么判定相关关系的密切程度与方向判定相关关系的密切程度与方向 如有 曲线还是直线所谓相关分析,是指对变量之间的相关关系的表所谓相关分析,是指对变量之间的相关关系的表现形式、密切程度和变化方向进行分析和研究。现形式、密切程度和变化方向进行分析和研究。现在学习的是第11页,共127页三、相关关系的种类l确定的因果的关系l分不清因果的依存关系 1、依存关系特点的不同自变量与因变量不能换位置自变量与因变量可以相互转化如:施肥量(自变量)与粮食产
5、量(因变量)如:销售量与销售价格现在学习的是第12页,共127页2.依相关关系的密切程度不完全相关完全相关不相关即函数关系即函数关系我们研究的主要是这种关系我们研究的主要是这种关系现在学习的是第13页,共127页负相关正相关3.依相关关系的方向自变量与因变量变化方自变量与因变量变化方向一致向一致自变量与因变量变自变量与因变量变化方向相反化方向相反现在学习的是第14页,共127页曲线相关直线(线性)相关4.依相关关系的表现形式xyxy现在学习的是第15页,共127页复相关单相关5.依涉及变量的多少一个自变量与一个因变量一个自变量与一个因变量如如:学习时间与成绩学习时间与成绩多个自变量与一个因变量
6、多个自变量与一个因变量如如:粮食产量与施肥量、降水量粮食产量与施肥量、降水量现在学习的是第16页,共127页四、相关分析的特点l相关关系研究的两个变量是对等的l两个变量之间只能计算出一个反映相互关系密切程度的相关系数,改变自变量与因变量的位置,不改变数值l相关分析中两个变量均为随机变量对于简单直线相关现在学习的是第17页,共127页 五、相关分析的方法选择交互列表法交互列表法 检验法检验法品质相关系数分析法品质相关系数分析法 相关表相关表相关图相关图相关系数相关系数数据定比数据定比数据定距数据定距数据定序数据定序数据定量数据定量数据定性数据定性数据定类数据定类数据等级相关系数分析法等级相关系数
7、分析法 列联表分析法现在学习的是第18页,共127页第二节 定性数据的相关分析河北大学统计学系现在学习的是第19页,共127页 交互列表分析法1.确定项目(变量名称)如:态度2.确定类目(变量表现)如:喜欢、一般、不喜欢3.排列形成交互列表 如:调查各地240人对某电视剧的态度,结果为3*3交互列表编制交互列表现在学习的是第20页,共127页 交互列表分析法行边缘频数列边缘频数条件频数不能直接对比分析不能直接对比分析态 度喜 欢一 般不喜欢合 计城市 北京 上海 重庆 合计 40 30 20 90 20 30 30 80 40 20 10 70 100 80 60 240现在学习的是第21页,
8、共127页 交互列表分析法l行频率Hi:各行条件频数比上行边缘频数l列频率Lj:各列条件频数比上列边缘频数l总频率Pij:各条件频数比上总合计数计算三种频率现在学习的是第22页,共127页 交互列表分析法城市 北京 上海 重庆 合计%40/90 30/90 20/90 100 20/80 30/80 30/80 100 40/70 20/70 10/70 100 100 80 60 240态 度喜 欢%一 般%不喜欢%样本量行频率分布表现在学习的是第23页,共127页 交互列表分析法城市 北京 上海 重庆 合计%44.4 33.3 22.2 100 25.0 37.5 37.5 100 57.
9、1 28.6 14.3 100 100 80 60 240态 度喜 欢%一 般%不喜欢%样本量行频率分布表样本量不同现在学习的是第24页,共127页 交互列表分析法城市 北京 上海 重庆 0.44 0.41 0.37 0.25 0.47 0.625 0.57 0.36 0.238态 度喜 欢%一 般%不喜欢%计算标准行频率分布表行频率除以相应的样本量现在学习的是第25页,共127页 对交互列表中的变量关系进行检验,运用 统计量进行 检验,以证明是否该样本所体现的变量关系在总体中也存在。检验每个结点上的观察频数每个结点上对应的期望频率行边缘频数列边缘频数样本量 现在学习的是第26页,共127页
10、检验城市 北京 上海 重庆 合计 90 80 70 100 80 60 240态 度喜 欢一 般不喜欢合 计行边缘频数列边缘频数条件频数=90*100/240=38=80*60/240=20对上例计算期望频数383329302723222018现在学习的是第27页,共127页建立假设H0:变量不相关(态度与城市独立)H1:变量相关计算统计量查分布表查表的临界值,若显著水平为0.05,查表得比较决策 则拒绝原假设,否则接受原假设18.749.448,拒绝原假设,认为相关检验步骤 检验现在学习的是第28页,共127页 检验虽然可以判断变量间是否相关,但无法判断相关程度的强弱。测定定性变量之间相关程
11、度用相关系数,有 系数、系数、系数、系数。品质相关系数现在学习的是第29页,共127页 品质相关系数 系数主要用于描述22交互列表中各定类变量间的相关程度对于rc交互列表(r或c大于2),则注:正负号没有含义现在学习的是第30页,共127页 品质相关系数 系数主要用于描述大于22交互列表中各定类变量间的相关程度局限性:大小受行数与列数的影响,且随行数和列数的增加而增大,因此只有当两个交互列表的行数与列数相同时,才能直接比较。现在学习的是第31页,共127页 品质相关系数 系数现在学习的是第32页,共127页 品质相关系数 系数现在学习的是第33页,共127页 等级相关系数用来描述两个定序变量或
12、等级序列之间的相关程度。最常用的为斯皮尔曼等级相关系数:注:正负号有含义现在学习的是第34页,共127页l计算过程:1、对所取得的相关数据资料进行排序 2、计算斯皮尔曼等级相关系数 3、对计算结果进行显著性检验 等级相关系数现在学习的是第35页,共127页第三节 定量数据的相关分析河北大学统计学系现在学习的是第36页,共127页 一、相关表 表现现象之间相关关系的一种统计表。一般以x为自变量,y为因变量,在表格中一一对应地排列。可以初步反映相关关系的形式、密切程度和相关方向。可分为简单相关表和分组相关表两种。现在学习的是第37页,共127页1、简单相关表生产性固定资产与工业总产值的相关表企业编
13、号 生产性固定资产总值x 工业总产值y12345678910446778910101116212626313130373841现在学习的是第38页,共127页2、分组相关表单变量分组表按自变量分组,计算各组中的次按自变量分组,计算各组中的次数与因变量的组平均数。数与因变量的组平均数。现在学习的是第39页,共127页单变量分组表工人看管织机台数x 工人数f 时劳动生产率y5-77-99-1111-1313-1515-1717-19913202931324015182326333842只按自变量分组,未按因变量分组只按自变量分组,未按因变量分组现在学习的是第40页,共127页l对自变量、因变量都进
14、行分组,交叉列表,并列出两种变量的共同次数。又称棋盘式相关表。2、分组相关表双变量分组表现在学习的是第41页,共127页分组相关表双变量分组表木材运量木材运量x1-11 11-21 21-31 31-41 41-51 合计合计运材成本运材成本y16-2111-161-11合计合计2571337437112 11313824现在学习的是第42页,共127页二、相关图 又称散点图,横轴为自变量,纵轴为因变量将对应的变量值用坐标点描绘出来。可以判断两变量之间有无相关关系,方向和程度如何。现在学习的是第43页,共127页1、线性强正相关xy现在学习的是第44页,共127页2、线性弱正相关xy现在学习的
15、是第45页,共127页3、线性强负相关xy现在学习的是第46页,共127页4、线性弱负相关xy现在学习的是第47页,共127页5、非线性相关(曲线相关)xy现在学习的是第48页,共127页6、不相关xy现在学习的是第49页,共127页三、相关系数 反映两变量之间直线相关关系密切程度的统计分析指标。现在学习的是第50页,共127页相关系数由何而来协方差协方差(covariance):两个变量与其均:两个变量与其均值离差乘积的平均数,是相关关系的一种值离差乘积的平均数,是相关关系的一种度量。度量。总体协方差:总体协方差:现在学习的是第51页,共127页对协方差的理解对协方差的理解为正为正为负为负为
16、正为正为负为负协方差为大的正值时,表协方差为大的正值时,表示强的正线性相关关系。示强的正线性相关关系。现在学习的是第52页,共127页对协方差的理解对协方差的理解协方差接近于零时,表示很协方差接近于零时,表示很小或没有线性相关关系。小或没有线性相关关系。现在学习的是第53页,共127页对协方差的理解对协方差的理解协方差为大的负值时,表协方差为大的负值时,表示强的负线性相关关系。示强的负线性相关关系。现在学习的是第54页,共127页协方差为大的正值时,表示强协方差为大的正值时,表示强的正线性相关关系。的正线性相关关系。协方差接近于零时,表示协方差接近于零时,表示很小或没有线性相关关系。很小或没有
17、线性相关关系。协方差为大的负值时,表协方差为大的负值时,表示强的负线性相关关系。示强的负线性相关关系。似乎是似乎是这样这样cmkgmmkg大大于于基本结论:协方差受计量单位影响,从基本结论:协方差受计量单位影响,从而不能真实反映相关的程度。而不能真实反映相关的程度。现在学习的是第55页,共127页cmkgmmkgcmmmkgkg可比现在学习的是第56页,共127页相关系数的计算相关系数:协方差与自变量、因变量标准差乘积的对比值。l其值在-和之间,正值为正相关,负值为负相关。l其绝对值接近为不相关l其绝对值在.和.左右为低度相关l其绝对值在.左右为中度相关l其绝对值在.以上为高度相关现在学习的是
18、第57页,共127页积差法但此公式需要先有各变量的平均值,当均值计算中有保留时,计算结果将会有误差。影响准确性。约掉共因子约掉共因子/n/n 后后现在学习的是第58页,共127页进一步推导进一步推导现在学习的是第59页,共127页同理现在学习的是第60页,共127页积差法积差法简捷法简捷法现在学习的是第61页,共127页例题人均销售额x 利润额y x2 y2 xy 6581476337合计5012.610.418.53.08.116.312.36.26.616.8110.836256411649369949294158.76108.06342.259.0065.61265.69151.2938
19、.4443.56282.241465.0075.052.0148.03.032.4114.173.818.619.8117.6654.9现在学习的是第62页,共127页对分组资料计算加权相关系数简捷法简捷法积差法积差法现在学习的是第63页,共127页相关系数的显著性检验现在学习的是第64页,共127页第四节 一元线性回归分析河北大学统计学系现在学习的是第65页,共127页一、一元线性回归分析的概念和特点 概念:把两个或两个以上变量之间的相关关系加以模型化,求出回归方程,并据以进行估计推算,这种方法在统计学中成为回归分析。现在学习的是第66页,共127页回归回归分析分析分类分类按自变量个数分按自
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 应用 统计学 第七 相关 回归 分析 优秀 PPT
限制150内