经济应用统计学第七章相关与回归分析精选PPT.ppt
《经济应用统计学第七章相关与回归分析精选PPT.ppt》由会员分享,可在线阅读,更多相关《经济应用统计学第七章相关与回归分析精选PPT.ppt(127页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经济应用统计学第七章相关与回归分析第1页,此课件共127页哦 学习目标l能够正确判断客观现象之间存在的关系及其密切程度l要正确掌握回归分析的概念及回归模型的确定方法第2页,此课件共127页哦 主要内容l相关分析的一般问题l定性数据的相关分析l定量数据的相关分析l一元线性回归分析l多元线性回归分析l曲线回归分析第3页,此课件共127页哦第一节 相关分析的一般问题河北大学统计学系第4页,此课件共127页哦第一节 相关分析的一般问题相关分析的概念相关分析的概念相关分析的主要内容相关分析的主要内容相关分析的种类和特点相关分析的种类和特点相关分析的方法选择相关分析的方法选择第5页,此课件共127页哦一、
2、相关分析的概念相关分析是研究一个变量与另一个相关分析是研究一个变量与另一个变量或另一组变量之间相互关系密变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析切程度和相关方向的一种统计分析方法方法.yx第6页,此课件共127页哦现象间存在普遍的联系与相互影响现象间存在普遍的联系与相互影响受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率事物间的这种依存关系可以用数量关事物间的这种依存关系可以用数量关系表现出来系表现出来.有两种类型有两种类型:相关关系(非确定性依存关系)函数关系(确定性依存关系)第7页,此课件共127页哦1、函数关系 变量间存
3、在完全对应的相互依存关系.当自变量的值确定时,因变量就有一个完全确定的值和它相对应.销售额与销售量:销售额与销售量:销售额销售额=销售量销售量 单价单价确定性关系确定性关系函数关系函数关系第8页,此课件共127页哦2、相关关系 变量间客观存在的,在数量变化上受随机因素影响的、不严格、不确定的相互依存关系。家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。非确定性关系第9页,此课件共127页哦自变量自变量因变量因变量有时现象之间自变量和因变量的确定要根据研究的目的在具有相关关系的现象或变量中在具有相关关系的现象或变量中,作为变化根据的变量作为变化根据的变量产生相应变化的变量产生相应变化的变量第1
4、0页,此课件共127页哦二、相关分析的主要内容确定现象间有无依存关系确定相关关系的表现形式是什么确定相关关系的表现形式是什么判定相关关系的密切程度与方向判定相关关系的密切程度与方向 如有 曲线还是直线所谓相关分析,是指对变量之间的相关关系的表现所谓相关分析,是指对变量之间的相关关系的表现形式、密切程度和变化方向进行分析和研究。形式、密切程度和变化方向进行分析和研究。第11页,此课件共127页哦三、相关关系的种类l确定的因果的关系l分不清因果的依存关系 1、依存关系特点的不同自变量与因变量不能换位置自变量与因变量可以相互转化如:施肥量(自变量)与粮食产量(因变量)如:销售量与销售价格第12页,此
5、课件共127页哦2.依相关关系的密切程度不完全相关完全相关不相关即函数关系即函数关系我们研究的主要是这种关系我们研究的主要是这种关系第13页,此课件共127页哦负相关正相关3.依相关关系的方向自变量与因变量变化方自变量与因变量变化方向一致向一致自变量与因变量变化自变量与因变量变化方向相反方向相反第14页,此课件共127页哦曲线相关直线(线性)相关4.依相关关系的表现形式xyxy第15页,此课件共127页哦复相关单相关5.依涉及变量的多少一个自变量与一个因变量一个自变量与一个因变量如如:学习时间与成绩学习时间与成绩多个自变量与一个因变量多个自变量与一个因变量如如:粮食产量与施肥量、降水量粮食产量
6、与施肥量、降水量第16页,此课件共127页哦四、相关分析的特点l相关关系研究的两个变量是对等的l两个变量之间只能计算出一个反映相互关系密切程度的相关系数,改变自变量与因变量的位置,不改变数值l相关分析中两个变量均为随机变量对于简单直线相关第17页,此课件共127页哦 五、相关分析的方法选择交互列表法交互列表法 检验法检验法品质相关系数分析法品质相关系数分析法 相关表相关表相关图相关图相关系数相关系数数据定比数据定比数据定距数据定距数据定序数据定序数据定量数据定量数据定性数据定性数据定类数据定类数据等级相关系数分析法等级相关系数分析法 列联表分析法第18页,此课件共127页哦第二节 定性数据的相
7、关分析河北大学统计学系第19页,此课件共127页哦 交互列表分析法1.确定项目(变量名称)如:态度2.确定类目(变量表现)如:喜欢、一般、不喜欢3.排列形成交互列表 如:调查各地240人对某电视剧的态度,结果为3*3交互列表编制交互列表第20页,此课件共127页哦 交互列表分析法行边缘频数列边缘频数条件频数不能直接对比分析不能直接对比分析态 度喜 欢一 般不喜欢合 计城市 北京 上海 重庆 合计 40 30 20 90 20 30 30 80 40 20 10 70 100 80 60 240第21页,此课件共127页哦 交互列表分析法l行频率Hi:各行条件频数比上行边缘频数l列频率Lj:各列
8、条件频数比上列边缘频数l总频率Pij:各条件频数比上总合计数计算三种频率第22页,此课件共127页哦 交互列表分析法城市 北京 上海 重庆 合计%40/90 30/90 20/90 100 20/80 30/80 30/80 100 40/70 20/70 10/70 100 100 80 60 240态 度喜 欢%一 般%不喜欢%样本量行频率分布表第23页,此课件共127页哦 交互列表分析法城市 北京 上海 重庆 合计%44.4 33.3 22.2 100 25.0 37.5 37.5 100 57.1 28.6 14.3 100 100 80 60 240态 度喜 欢%一 般%不喜欢%样本
9、量行频率分布表样本量不同第24页,此课件共127页哦 交互列表分析法城市 北京 上海 重庆 0.44 0.41 0.37 0.25 0.47 0.625 0.57 0.36 0.238态 度喜 欢%一 般%不喜欢%计算标准行频率分布表行频率除以相应的样本量第25页,此课件共127页哦 对交互列表中的变量关系进行检验,运用 统计量进行 检验,以证明是否该样本所体现的变量关系在总体中也存在。检验每个结点上的观察频数每个结点上对应的期望频率行边缘频数列边缘频数样本量 第26页,此课件共127页哦 检验城市 北京 上海 重庆 合计 90 80 70 100 80 60 240态 度喜 欢一 般不喜欢合
10、 计行边缘频数列边缘频数条件频数=90*100/240=38=80*60/240=20对上例计算期望频数383329302723222018第27页,此课件共127页哦建立假设H0:变量不相关(态度与城市独立)H1:变量相关计算统计量查分布表查表的临界值,若显著水平为0.05,查表得比较决策 则拒绝原假设,否则接受原假设18.749.448,拒绝原假设,认为相关检验步骤 检验第28页,此课件共127页哦 检验虽然可以判断变量间是否相关,但无法判断相关程度的强弱。测定定性变量之间相关程度用相关系数,有 系数、系数、系数、系数。品质相关系数第29页,此课件共127页哦 品质相关系数 系数主要用于描
11、述22交互列表中各定类变量间的相关程度对于rc交互列表(r或c大于2),则注:正负号没有含义第30页,此课件共127页哦 品质相关系数 系数主要用于描述大于22交互列表中各定类变量间的相关程度局限性:大小受行数与列数的影响,且随行数和列数的增加而增大,因此只有当两个交互列表的行数与列数相同时,才能直接比较。第31页,此课件共127页哦 品质相关系数 系数第32页,此课件共127页哦 品质相关系数 系数第33页,此课件共127页哦 等级相关系数用来描述两个定序变量或等级序列之间的相关程度。最常用的为斯皮尔曼等级相关系数:注:正负号有含义第34页,此课件共127页哦l计算过程:1、对所取得的相关数
12、据资料进行排序 2、计算斯皮尔曼等级相关系数 3、对计算结果进行显著性检验 等级相关系数第35页,此课件共127页哦第三节 定量数据的相关分析河北大学统计学系第36页,此课件共127页哦 一、相关表 表现现象之间相关关系的一种统计表。一般以x为自变量,y为因变量,在表格中一一对应地排列。可以初步反映相关关系的形式、密切程度和相关方向。可分为简单相关表和分组相关表两种。第37页,此课件共127页哦1、简单相关表生产性固定资产与工业总产值的相关表企业编号 生产性固定资产总值x 工业总产值y12345678910446778910101116212626313130373841第38页,此课件共12
13、7页哦2、分组相关表单变量分组表按自变量分组,计算各组中的按自变量分组,计算各组中的次数与因变量的组平均数。次数与因变量的组平均数。第39页,此课件共127页哦单变量分组表工人看管织机台数x 工人数f 时劳动生产率y5-77-99-1111-1313-1515-1717-19913202931324015182326333842只按自变量分组,未按因变量分组只按自变量分组,未按因变量分组第40页,此课件共127页哦l对自变量、因变量都进行分组,交叉列表,并列出两种变量的共同次数。又称棋盘式相关表。2、分组相关表双变量分组表第41页,此课件共127页哦分组相关表双变量分组表木材运量木材运量x1-
14、11 11-21 21-31 31-41 41-51 合计合计运材成本运材成本y16-2111-161-11合计合计2571337437112 11313824第42页,此课件共127页哦二、相关图 又称散点图,横轴为自变量,纵轴为因变量将对应的变量值用坐标点描绘出来。可以判断两变量之间有无相关关系,方向和程度如何。第43页,此课件共127页哦1、线性强正相关xy第44页,此课件共127页哦2、线性弱正相关xy第45页,此课件共127页哦3、线性强负相关xy第46页,此课件共127页哦4、线性弱负相关xy第47页,此课件共127页哦5、非线性相关(曲线相关)xy第48页,此课件共127页哦6、
15、不相关xy第49页,此课件共127页哦三、相关系数 反映两变量之间直线相关关系密切程度的统计分析指标。第50页,此课件共127页哦相关系数由何而来协方差协方差(covariance):两个变量与其均:两个变量与其均值离差乘积的平均数,是相关关系的一种值离差乘积的平均数,是相关关系的一种度量。度量。总体协方差:总体协方差:第51页,此课件共127页哦对协方差的理解对协方差的理解为正为正为负为负为正为正为负为负协方差为大的正值时,表协方差为大的正值时,表示强的正线性相关关系。示强的正线性相关关系。第52页,此课件共127页哦对协方差的理解对协方差的理解协方差接近于零时,表示很小协方差接近于零时,表
16、示很小或没有线性相关关系。或没有线性相关关系。第53页,此课件共127页哦对协方差的理解对协方差的理解协方差为大的负值时,表协方差为大的负值时,表示强的负线性相关关系。示强的负线性相关关系。第54页,此课件共127页哦协方差为大的正值时,表示强协方差为大的正值时,表示强的正线性相关关系。的正线性相关关系。协方差接近于零时,表示很协方差接近于零时,表示很小或没有线性相关关系。小或没有线性相关关系。协方差为大的负值时,表示强协方差为大的负值时,表示强的负线性相关关系。的负线性相关关系。似乎是似乎是这样这样cmkgmmkg大大于于基本结论:协方差受计量单位影响,从基本结论:协方差受计量单位影响,从而
17、不能真实反映相关的程度。而不能真实反映相关的程度。第55页,此课件共127页哦cmkgmmkgcmmmkgkg可比第56页,此课件共127页哦相关系数的计算相关系数:协方差与自变量、因变量标准差乘积的对比值。l其值在-和之间,正值为正相关,负值为负相关。l其绝对值接近为不相关l其绝对值在.和.左右为低度相关l其绝对值在.左右为中度相关l其绝对值在.以上为高度相关第57页,此课件共127页哦积差法但此公式需要先有各变量的平均值,当均值计算中有保留时,计算结果将会有误差。影响准确性。约掉共因子约掉共因子/n/n 后后第58页,此课件共127页哦进一步推导进一步推导第59页,此课件共127页哦同理第
18、60页,此课件共127页哦积差法积差法简捷法简捷法第61页,此课件共127页哦例题人均销售额x 利润额y x2 y2 xy 6581476337合计5012.610.418.53.08.116.312.36.26.616.8110.836256411649369949294158.76108.06342.259.0065.61265.69151.2938.4443.56282.241465.0075.052.0148.03.032.4114.173.818.619.8117.6654.9第62页,此课件共127页哦对分组资料计算加权相关系数简捷法简捷法积差法积差法第63页,此课件共127页哦相
19、关系数的显著性检验第64页,此课件共127页哦第四节 一元线性回归分析河北大学统计学系第65页,此课件共127页哦一、一元线性回归分析的概念和特点 概念:把两个或两个以上变量之间的相关关系加以模型化,求出回归方程,并据以进行估计推算,这种方法在统计学中成为回归分析。第66页,此课件共127页哦回归回归分析分析分类分类按自变量个数按自变量个数分类分类一元回归一元回归多元回归多元回归按方程式特征按方程式特征分类分类线性回归线性回归非线性回归非线性回归一一 元线元线性回性回归归 分类第67页,此课件共127页哦特点l两变量之间不是对等的关系,必须根据研究目的和研究对象的性质,正确确定出自变量和因变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 应用 统计学 第七 相关 回归 分析 精选 PPT
限制150内