经济应用统计学第七章相关与回归分析精选文档.ppt
《经济应用统计学第七章相关与回归分析精选文档.ppt》由会员分享,可在线阅读,更多相关《经济应用统计学第七章相关与回归分析精选文档.ppt(127页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、经济应用统计学第七章相关与回归分析本讲稿第一页,共一百二十七页 学习目标l能够正确判断客观现象之间存在的关系及其密切程度l要正确掌握回归分析的概念及回归模型的确定方法本讲稿第二页,共一百二十七页 主要内容l相关分析的一般问题l定性数据的相关分析l定量数据的相关分析l一元线性回归分析l多元线性回归分析l曲线回归分析本讲稿第三页,共一百二十七页第一节 相关分析的一般问题河北大学统计学系本讲稿第四页,共一百二十七页第一节 相关分析的一般问题相关分析的概念相关分析的概念相关分析的主要内容相关分析的主要内容相关分析的种类和特点相关分析的种类和特点相关分析的方法选择相关分析的方法选择本讲稿第五页,共一百二
2、十七页一、相关分析的概念相关分析是研究一个变量与另一个相关分析是研究一个变量与另一个变量或另一组变量之间相互关系密变量或另一组变量之间相互关系密切程度和相关方向的一种统计分析切程度和相关方向的一种统计分析方法方法.yx本讲稿第六页,共一百二十七页现象间存在普遍的联系与相互影响现象间存在普遍的联系与相互影响受教受教育的育的水平水平工作工作后的后的收入收入预防预防疾病疾病支出支出疾病疾病的发的发病率病率事物间的这种依存关系可以用数量关系事物间的这种依存关系可以用数量关系表现出来表现出来.有两种类型有两种类型:相关关系(非确定性依存关系)函数关系(确定性依存关系)本讲稿第七页,共一百二十七页1、函数
3、关系 变量间存在完全对应的相互依存关系.当自变量的值确定时,因变量就有一个完全确定的值和它相对应.销售额与销售量:销售额与销售量:销售额销售额=销售量销售量 单价单价确定性关系确定性关系函数关系函数关系本讲稿第八页,共一百二十七页2、相关关系 变量间客观存在的,在数量变化上受随机因素影响的、不严格、不确定的相互依存关系。家庭收入与恩格尔系数:家庭收入高,则恩格尔系数低。非确定性关系本讲稿第九页,共一百二十七页自变量自变量因变量因变量有时现象之间自变量和因变量的确定要根据研究的目的在具有相关关系的现象或变量中在具有相关关系的现象或变量中,作为变化根据的变量作为变化根据的变量产生相应变化的变量产生
4、相应变化的变量本讲稿第十页,共一百二十七页二、相关分析的主要内容确定现象间有无依存关系确定相关关系的表现形式是什么确定相关关系的表现形式是什么判定相关关系的密切程度与方向判定相关关系的密切程度与方向 如有 曲线还是直线所谓相关分析,是指对变量之间的相关关系的表现所谓相关分析,是指对变量之间的相关关系的表现形式、密切程度和变化方向进行分析和研究。形式、密切程度和变化方向进行分析和研究。本讲稿第十一页,共一百二十七页三、相关关系的种类l确定的因果的关系l分不清因果的依存关系 1、依存关系特点的不同自变量与因变量不能换位置自变量与因变量可以相互转化如:施肥量(自变量)与粮食产量(因变量)如:销售量与
5、销售价格本讲稿第十二页,共一百二十七页2.依相关关系的密切程度不完全相关完全相关不相关即函数关系即函数关系我们研究的主要是这种关系我们研究的主要是这种关系本讲稿第十三页,共一百二十七页负相关正相关3.依相关关系的方向自变量与因变量变化自变量与因变量变化方向一致方向一致自变量与因变量变化自变量与因变量变化方向相反方向相反本讲稿第十四页,共一百二十七页曲线相关直线(线性)相关4.依相关关系的表现形式xyxy本讲稿第十五页,共一百二十七页复相关单相关5.依涉及变量的多少一个自变量与一个因变量一个自变量与一个因变量如如:学习时间与成绩学习时间与成绩多个自变量与一个因变量多个自变量与一个因变量如如:粮食
6、产量与施肥量、降水量粮食产量与施肥量、降水量本讲稿第十六页,共一百二十七页四、相关分析的特点l相关关系研究的两个变量是对等的l两个变量之间只能计算出一个反映相互关系密切程度的相关系数,改变自变量与因变量的位置,不改变数值l相关分析中两个变量均为随机变量对于简单直线相关本讲稿第十七页,共一百二十七页 五、相关分析的方法选择交互列表法交互列表法 检验法检验法品质相关系数分析法品质相关系数分析法 相关表相关表相关图相关图相关系数相关系数数据定比数据定比数据定距数据定距数据定序数据定序数据定量数据定量数据定性数据定性数据定类数据定类数据等级相关系数分析法等级相关系数分析法 列联表分析法本讲稿第十八页,
7、共一百二十七页第二节 定性数据的相关分析河北大学统计学系本讲稿第十九页,共一百二十七页 交互列表分析法1.确定项目(变量名称)如:态度2.确定类目(变量表现)如:喜欢、一般、不喜欢3.排列形成交互列表 如:调查各地240人对某电视剧的态度,结果为3*3交互列表编制交互列表本讲稿第二十页,共一百二十七页 交互列表分析法行边缘频数列边缘频数条件频数不能直接对比分析不能直接对比分析态 度喜 欢一 般不喜欢合 计城市 北京 上海 重庆 合计 40 30 20 90 20 30 30 80 40 20 10 70 100 80 60 240本讲稿第二十一页,共一百二十七页 交互列表分析法l行频率Hi:各
8、行条件频数比上行边缘频数l列频率Lj:各列条件频数比上列边缘频数l总频率Pij:各条件频数比上总合计数计算三种频率本讲稿第二十二页,共一百二十七页 交互列表分析法城市 北京 上海 重庆 合计%40/90 30/90 20/90 100 20/80 30/80 30/80 100 40/70 20/70 10/70 100 100 80 60 240态 度喜 欢%一 般%不喜欢%样本量行频率分布表本讲稿第二十三页,共一百二十七页 交互列表分析法城市 北京 上海 重庆 合计%44.4 33.3 22.2 100 25.0 37.5 37.5 100 57.1 28.6 14.3 100 100 8
9、0 60 240态 度喜 欢%一 般%不喜欢%样本量行频率分布表样本量不同本讲稿第二十四页,共一百二十七页 交互列表分析法城市 北京 上海 重庆 0.44 0.41 0.37 0.25 0.47 0.625 0.57 0.36 0.238态 度喜 欢%一 般%不喜欢%计算标准行频率分布表行频率除以相应的样本量本讲稿第二十五页,共一百二十七页 对交互列表中的变量关系进行检验,运用 统计量进行 检验,以证明是否该样本所体现的变量关系在总体中也存在。检验每个结点上的观察频数每个结点上对应的期望频率行边缘频数列边缘频数样本量 本讲稿第二十六页,共一百二十七页 检验城市 北京 上海 重庆 合计 90 8
10、0 70 100 80 60 240态 度喜 欢一 般不喜欢合 计行边缘频数列边缘频数条件频数=90*100/240=38=80*60/240=20对上例计算期望频数383329302723222018本讲稿第二十七页,共一百二十七页建立假设H0:变量不相关(态度与城市独立)H1:变量相关计算统计量查分布表查表的临界值,若显著水平为0.05,查表得比较决策 则拒绝原假设,否则接受原假设18.749.448,拒绝原假设,认为相关检验步骤 检验本讲稿第二十八页,共一百二十七页 检验虽然可以判断变量间是否相关,但无法判断相关程度的强弱。测定定性变量之间相关程度用相关系数,有 系数、系数、系数、系数。
11、品质相关系数本讲稿第二十九页,共一百二十七页 品质相关系数 系数主要用于描述22交互列表中各定类变量间的相关程度对于rc交互列表(r或c大于2),则注:正负号没有含义本讲稿第三十页,共一百二十七页 品质相关系数 系数主要用于描述大于22交互列表中各定类变量间的相关程度局限性:大小受行数与列数的影响,且随行数和列数的增加而增大,因此只有当两个交互列表的行数与列数相同时,才能直接比较。本讲稿第三十一页,共一百二十七页 品质相关系数 系数本讲稿第三十二页,共一百二十七页 品质相关系数 系数本讲稿第三十三页,共一百二十七页 等级相关系数用来描述两个定序变量或等级序列之间的相关程度。最常用的为斯皮尔曼等
12、级相关系数:注:正负号有含义本讲稿第三十四页,共一百二十七页l计算过程:1、对所取得的相关数据资料进行排序 2、计算斯皮尔曼等级相关系数 3、对计算结果进行显著性检验 等级相关系数本讲稿第三十五页,共一百二十七页第三节 定量数据的相关分析河北大学统计学系本讲稿第三十六页,共一百二十七页 一、相关表 表现现象之间相关关系的一种统计表。一般以x为自变量,y为因变量,在表格中一一对应地排列。可以初步反映相关关系的形式、密切程度和相关方向。可分为简单相关表和分组相关表两种。本讲稿第三十七页,共一百二十七页1、简单相关表生产性固定资产与工业总产值的相关表企业编号 生产性固定资产总值x 工业总产值y123
13、45678910446778910101116212626313130373841本讲稿第三十八页,共一百二十七页2、分组相关表单变量分组表按自变量分组,计算各组中的次按自变量分组,计算各组中的次数与因变量的组平均数。数与因变量的组平均数。本讲稿第三十九页,共一百二十七页单变量分组表工人看管织机台数x 工人数f 时劳动生产率y5-77-99-1111-1313-1515-1717-19913202931324015182326333842只按自变量分组,未按因变量分组只按自变量分组,未按因变量分组本讲稿第四十页,共一百二十七页l对自变量、因变量都进行分组,交叉列表,并列出两种变量的共同次数。又
14、称棋盘式相关表。2、分组相关表双变量分组表本讲稿第四十一页,共一百二十七页分组相关表双变量分组表木材运量木材运量x1-11 11-21 21-31 31-41 41-51 合计合计运材成本运材成本y16-2111-161-11合计合计2571337437112 11313824本讲稿第四十二页,共一百二十七页二、相关图 又称散点图,横轴为自变量,纵轴为因变量将对应的变量值用坐标点描绘出来。可以判断两变量之间有无相关关系,方向和程度如何。本讲稿第四十三页,共一百二十七页1、线性强正相关xy本讲稿第四十四页,共一百二十七页2、线性弱正相关xy本讲稿第四十五页,共一百二十七页3、线性强负相关xy本讲
15、稿第四十六页,共一百二十七页4、线性弱负相关xy本讲稿第四十七页,共一百二十七页5、非线性相关(曲线相关)xy本讲稿第四十八页,共一百二十七页6、不相关xy本讲稿第四十九页,共一百二十七页三、相关系数 反映两变量之间直线相关关系密切程度的统计分析指标。本讲稿第五十页,共一百二十七页相关系数由何而来协方差协方差(covariance):两个变量与其均:两个变量与其均值离差乘积的平均数,是相关关系的一种值离差乘积的平均数,是相关关系的一种度量。度量。总体协方差:总体协方差:本讲稿第五十一页,共一百二十七页对协方差的理解对协方差的理解为正为正为负为负为正为正为负为负协方差为大的正值时,表协方差为大的
16、正值时,表示强的正线性相关关系。示强的正线性相关关系。本讲稿第五十二页,共一百二十七页对协方差的理解对协方差的理解协方差接近于零时,表示很小协方差接近于零时,表示很小或没有线性相关关系。或没有线性相关关系。本讲稿第五十三页,共一百二十七页对协方差的理解对协方差的理解协方差为大的负值时,表协方差为大的负值时,表示强的负线性相关关系。示强的负线性相关关系。本讲稿第五十四页,共一百二十七页协方差为大的正值时,表示协方差为大的正值时,表示强的正线性相关关系。强的正线性相关关系。协方差接近于零时,表示很小协方差接近于零时,表示很小或没有线性相关关系。或没有线性相关关系。协方差为大的负值时,表示协方差为大
17、的负值时,表示强的负线性相关关系。强的负线性相关关系。似乎是似乎是这样这样cmkgmmkg大大于于基本结论:协方差受计量单位影响,从基本结论:协方差受计量单位影响,从而不能真实反映相关的程度。而不能真实反映相关的程度。本讲稿第五十五页,共一百二十七页cmkgmmkgcmmmkgkg可比本讲稿第五十六页,共一百二十七页相关系数的计算相关系数:协方差与自变量、因变量标准差乘积的对比值。l其值在-和之间,正值为正相关,负值为负相关。l其绝对值接近为不相关l其绝对值在.和.左右为低度相关l其绝对值在.左右为中度相关l其绝对值在.以上为高度相关本讲稿第五十七页,共一百二十七页积差法但此公式需要先有各变量
18、的平均值,当均值计算中有保留时,计算结果将会有误差。影响准确性。约掉共因子约掉共因子/n/n 后后本讲稿第五十八页,共一百二十七页进一步推导进一步推导本讲稿第五十九页,共一百二十七页同理本讲稿第六十页,共一百二十七页积差法积差法简捷法简捷法本讲稿第六十一页,共一百二十七页例题人均销售额x 利润额y x2 y2 xy 6581476337合计5012.610.418.53.08.116.312.36.26.616.8110.836256411649369949294158.76108.06342.259.0065.61265.69151.2938.4443.56282.241465.0075.0
19、52.0148.03.032.4114.173.818.619.8117.6654.9本讲稿第六十二页,共一百二十七页对分组资料计算加权相关系数简捷法简捷法积差法积差法本讲稿第六十三页,共一百二十七页相关系数的显著性检验本讲稿第六十四页,共一百二十七页第四节 一元线性回归分析河北大学统计学系本讲稿第六十五页,共一百二十七页一、一元线性回归分析的概念和特点 概念:把两个或两个以上变量之间的相关关系加以模型化,求出回归方程,并据以进行估计推算,这种方法在统计学中成为回归分析。本讲稿第六十六页,共一百二十七页回归回归分析分析分类分类按自变量个数分按自变量个数分类类一元回归一元回归多元回归多元回归按方
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 经济 应用 统计学 第七 相关 回归 分析 精选 文档
限制150内