应用统计学(第四版)第8章-相关分析与回归分析ppt课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《应用统计学(第四版)第8章-相关分析与回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《应用统计学(第四版)第8章-相关分析与回归分析ppt课件.ppt(83页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 3 相关分析(相关分析(掌握掌握) 线性回归分析(线性回归分析(掌握掌握) 回归模型的统计检验和预测(回归模型的统计检验和预测(掌握掌握) 非线性回归模型(非线性回归模型(了解了解) 主要内容和学习目标主要内容和学习目标 函数关系函数关系:变量间的:变量间的确定性确定性数量依存关系数量依存关系相关关系相关关系:变量间的:变量间的非确定性非确定性数量依存关系数量依存关系变量之间的关系变量之间的关系 l当变量当变量x x取某个数值时,变量取某个数值时,变量y y 依确定的对应关系取相应的值依确定的对应关系取相应的值l表现形式:表现形式:y=f(x)y=f(x) l各观测点落在一条线上各观测点落
2、在一条线上 相关关系的特点相关关系的特点l当变量当变量x x取某个值时,取某个值时, 变量变量y y 的取值可能有几个的取值可能有几个l表现形式:表现形式:y=f(x)+y=f(x)+l各观测点在一条线的周围各观测点在一条线的周围 9 8.1.1 8.1.1 相关关系的概念和种类相关关系的概念和种类 1.1.相关关系的概念相关关系的概念 在社会经济发展变化中,客观现象总是普遍在社会经济发展变化中,客观现象总是普遍联系和相互依存的,客观现象(变量)之间联系和相互依存的,客观现象(变量)之间的数量依存关系可分为两种类型:确定性关的数量依存关系可分为两种类型:确定性关系和系和相关关系相关关系。 相关
3、关系相关关系是指现象之间客观存在的非确定性是指现象之间客观存在的非确定性的数量依存关系。的数量依存关系。 8.1 8.1相关分析相关分析10如:商品的消费量(如:商品的消费量(y y)与居民收入()与居民收入(x x)之间的关系)之间的关系 变量间关系是变量间关系是不能用函数关系精确表达不能用函数关系精确表达的,一个变的,一个变量的取值不能由另一个变量唯一确定。量的取值不能由另一个变量唯一确定。各观测点分布在直线周围。各观测点分布在直线周围。112. 2. 相关关系的种类相关关系的种类(1 1)按相关的方向可以分为)按相关的方向可以分为正相关正相关和和负相关负相关。(2 2)按相关的程度可分为
4、)按相关的程度可分为完全相关完全相关、不完全相关不完全相关和和不相关不相关。(3 3)按涉及的变量或因素的个数可以分为)按涉及的变量或因素的个数可以分为单相关单相关与与复相关复相关。(4 4)按相关的表现形式可分为)按相关的表现形式可分为线性相关线性相关与与非线性相关非线性相关。相关关系相关关系的种类的种类按变量个数按变量个数按表现形式按表现形式按密切程度按密切程度单相关单相关复相关复相关线性相关线性相关非线性相关非线性相关完全相关完全相关不完全相关不完全相关不相关不相关相关关系的分类相关关系的分类 线性相关线性相关:按其变化方向可分为正相关与负相关按其变化方向可分为正相关与负相关 函数关系函
5、数关系13相关关系单相关线性相关正相关负相关非线性相关复相关多元线性相关多元非线性相关相关关系的种类的关系图相关关系的种类的关系图相关分析的主要内容与方法相关分析的主要内容与方法l判断变量之间是否存在相关关系(定性分析法)判断变量之间是否存在相关关系(定性分析法)l分析变量间相关关系的形态特征(制作散点图)分析变量间相关关系的形态特征(制作散点图)l分析变量间相关关系的密切程度(计算相关系数)分析变量间相关关系的密切程度(计算相关系数)l对总体相关关系进行显著性检验(假设检验法)对总体相关关系进行显著性检验(假设检验法)相关分析的概念相关分析的概念研究两个或两个以上的变量之间相关关系的形态和程
6、研究两个或两个以上的变量之间相关关系的形态和程度的一种统计方法。度的一种统计方法。 简单线性相关关系简单线性相关关系 定性分析定性分析 相关图分析相关图分析 相关系数分相关系数分析析 相关分析相关分析的方法的方法定性分析定性分析相关系数分析相关系数分析相关图分析相关图分析计算计算相关相关系数系数绘制绘制相关相关图图进行进行定性定性分析分析相关相关系数系数检验检验简单线性相关分析的基本程序简单线性相关分析的基本程序 定性分析定性分析 l 是指对事物的质的规定性的认识和分析是指对事物的质的规定性的认识和分析l 要借助相关的社会经济理论、专业知识、要借助相关的社会经济理论、专业知识、 实践经验和判断
7、能力实践经验和判断能力l 如果定性分析判断现象之间没有相关关系,如果定性分析判断现象之间没有相关关系, 就不需要进行定量的描述和测度了就不需要进行定量的描述和测度了 美国印第安纳州的地区教会想要筹款兴建新教堂,提出美国印第安纳州的地区教会想要筹款兴建新教堂,提出教堂能洁净人们的心灵,减少犯罪,降低监狱服刑人数的口教堂能洁净人们的心灵,减少犯罪,降低监狱服刑人数的口号。为了增进民众参与的热诚和信心,教会的神父收集了近号。为了增进民众参与的热诚和信心,教会的神父收集了近1515年的教堂数与在监狱服刑的人数进行统计分析。结果却令年的教堂数与在监狱服刑的人数进行统计分析。结果却令教会大吃一惊。最近教会
8、大吃一惊。最近1515年教堂数与监狱服刑人数呈显著的正年教堂数与监狱服刑人数呈显著的正相关。那么是否可以由此得出,教堂建得越多,就可能带来相关。那么是否可以由此得出,教堂建得越多,就可能带来更多的犯罪呢?经过统计学家和教会神父深入讨论,发现监更多的犯罪呢?经过统计学家和教会神父深入讨论,发现监狱服刑人数的增加和教堂数的增加都与人口的增加有关。教狱服刑人数的增加和教堂数的增加都与人口的增加有关。教堂数的增加并非监狱服刑人数增加的原因。至此,教会人士堂数的增加并非监狱服刑人数增加的原因。至此,教会人士总算松了一口气。总算松了一口气。案例:教堂数与监狱服刑人数同步增长案例:教堂数与监狱服刑人数同步增
9、长208.1.28.1.2 相关分析的图表和意义相关分析的图表和意义1 1、相关图表相关图表 相关表和相关图可直观地表达变量之间相关表和相关图可直观地表达变量之间的相关关系的程度。的相关关系的程度。 相关表相关表是将具有相关关系的原始数据是将具有相关关系的原始数据, ,按按某一顺序平行排列在一张表上某一顺序平行排列在一张表上, ,以观察它以观察它们之间的相互关系。们之间的相互关系。21表表8-18-1高校人数和周边饭店季营业额高校人数和周边饭店季营业额饭饭店店学生人学生人数(千数(千人)人)x x季营业季营业额(千额(千元)元)y y饭饭店店学生人学生人数(千数(千人)人)x x季营业额季营业
10、额(千元)(千元)y y1 12 258586 616161371372 26 61051057 720201571573 38 888888 820201691694 48 81181189 922221491495 512121171171010262620220222 相关图相关图也称为分布图或散点图,它是在平面也称为分布图或散点图,它是在平面直角坐标中把相关关系的原始数据用点描绘直角坐标中把相关关系的原始数据用点描绘出来,通常以直角坐标的横轴代表自变量出来,通常以直角坐标的横轴代表自变量x,x,纵轴代表因变量纵轴代表因变量y y。相关图所反映的变量之。相关图所反映的变量之间的相关关系的
11、方向和程序比相关表更为清间的相关关系的方向和程序比相关表更为清晰,也更为直观。晰,也更为直观。23图图8-18-1学生人数和季营业额相关图学生人数和季营业额相关图 24258.1.3 8.1.3 简单线性相关简单线性相关1. 1. 相关系数相关系数 相关系数相关系数是描述相关的两个变量之间相关关是描述相关的两个变量之间相关关系密切程度的数量指标。早在系密切程度的数量指标。早在18901890年,英国年,英国著名统计学家著名统计学家Karl PearsonKarl Pearson便提出了一个测便提出了一个测定两个变量线性相关的计算方法,通常称为定两个变量线性相关的计算方法,通常称为积差相关系数或
12、简单相关系数。积差相关系数或简单相关系数。262. 2. 相关分析的意义相关分析的意义(1 1)相关分析可以确定变量之间相关关系的)相关分析可以确定变量之间相关关系的方向和程度方向和程度(2 2)相关分析可以衡量回归估计的精确程度)相关分析可以衡量回归估计的精确程度 l相关系数相关系数是对变量之间相关关系密切程度的度量是对变量之间相关关系密切程度的度量l对两个变量之间线性相关程度的度量对两个变量之间线性相关程度的度量 称为称为简单相关系数简单相关系数l若相关系数是根据总体全部数据计算的,若相关系数是根据总体全部数据计算的, 则称为则称为总体相关系数,记为总体相关系数,记为 l若相关系数是根据样
13、本数据计算的,若相关系数是根据样本数据计算的, 则称为则称为样本相关系数,记为样本相关系数,记为 r r 相关系数分析相关系数分析 28总体相关系数总体相关系数: :XYXY式中:XY是变量是变量X X和和Y Y的协方差的协方差X是变量是变量X X的标准差的标准差Y是变量是变量Y Y的标准差的标准差样本相关系数样本相关系数:22()()iiiixxyyrxxyy 样本相关系数的计算公式样本相关系数的计算公式30ExcelExcel在相关系数计算中的应用在相关系数计算中的应用方法一:利用统计函数中的方法一:利用统计函数中的“CORRELCORREL”函数计算;函数计算;方法二:利用统计函数中的方
14、法二:利用统计函数中的“PEARSONPEARSON”函数计算;函数计算;方法三:利用分析工具库中的方法三:利用分析工具库中的“相关系数相关系数”工具计算。工具计算。取值取值意义意义线性正相关关系线性正相关关系线性负相关关系线性负相关关系完全线性正相关关系完全线性正相关关系完全线性负相关关系完全线性负相关关系没有线性相关关系没有线性相关关系线性相关程度越高线性相关程度越高线性相关程度越低线性相关程度越低1r1r 10r 0r01r 0r 1r相关系数的性质相关系数的性质33取值范围取值范围相关程度相关程度高度相关高度相关中度相关中度相关低度相关低度相关弱度相关弱度相关0.50.8r 0.81r
15、0.3r 0.30.5r 相关程度的划分相关程度的划分35根据给定的显著性水平和自由度根据给定的显著性水平和自由度n-2,n-2,查找查找t t分布中的相分布中的相应临界值应临界值 。如果。如果 ,就否定原假设,认为,就否定原假设,认为 r r 在统计上是显著的,即总体相关系数不为零,总体变在统计上是显著的,即总体相关系数不为零,总体变量间存在线性相关关系。量间存在线性相关关系。3.3.相关系数的显著性检验相关系数的显著性检验提出假设:提出假设:01:0,:0HH计算计算 t t 检验统计量:检验统计量: 2t2|tt 22(2)1ntrt nr36 计算学生人数和季营业额的相关系数计算学生人
16、数和季营业额的相关系数 124608119 1401100.9611(2207119 119) (2818011401 1401)1010r 【例8.2】利用表8-1的数据,计算学生人数x(万人)和季营业额y(万元)的相关系数。37 检验高校学生人数与周边饭店季营业额之间的相关检验高校学生人数与周边饭店季营业额之间的相关系数是否显著,显著性水平系数是否显著,显著性水平 =0.05=0.05。 第一步:提出假设第一步:提出假设 第二步:构造并计算检验统计量第二步:构造并计算检验统计量01:0; :0HH221020.9610.0411 0.96 0.96ntrr38 第三步:确定临界值。根据给定
17、的显著性水平第三步:确定临界值。根据给定的显著性水平 =0.05=0.05和自由度和自由度10-2=810-2=8,查找,查找t t分布表或利用分布表或利用ExcelExcel计算,得到临界值。计算,得到临界值。 第四步:决策。由于第四步:决策。由于 所以拒绝原假设,说明高校学生人数与周边饭店季所以拒绝原假设,说明高校学生人数与周边饭店季营业额之间存在着显著的正线性相关关系。营业额之间存在着显著的正线性相关关系。0.025(8)(0.05,8)2.31tTINV0.025| | 10.40(8)2.31tt39 8.2.1 8.2.1 回归分析回归分析 回归分析回归分析是根据已知变量估计未知变
18、量是根据已知变量估计未知变量的一种统计方法,它是以对未知变量的一种统计方法,它是以对未知变量( (因因变量变量) )同其他变量同其他变量( (自变量自变量) )相互关系的观相互关系的观察为基础,在某种精确度下,预测未知变察为基础,在某种精确度下,预测未知变量的数值。量的数值。 8.2 8.2 线性回归分析线性回归分析40回归分析的内容和步骤回归分析的内容和步骤: 选择适当的回归模型。选择适当的回归模型。 进行参数估计。进行参数估计。 进行模型的检验。进行模型的检验。 进行预测。即根据回归方程进行适当的经进行预测。即根据回归方程进行适当的经济预测,这是回归分析的最终目的。济预测,这是回归分析的最
19、终目的。411. 1. 总体回归方程与样本回归方程总体回归方程与样本回归方程 例:研究家庭消费支出与家庭收入之例:研究家庭消费支出与家庭收入之间的关系,一个总体由间的关系,一个总体由5050户家庭组成,户家庭组成,并按人均月收入水平划分成组内收入并按人均月收入水平划分成组内收入水平大致相同的水平大致相同的1010个组。个组。42图图8-4 8-4 不同收入水平的家庭消费支出散点分布图不同收入水平的家庭消费支出散点分布图总体回归线PRL随机试验所有可能结果的集合称为总体或样本空间第一节 古典回归模型 由图中看出总体回归直线是线性的,用函数的形式来由图中看出总体回归直线是线性的,用函数的形式来表示
20、:表示: (1)(1) 这是直线的数学表达式,在式这是直线的数学表达式,在式(1)(1)中,中, E(YE(YXi)Xi)表示给定表示给定X X值相应的值相应的( (或条件的或条件的) ) Y Y的均值,的均值,称为称为或条件均值下标或条件均值下标i i代表第代表第i i个子总体。个子总体。如,如,x=2x=2时,时,y y的条件均值为的条件均值为 即收入水平为即收入水平为20002000元的元的4 4个家庭的平均消费支出为个家庭的平均消费支出为15001500元。元。01( |)iiE Y XX11111.101.401.701.801.55555第一节 古典回归模型注意注意: E E( (
21、Y YX Xi i) )是是X Xi i的函数的函数( (在此例中是线性函数在此例中是线性函数) )。这意味。这意味着着Y Y依赖于依赖于X Xi i,一般称之为,一般称之为。回归可简单。回归可简单地定义为在给定地定义为在给定X X值的条件下值的条件下Y Y值分布的均值。换句话值分布的均值。换句话说,总体回归直线经过说,总体回归直线经过Y Y的条件期望值。式的条件期望值。式(1)(1)是总体是总体回归函数回归函数(Population Regression Function, PRF)(Population Regression Function, PRF)的数学形式。在本例中,总体回归函数是
22、线性函数。的数学形式。在本例中,总体回归函数是线性函数。第一节 古典回归模型 为参数为参数( (parameters) ),也称,也称回归系数回归系数( (regression coefficients) )。 又称为截距又称为截距( (intercept) ),是当,是当X X为为0 0时时Y Y的均值的均值 又称为斜率又称为斜率( (slope) ),斜率度量了,斜率度量了X X 每变动一每变动一单位,单位,Y Y 的均值的变化率。的均值的变化率。 例,如果斜率例,如果斜率 为为0.5,那么,当收入,那么,当收入x x每增加每增加1 1单位(千元),单位(千元),Y Y 的的( (期望期望
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 第四 相关 分析 回归 ppt 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内