管理统计学-第八章.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《管理统计学-第八章.ppt》由会员分享,可在线阅读,更多相关《管理统计学-第八章.ppt(86页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、相关分析相关分析n总体相关与样本相关总体相关与样本相关n偏相关偏相关n距离相关距离相关n品质相关品质相关交叉列联表分析交叉列联表分析相关分析相关分析变量之间的相关关系变量之间的相关关系确定型的关系确定型的关系函数关系函数关系不确定型的关系不确定型的关系相关关系相关关系 相关分析是研究变量之间不确定关系的统相关分析是研究变量之间不确定关系的统计方法计方法。其中最为常见的是两个或多个随机变量之其中最为常见的是两个或多个随机变量之间的间的线性线性相关关系。相关关系。相关关系的内容有相关关系的内容有(一一)按相关按相关程度程度划分划分完全相关完全相关不完全相关不完全相关不相关不相关(二二)按相关按相关
2、方向方向划分划分正相关:同方向变动正相关:同方向变动负相关:反方向变动负相关:反方向变动(三三)按相关按相关形式形式划分划分线性相关线性相关非线性相关非线性相关(四四)按按变量多少变量多少划分划分单相关单相关:两变量间的相关两变量间的相关复相关复相关偏相关偏相关(五五)按相关按相关性质性质划分划分真实相关真实相关虚假相关虚假相关Kendalls tua-b 相关系数相关系数二、普通相关系数的二、普通相关系数的种类种类及计算及计算总体相关系数总体相关系数(一一)积矩相关系数积矩相关系数样本相关系数样本相关系数(参数相关)(二二)等级相关系数等级相关系数等级相关系数等级相关系数适用于顺序级和适用于
3、顺序级和刻度级的配对样本。刻度级的配对样本。(非参数相关)Spearman相关系数相关系数(三三)偏相关系数偏相关系数(四四)复相关系数复相关系数1.1.总体相关系数总体相关系数2.2.样本相关系数样本相关系数积矩相关系数积矩相关系数适用于等间隔测度的数据或比例数据之间的线性适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。关系的密切程度。图中图中,普通普通相关系数的几何解释相关系数的几何解释与与即即,表示向量表示向量一组一组角的余弦就是配对样本角的余弦就是配对样本的相关系数。的相关系数。的模。的模。样本样本,可以视为一个向量。可以视为一个向量。相关系数相关系数为为0 0的两个随机变量
4、的两个随机变量,不相关不相关,但但不不一定一定相互独立。相互独立。相关系数为相关系数为0 0的两个服从正态分布的随机变量的两个服从正态分布的随机变量,一定相互独立。一定相互独立。相互独立的随机变量间的相关系数相互独立的随机变量间的相关系数,必然为必然为0 0。普通普通相关系数的取值范围相关系数的取值范围样本相关系数也是区间样本相关系数也是区间-1,1-1,1之间的一个量。之间的一个量。普通普通相关系数的直观散点图相关系数的直观散点图设有配对样本观察值设有配对样本观察值与与则其直观散点图中则其直观散点图中,标是标是()。每个点的平面坐每个点的平面坐散点图散点图 散点图散点图(Graphs Sca
5、tter)积矩相关系数的检验积矩相关系数的检验检验的种类检验的种类偏相关系数的检验偏相关系数的检验相关系数异于零的显著性检验相关系数异于零的显著性检验积矩相关系数的检验积矩相关系数的检验式中,式中,是样本容量,是样本容量,是简单相关系数是简单相关系数(Pearson)检验统计量检验统计量等级相关系数的检验等级相关系数的检验这是一个双尾检验问题这是一个双尾检验问题设定假设:设定假设:练习练习,某企业产品广告费和销售收入资料如下某企业产品广告费和销售收入资料如下,判断广告费和销售收入之间关系密切程度如何?判断广告费和销售收入之间关系密切程度如何?3 310102828404066661171171
6、40140404404序号序号广告费广告费(万元万元)销售收入销售收入(百万元百万元)1 12 23 34 45 56 67 73 35 57 78 811111313141461611 12 24 45 56 69 9101037379 92525494964641211211691691961966336331 14 41616252536368181100100263263合计合计 普通普通相关分析的相关分析的SPSS的实现过程的实现过程:Analyze菜单菜单Correlate项中选择项中选择Bivariate命令。命令。Flag Significant Correlation:是否用
7、星号标明输是否用星号标明输出结果的显著性。出结果的显著性。Means and Standard Deviations:输出所选变量输出所选变量的均值、标准差和样本个数。的均值、标准差和样本个数。Cross Product Deviations and Covariances:输输出平方和及协方差。出平方和及协方差。回归分析回归分析n一元回归一元回归n多元回归多元回归n n全部强行进入回归全部强行进入回归n n逐步回归逐步回归 回归回归:揭示出不确定数量关系的内在数量变化揭示出不确定数量关系的内在数量变化规律规律,并通过一定的并通过一定的表达式表达式描述数量之间的这种描述数量之间的这种内在关系的
8、方法。内在关系的方法。不确定性的函数关系不确定性的函数关系回归的涵义回归的涵义数据之间的关系数据之间的关系 函数函数确定性的函数关系确定性的函数关系回归方程回归方程回归分析的任务回归分析的任务(1 1)通过分析大量的样本数据通过分析大量的样本数据,确定变量之确定变量之间的间的统计关系统计关系,并以并以数学表达式数学表达式形式给出形式给出;(2 2)对确定的数学关系式的可信度进行统计对确定的数学关系式的可信度进行统计检验检验,找出对某一特定变量影响较为显著的变找出对某一特定变量影响较为显著的变量和不显著的变量量和不显著的变量;(3 3)利用确定的数学关系式利用确定的数学关系式,根据自变量预根据自
9、变量预测或控制因变量的取值测或控制因变量的取值,并找出这种预测或控并找出这种预测或控制的精确度。制的精确度。回归分析时变量的设定回归分析时变量的设定n回归分析的回归分析的被解释变量被解释变量必须是刻度级的必须是刻度级的,如果是顺序级的如果是顺序级的,要用要用Numeric型的来表示。型的来表示。如果被解释变量是名义级的如果被解释变量是名义级的,将用将用Logistic回归等方法处理。回归等方法处理。n解释变量解释变量可以是刻度级、顺序级、名义级可以是刻度级、顺序级、名义级的变量的变量,不论是什么级别的数据不论是什么级别的数据,都必须都必须用用Numeric型的来表示。型的来表示。一元线性回归分
10、析一元线性回归分析n一元线性回归模型的求解n一元线性回归模型的SPSS实现n一元线性回归模型的设定n一元线性回归模型的检验样本回归模型样本回归模型:样本回归直线样本回归直线:一元线性回归模型的求解一元线性回归模型的求解n最小平方法回归方程的回归方程的显著性显著性检验检验线性回归线性回归方程的检验方程的检验回归回归系数的显著性检验系数的显著性检验回归回归效果效果的检验的检验回归方程的显著性检验回归方程的显著性检验F检验检验:回归方程不显著回归方程不显著:回归方程显著回归方程显著:总离差平方和总离差平方和:剩余平方和剩余平方和/残差平方和残差平方和:回归离差平方和回归离差平方和若全部观测值都落在回
11、归直线上若全部观测值都落在回归直线上,则则 判定相关系数越接近判定相关系数越接近1 1,表明回归平方和占表明回归平方和占总离差平方和的比例越大总离差平方和的比例越大,用用x的变动解释的变动解释y 值值变动的部分就越多变动的部分就越多,回归的效果就越好。回归的效果就越好。回归效果的检验回归效果的检验判定相关系数检验判定相关系数检验若若x完全无助于解释完全无助于解释y的变动的变动,则,则 F检验检验校正的判定系数 统计量 中不含有自由度。所谓校正的判定系数是指“考虑了自由度的判定系数 ”。其定义如下:剔除了自由度的影响。校正的判定系数校正的判定系数Adjusted式中:式中:回归效果的检验回归效果
12、的检验F检验检验:样本容量样本容量:自变量的个数自变量的个数(含常数项含常数项):判定系数判定系数回归系数的显著性检验回归系数的显著性检验T检验检验成立成立,即即当当时时显著异于显著异于0 0。针对回归系数的针对回归系数的统计量的显著性检验决定了相统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。应的变量能否作为解释变量进入回归方程。回归系数的显著性检验回归系数的显著性检验T检验检验成立成立,即即当当时时显著异于显著异于0 0。针对回归系数的针对回归系数的统计量的显著性检验决定了相统计量的显著性检验决定了相应的变量能否作为解释变量进入回归方程。应的变量能否作为解释变量进入回归方程
13、。SPSS的实现的实现:Analyze菜单菜单Regression项中项中选择选择Linear命令。命令。Enter:强行进入法:强行进入法,即所选自变量全部进入模型即所选自变量全部进入模型。Remove:强制剔除法,即建立回归方程时,根据设:强制剔除法,即建立回归方程时,根据设定的条件从回归方程中剔除部分自变量。定的条件从回归方程中剔除部分自变量。Backward:向后剔除法,根据:向后剔除法,根据Option对话框中设定对话框中设定的判据,先建立全模型,然后根据设置的判据,每的判据,先建立全模型,然后根据设置的判据,每次剔除一个使方差分析中的次剔除一个使方差分析中的F值最小的自变量,直到值
14、最小的自变量,直到回归方程中不再含有不符合判据的自变量为止。回归方程中不再含有不符合判据的自变量为止。Forward:向前选择法:向前选择法。Stepwise:逐步进入法,:逐步进入法,根据根据Option对话框中设定的对话框中设定的判据及方差分析结果,选择符合判据的自变量与因判据及方差分析结果,选择符合判据的自变量与因变量相关程度最高的进入回归方程。依据变量相关程度最高的进入回归方程。依据Forward选选入自变量,依据入自变量,依据Backward将模型中将模型中F值最小且符合值最小且符合剔除判据的变量剔除剔除判据的变量剔除,重复。重复。Method处下拉菜单,共有处下拉菜单,共有5 5个
15、选项:个选项:WLS选项选项是存在异方差时,利用加权最小二是存在异方差时,利用加权最小二乘法替代普通最小二乘法估计回归模型参数。通乘法替代普通最小二乘法估计回归模型参数。通过过WLS可以选定一个变量作为加权变量。可以选定一个变量作为加权变量。在实际问题中,如果无法自行确定权重变量,在实际问题中,如果无法自行确定权重变量,可以用可以用SPSS的权重估计来实现。的权重估计来实现。Descriptives:输出自变量和因变量的均值、标准差:输出自变量和因变量的均值、标准差相关系数矩阵及单侧检验概率。相关系数矩阵及单侧检验概率。Estimates:输出与回归系数相关统计量。有:回归:输出与回归系数相关
16、统计量。有:回归系数、回归系数的标准误差、标准回归系数、系数、回归系数的标准误差、标准回归系数、T统计统计量和相应的相伴概率、各自变量的容忍度。量和相应的相伴概率、各自变量的容忍度。Confidence intervals:输出每一个非标准化回归系数:输出每一个非标准化回归系数95%的可信区间。的可信区间。Covariance matix:输出方程中:输出方程中各自变量各自变量间的相关系间的相关系数矩阵及各变量的协方差矩阵。数矩阵及各变量的协方差矩阵。Model fit:输出判定系数、调整的判定系数、回归方:输出判定系数、调整的判定系数、回归方程的标准误差,程的标准误差,F检验的检验的ANOV
17、AANOVA方差分析表。方差分析表。R squared change:当回归方程中引入或剔除一个自:当回归方程中引入或剔除一个自变量后,判定系数、变量后,判定系数、F值产生的变化。值产生的变化。Casewise diagnostics:输出标准化残差绝对值:输出标准化残差绝对值3 3的的样本数据点的相关信息,包括:标准化残差、观测值样本数据点的相关信息,包括:标准化残差、观测值预测值、最小预测值、最小(最大最大)预测值、残差、最小预测值、残差、最小(最大最大)残差残差以及它们的均值和标准差以及它们的均值和标准差。Outliers outside standard devistion:设置奇异值
18、:设置奇异值的判据,默认的判据,默认3 3倍的标准差。倍的标准差。All case:输出所有样本数据有关残差值。:输出所有样本数据有关残差值。Part and partial correlation:输出方程中各自变量与:输出方程中各自变量与因变量之间的简单相关系数、偏相关系数与部分相因变量之间的简单相关系数、偏相关系数与部分相关系数。关系数。Collinearity diagnostics:多重共线性分析,输出各:多重共线性分析,输出各自变量的容限度、方差膨胀因子、最小容忍度、特自变量的容限度、方差膨胀因子、最小容忍度、特征值、条件指标及方差比例等。征值、条件指标及方差比例等。Durbin-
19、Watson:输出:输出Durbin-watson检验值。检验值。Plots对话框对话框用来检验残差序列的正态性、随用来检验残差序列的正态性、随机性和是否存在异方差现象。机性和是否存在异方差现象。Produce all partial plots:输出每一个自变量残差相:输出每一个自变量残差相对于因变量残差的散布图。对于因变量残差的散布图。*ZPRED选项:标准化预测值。选项:标准化预测值。*ZRESID选项:标准化残差。选项:标准化残差。*DRESID选项:剔除残差。选项:剔除残差。*ADJPRED选项:修正后预测值。选项:修正后预测值。*SRESID选项:选项:t分析残差。分析残差。*SD
20、RESID选项:选项:t分析剔除残差。分析剔除残差。Mahalanobis:保存:保存Mahalanobis距离距离Cooks:保存:保存Cook距离距离Leverage values:保存:保存中心点杠杆值中心点杠杆值Individual:保存:保存一个观测量上限与下限的预测一个观测量上限与下限的预测区间。区间。Studentized:标准化残差:标准化残差Deleted:剔除残差:剔除残差Studentized deleted:标准化剔除残差:标准化剔除残差DfBeta(s):因排除一个特定的观察值所引起的:因排除一个特定的观察值所引起的回归系数的变化。若该值回归系数的变化。若该值2 2,
21、则被排除的观,则被排除的观测值有可能是影响点。测值有可能是影响点。DfFit:因排除一个特定的观测值所引起的观:因排除一个特定的观测值所引起的观测值的变化。测值的变化。Use probalitlity of F:以回归系数显著性检验中:以回归系数显著性检验中各自变量的各自变量的F统计量的相伴概率作为自变量是否引统计量的相伴概率作为自变量是否引入模型或者从模型中剔除的标准。实际应用中,应入模型或者从模型中剔除的标准。实际应用中,应使使Entry值小于值小于Remove值,否则,自变量一进入方值,否则,自变量一进入方程就会被立即剔除。程就会被立即剔除。Use F value:以回归系数显著性检验中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理 统计学 第八
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内