《管理统计学》第九章.ppt
第九章第九章 普通相关分析普通相关分析总体相关与样本相关总体相关与样本相关偏相关偏相关品质相关品质相关相关分析相关分析变量之间的相关关系变量之间的相关关系确定型的关系确定型的关系函数关系函数关系不确定型的关系不确定型的关系相关关系相关关系相关分析是研究变量之间不确定关系的统计方法相关分析是研究变量之间不确定关系的统计方法。其中其中最为常见的是两个或多个随机变量之间的线最为常见的是两个或多个随机变量之间的线性相关关系。性相关关系。相关关系的内容有:相关关系的内容有:普通相关关系普通相关关系 品质相关品质相关 一、普通相关关系的种类一、普通相关关系的种类 二、普通相关系数的种类及计算二、普通相关系数的种类及计算 三、普通相关系数的几何解释三、普通相关系数的几何解释 五、普通相关系数的直观散点图五、普通相关系数的直观散点图 六、普通相关系数异于零的显著性检验六、普通相关系数异于零的显著性检验 四、普通相关系数的取值范围四、普通相关系数的取值范围 七、相关指数七、相关指数普通相关关系普通相关关系(一一)按相关程度划分按相关程度划分完全相关完全相关不完全相关不完全相关不相关不相关(二二)按相关方向划分按相关方向划分正相关:同方向变动正相关:同方向变动负相关:反方向变动负相关:反方向变动(三三)按相关形式划分按相关形式划分线性相关线性相关非线性相关非线性相关(四四)按变量多少划分按变量多少划分单相关:两变量间的相关单相关:两变量间的相关复相关复相关偏相关偏相关(五五)按相关性质划分按相关性质划分真实相关真实相关虚假相关虚假相关Kendalls tua-b 相关系数相关系数二、普通相关系数的二、普通相关系数的种类种类及计算及计算总体相关系数总体相关系数(一一)积矩相关系数积矩相关系数样本相关系数样本相关系数(参数相关)(二二)等级相关系数等级相关系数等级相关系数适用于顺序级和等级相关系数适用于顺序级和刻度级的配对样本。刻度级的配对样本。(非参数相关)Spearman相关系数相关系数(三三)偏相关系数偏相关系数(四四)复相关系数复相关系数1.1.总体相关系数总体相关系数2.2.样本相关系数样本相关系数(一一)积矩相关系数积矩相关系数适用于等间隔测度的数据或比例数据之间的线性适用于等间隔测度的数据或比例数据之间的线性关系的密切程度。关系的密切程度。1.1.Spearman相关系数相关系数当当n3030时则计算统计量时则计算统计量:(二二)等级相关系数等级相关系数 是一种非参数测度是一种非参数测度,根据数据的秩使用根据数据的秩使用Pearson相关系数公式计算的相关系数公式计算的,而不是根据实际而不是根据实际值计算的。它适合有序数据或不满足正态分布假值计算的。它适合有序数据或不满足正态分布假设的等间隔数据。设的等间隔数据。2.Kendalls tua-b 相关系数相关系数当当n3030时时则计算统计量:则计算统计量:V是利用变量的秩数据计算而得的非一致对数目是利用变量的秩数据计算而得的非一致对数目。(二二)等级相关系数等级相关系数第二中求法第二中求法:也是一种非参数测度也是一种非参数测度,依然根据两个有序变依然根据两个有序变量或两个秩变量间的关系程度的测度。但分析时量或两个秩变量间的关系程度的测度。但分析时考虑了节点考虑了节点,即秩次相同的点。即秩次相同的点。2.2.剔除了两个变量剔除了两个变量 、的影响后的影响后,两个变量两个变量式中,式中,(三三)偏相关系数偏相关系数1.1.剔除了一个变量剔除了一个变量Z Z的影响后的影响后,两个变量两个变量X X、Y Y间间是普通相关系数。是普通相关系数。x、y 之间的偏相关系数之间的偏相关系数(四四)复相关系数复相关系数 一个变量与多个变量之间的线性相关程度的指一个变量与多个变量之间的线性相关程度的指标。样本复相关系数的定义式如下标。样本复相关系数的定义式如下:图中图中,三、普通相关系数的几何解释三、普通相关系数的几何解释与与即即,表示向量表示向量一组一组角的余弦就是配对样本角的余弦就是配对样本的相关系数。的相关系数。的模。的模。样本样本,可以视为一个向量。可以视为一个向量。相关系数相关系数为为0 0的两个随机变量的两个随机变量,不相关不相关,但不但不一定相互独立。一定相互独立。相关系数为相关系数为0 0的两个服从正态分布的随机变量的两个服从正态分布的随机变量,一定相互独立。一定相互独立。相互独立的随机变量间的相关系数相互独立的随机变量间的相关系数,必然为必然为0 0。四、普通相关系数的取值范围四、普通相关系数的取值范围样本相关系数也是区间样本相关系数也是区间-1,1-1,1之间的一个量。之间的一个量。五、普通相关系数的直观散点图五、普通相关系数的直观散点图设有配对样本观察值设有配对样本观察值与与则其直观散点图中则其直观散点图中,标是标是()。每个点的平面坐每个点的平面坐散点图散点图 散点图散点图(Graphs Scatter)散点图Simple:简单散点图,显示两个变量关系的图;:简单散点图,显示两个变量关系的图;Overlay:重叠散点图,显示多个配对变量关系的;:重叠散点图,显示多个配对变量关系的;Matrix:矩阵散点图,以矩阵形式显示多个变量:矩阵散点图,以矩阵形式显示多个变量之间的关系;之间的关系;3-3-D:三维散点图:三维散点图,显示三个变量关系的散点图显示三个变量关系的散点图。检验的种类检验的种类偏相关系数的检验偏相关系数的检验六、相关系数异于零的显著性检验六、相关系数异于零的显著性检验(一一)积矩相关系数的检验积矩相关系数的检验式中,式中,是样本容量,是样本容量,是简单相关系数是简单相关系数(Pearson)检验统计量检验统计量积矩相关系数的检验积矩相关系数的检验等级相关系数的检验等级相关系数的检验这是一个双尾检验问题这是一个双尾检验问题设定假设:设定假设:则拒绝则拒绝反之接受。反之接受。是剔除了的变量数,是剔除了的变量数,是是式中,式中,是样本容量,是样本容量,检验统计量:检验统计量:(三三)偏相关系数的检验偏相关系数的检验偏偏相关系数。相关系数。(二二)等级相关系数的检验。同积矩相关系数。等级相关系数的检验。同积矩相关系数。七、相关指数七、相关指数 变量之间存在的非线性相关的强弱,变量之间存在的非线性相关的强弱,难以用简单相关系数作判断。相关指数难以用简单相关系数作判断。相关指数是对是对非线性非线性回归模型拟合时得到的可决系数。回归模型拟合时得到的可决系数。普通普通相关分析的相关分析的SPSS的实现过程的实现过程:Analyze菜单菜单Correlate项中选择项中选择Bivariate或或Partial或或Distances命令。命令。Correlation Coefficients:相关系数选择对话框相关系数选择对话框Pearson:简单相关系数简单相关系数Kandells tu-b:相关系数相关系数,依据配对样本之差依据配对样本之差的正负号的个数的正负号的个数,计算的相关系数计算的相关系数。Spearman:等级相关系数等级相关系数Test of Significance:相关系数的显著性检验。正相关系数的显著性检验。正相关关系一般选择单尾相关关系一般选择单尾,否则否则,一般选择双尾。一般选择双尾。界面解释Flag Significant Correlation:是否用星号标明输是否用星号标明输出结果的显著性。出结果的显著性。Means and Standard Deviations:输出所选变量输出所选变量的均值、标准差和样本个数。的均值、标准差和样本个数。Cross Product Deviations and Covariances:输输出平方和及协方差。出平方和及协方差。*问题的提出问题的提出*品质相关的实质品质相关的实质*Fisher判别法判别法*当只有一个自由度当只有一个自由度(且且)时时Yete矫正法矫正法*品质相关模式概括品质相关模式概括*品质相关的判别方法品质相关的判别方法品质相关与品质相关与SPSS处理处理(1)(1)不同文化程序的人对某一不同文化程序的人对某一(些些)政策的态度,是否相关政策的态度,是否相关?(2)(2)不同富裕程度的农民对土地政策的态度,是否相关不同富裕程度的农民对土地政策的态度,是否相关?(3)(3)不同地区的人与不同工作作风,是否相关不同地区的人与不同工作作风,是否相关?(4)(4)不同培训方法与培训后的业绩增长,是否相关不同培训方法与培训后的业绩增长,是否相关?(5)(5)不同经历的人与他们对某一问题的看法,是否相关不同经历的人与他们对某一问题的看法,是否相关?(6)(6)不同层面的客户的偏好是否与产品不同包装相关不同层面的客户的偏好是否与产品不同包装相关?(7)(7)不同民族与某种习惯是否相关不同民族与某种习惯是否相关?(8)(8)不同观念不同观念(工作作风工作作风)与企业在不同领域的发展是否相与企业在不同领域的发展是否相关关?等等。等等。除此外除此外,类似问题存农业、生物、医药科学中也有广类似问题存农业、生物、医药科学中也有广泛的应用。例如,抽烟与癌症是否相关。泛的应用。例如,抽烟与癌症是否相关。饮食习惯与某种病症是否相关,都是会时常饮食习惯与某种病症是否相关,都是会时常遇到的问题。遇到的问题。品质相关分析在社会科学中的用途很广品质相关分析在社会科学中的用途很广,如:如:表中,表中,表示处于交叉位置的人数表示处于交叉位置的人数(总体中的个体数总体中的个体数)。每个个体至少有每个个体至少有2 2个特征个特征(变量变量)。品质相关模式概括品质相关模式概括状态状态1 1状态状态s s合合 计计因素水平因素水平1 1因素水平因素水平k k 合合 计计 非要用品质相关来处理不可的问题,在个体的两个非要用品质相关来处理不可的问题,在个体的两个特征中,至少有一个是名义级的变量。特征中,至少有一个是名义级的变量。)的一组容量为n的样本检验问题 就转化为检验:区间为将个区间,;设对任何两个随机变量对任何两个随机变量x x、y y,如果,如果对任何对任何随机变量随机变量X X、Y Y之间是相互独立的。之间是相互独立的。得到一个二维总体(,(,;,进而,将的取值范围,分为的取值范围分为s个区间。记属于区间 并且 属于区间 的概率,。而属于区间 的概率。为。于是 随机变量,之间是相互独立的,的概率为。属于、;是否成立的问题:在假设中,与都是未知参数但是由于知参数的个数是。,共,个少了两个自由度,所以,真正要估计的未。都成立则;都成立则;对显著性水平接受备择假设互独立(不相关)将可以用极大似然法得出未知参数的估计值,于是转化为:自由度是对于本问题就是在的假设下,:。“”与的估计值代试就是各个交叉位置上的理想频次”若则接受零假设因素与状态相则拒绝零假设因素与状态显著相关。入上式:自由度是。“。,。,,,中如果总体服从二维正态分布参数均未知与相互独立相互独立的检验问题是::设,为的极大似然估计值,则于是我们可以用 统计量来完成上述假设检验:的显著性概率(外侧概率)与显著性水平较,判断拒绝还是接受这是一个双尾检验问题。,其中那么,等价于,。于是,计值用统比。的值产生较大偏分布是连续的分布是连续的偏差较大时由于由于按照公式:按照公式:在自由度为在自由度为1 1时时,而这里处理的是离散问题而这里处理的是离散问题,所计算的统计量的值就会与,差,特别是在,需要矫正。给出了矫正公式Yete:普通普通相关分析的相关分析的SPSS的实现过程的实现过程:Analyze菜单菜单Correlate项中选择项中选择Bivariate或或Partial或或Distances命令。命令。品质品质相关分析的相关分析的SPSS的实现过程的实现过程:Analyze菜单菜单Descriptive Statistics项中选择项中选择Crosstabs命令。命令。