《【SPSS19教程】第7章SPSS的相关分析剖析.ppt》由会员分享,可在线阅读,更多相关《【SPSS19教程】第7章SPSS的相关分析剖析.ppt(56页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第7 7章章SPSSSPSS的相的相关关分析分析7.1 7.1 相相关关分析分析概概述述7.1.1 相相关关的基本的基本概概念念1.1.函函数关数关系和相系和相关关关关系系 函数关系是指事物或现象之间存在着严格的依存关系,其主要特征是它的确定性,即对一个变量的每一个值,另一个变量都具有惟一确定的值与之相对应。变量之间的函数关系通常可以用函数式Y=f(x)确切地表示出来。例如,圆的周长C对于半径r的依存关系就是函数关系:C=2r。相关关系反映出变量之间虽然相互影响,具有依存关系,但彼此之间是不能一一对应的。例如,学生成绩与其智力因素、各科学习成绩之间的关系、教育投资额与经济发展水平的关系、社会
2、环境与人民健康的关系等等,都反映出客观现象中存在的相关关系。7.1 7.1 相相关关分析分析概概述述2.相相关关关关系的系的类类型型(1)根据相关程度的不同,相关关系可分为完全相关、不完全相关和无相关。(2)根据变量值变动方向的趋势,相关关系可分为正相关和负相关。(3)根据变量关系的形态,相关关系可分为直线相关和曲线相关。(4)根据研究变量的多少,可分为单相关、复相关。7.1.2 7.1.2 相相关关分析分析1.相相关关分析的作用分析的作用(1)判断变量之间有无联系(2)确定选择相关关系的表现形式及相关分析方法(3)把握相关关系的方向与密切程度(4)相关分析不但可以描述变量之间的关系状况,而且
3、用来进行预测。(5)相关分析还可以用来评价测量量具的信度、效度以及项目的区分度等。7.1.2 7.1.2 相相关关分析分析 相关系数是在直线相关条件下,说明两个变量之间相关程度以及相关方向的统计分析指标。相关系数一般可以通过计算得到。作为样本相关系数,常用字母r表示;作为总体相关系数,常用字母表示。相关系数的数值范围是介于1与+1之间(即1 r 1),常用小数形式表示,一般要取小数点后两位数字来表示,以便比较精确地描述其相关程度。两个变量之间的相关程度用相关系数r的绝对值表示,其绝对值越接近1,表明两个变量的相关程度越高;其绝对值越接近于0,表明两个变量相关程度越低。如果其绝对值等于零1,则表
4、示两个变量完全直线相关。如果其绝对值为零,则表示两个变量完全不相关(不是直线相关)。2.相相关关系系数数7.1.2 7.1.2 相相关关分析分析 变量相关的方向通过相关系数r所具有的符号来表示,“+”号表示正相关,即0r1。“”表示负相关,即0 r 1。在使用相关系数时应该注意下面的几个问题。(1)相关系数只是一个比率值,并不具备与相关变量相同的测量单位。(2)相关系数r 受变量取值区间大小及样本数目多少的影响比较大。(3)来自于不同群体且不同质的事物的相关系数不能进行比较。(4)对于不同类型的数据,计算相关系数的方法也不相同。3.相相关关系系数数7.2 SPSS7.2 SPSS在在简单简单相
5、相关关分析中的分析中的应应用用 简单相关分析是研究两个变量之间关联程度的统计方法。它主要是通过计算简单相关系数来反映变量之间关系的强弱。一般它有图形和数值两种表示方式。1 1、相关图、相关图 在统计中制作相关图,可以直观地判断事物现象之间大致上呈现何种关系的形式。相关图是相关分析的重要方法。利用直角坐标系第一象限,把第一个变量置于横轴上,第二个变量置于纵轴上,而将两个变量对应的变量值用坐标点形式描绘出来,用以表明相关点分布状况的图形,这就是相关图 7.2.1 简单相相关关分析的基本原理分析的基本原理7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用2 2、相关系数、相
6、关系数 虽然相关图能够展现变量之间的数量关系,但这也只是种直观判断方法。因此,可以计算变量之间的相关系数。对不同类型的变量应当采取不同的相关系数来度量,常用的相关系数主要有:皮尔逊(Pearson)相关系数 常称为积差相关系数,适用于研究连续变量之间的相关程度。例如,收入和储蓄存款、身高和体重等变量间的线性相关关系。注意Pearson相关系数适用于线性相关的情形,对于曲线相关等更为复杂的情形,系数的大小并不能代表其相关性的强弱。它的计算公式为:利用相关系数r的大小可以判断变量间相关关系的密切程度,具体见表所示。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2.
7、1 7.2.1 简单相相关关分析的基本原理分析的基本原理7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用对Pearson简单相关系数的统计检验是计算t统计量,t统计量服从n-2个自由度的t分布。SPSS会自动计算r统计量和t值,并依据t分布表给出其对应的相伴概率值。Spearman等级相关系数用来度量顺序水准变量间的线性相关关系。它是利用两变量的秩次大小作线性相关分析,适用条件为:两个变量的变量值是以等级次序表示的资料;一个变量的变量值是等级数据,另一个变量的变量值是等距或比率数据,且其两总体不要求是正态分布,样本容量n不一定大于30。7.2 SPSS7.2 SPS
8、S在在简单简单相相关关分析中的分析中的应应用用 从斯皮尔曼等级相关适用条件中可以看出,等级相关的应用范围要比积差相关广泛,它的突出优点是对数据的总体分布、样本大小都不做要求。但缺点是计算精度不高。斯皮尔曼等级相关系数常用符号 来表示。其基本公式为:式中:D是两个变量每对数据等级之差,n是两列变量值的对数。Spearman相关系数计算公式可以完全套用Pearson相关系数的计算公式,但公式中的x和y用它们的秩次代替即可。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用 Kendalls等级相关系数 它是用于反映分类变量相关性的指标,适用于两个变量均为有序分类的情况。这
9、种指标采用非参数检验方法测度变量间的相关关系。它利用变量的秩计算一致对数目和非一致对数目。显然,如果两变量具有较强的正相关,则一致对数目U应较大;但若两变量相关性较弱,则一致对数目U和非一致对数目V应大致相等。故按照此思想,可得其定义为:SPSS将自动计算它的相关系数、检验统计量和对应的概率P值。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2.2 7.2.2 简单简单相相关关分析的分析的SPSSSPSS操作操作详详解解Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Correlate(相关)】【Bivariate(双变量)】命令,弹出【B
10、ivariate Correlations(双变量相关)】对话框,如图7-1所示,这是简单相关检验的主操作窗口。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用 Step02:选择检验变量 在【Bivariate Correlations(双变量相关)】对话框左侧的候选变量列表框中选择两个个或两个以上变量将其添加至【Variables(变量)】列表框中,表示需要进行简单相关分析的变量。Step03:选择相关系数类型 图中的【Correlation Coefficients(相关系数)】选项组
11、中可以选择计算简单相关系数的类型。Pearson:系统默认项,即积差相关系数,计算连续变量或是等间距测度的变量间的相关分析。Kendall:等级相关,计算分类变量间的秩相关。Spearman:等级相关,斯皮尔曼相关系数。对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用Pearson 相关分析;对于完全等级的离散变量必须使用等级相关分析相关性。当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用Spearman 或Kendall相关。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用 Step04:假设检验类型选择 在图中的
12、【Test of Significance(显著性检验)】选项组中可以选择输出的假设检验类型,对应有两个单选项。Two tailed:系统默认项。双尾检验,当事先不知道相关方向(正相关还是负相关)时选择此项。One tailed:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【Flag significant Correlations(标记显著性相关)】复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析
13、中的应应用用Step05:其他选项选择 单击【Options(选项)】按钮,弹出的对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。Statistics:选择输出统计量。Means and standard deviations:将输出选中的各变量的观测值数目、均值和标准差。Cross-product deviations and covariances:输出反映选中的每一对变量之间的叉积离差矩阵和协方差矩阵。MissingValues:用于设置缺失值的处理方式。它有两种处理方式:Exclude cases pairwise:系统默认项。剔除当前分析的两个变量值是缺失的个案。Ex
14、clude cases listwise:表示剔除所有含缺失值的个案后再进行分析。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用Step06:相关统计量的Bootstrap估计 单击【Bootstrap】按钮,在弹出的对话框中可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的Bootstrap 估计。相关性表支持相关性的Bootstrap 估计。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用Step07:单击【OK】按钮,结束操作,SPS
15、S软件自动输出结果。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2.3 7.2.3 实实例分析:股票指例分析:股票指数数之之间间的的联联系系1.1.实实例例内内容容 道琼斯工业平均指数(DJIA)和标准普尔指数500(S&P 500)都被用做股市全面动态的测度。DJIA是基于30种股票的价格动态;S&P 500是由500种股票组成的指数。有人说S&P 500是股票市场功能的一种更好的测度,因为它基于更多的股票。表7-2显示了DJIA和S&P 500在1997年10周内的收盘价。请计算它们之间的样本相关系数。不仅如此,样本相关系数告诉我们DJIA和S&P 50
16、0之间的关系是怎样的?7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用2.2.实例操作实例操作 表给出了道琼斯工业平均指数和标准普尔指数在同一时间点的数值。由于这些数值都是连续型变量,同时根据两个股票指数的散点图,可见它们呈显著的线性相关,因此可以采用Pearson相关系数来测度它们之间的相关性。但为了比较,我们也计算了这两组变量的Kendall和Spearman相关系数。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用3.3.实例结果及分析实例结果及分析(1)描
17、述性统计分析表执行完上面的操作后,首先给出的是当前样本进行描述性统计的结果,如表7-3所示。可以看到样本容量都等于10,道琼斯工业平均指数和标准普尔指数的平均均值分别为7743.60和945.10,两者差距显著。同时,两者的方差差距也很明显。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用(2)Pearson相关系数表 接着SPSS列出了道琼斯工业平均指数和标准普尔指数的Pearson相关系数表7-4。可以看到,两种指数的Pearson系数值高达0.995,非常接近1;同时相伴概率P值明显小于显著性水平0.01,这也进一步说明两者高度正线性相关。7.2 SPSS7.
18、2 SPSS在在简单简单相相关关分析中的分析中的应应用用(3)非参数相关系数表 表7-5列出了两种股票指数的Kendall和Spearman相关系数,分别等于0.994和0.985;同时它们的概率P值也远小于显著性水平。但本案例中,Spearman相关系数和Kendall相关系数都小于Pearson相关系数,显然这是由于在秩变换或数据按有序分类处理时损失信息所导致的。所以,通过以上分析看到,道琼斯工业平均指数和标准普尔指数具有高度正相关性,一个指数的上涨或上跌时,另一个指数也会伴随着上涨或下跌。7.2 SPSS7.2 SPSS在在简单简单相相关关分析中的分析中的应应用用7.3 SPSS7.3
19、SPSS在偏相在偏相关关分析中的分析中的应应用用7.3.1 7.3.1 偏相偏相关关分析的基本原理分析的基本原理1.1.方法方法概概述述 简单相关分析计算两个变量之间的相互关系,分析两个变量间线性关系的程度。但是现实中,事物之间的联系可能存在于多个主体之间,因此往往因为第三个变量的作用使得相关系数不能真实地反映两个变量间的线性相关程度。例如身高、体重与肺活量之间的关系,如果使用Pearson 相关计算其相关系数,可以得出肺活量、身高和体重均存在较强的线性相关性质。但实际上呢,对体重相同的人而言,身高值越大其肺活量也不一定越大。因为身高与体重有着线性关系,肺活量与体重有着线性关系,因此得出了身高
20、与肺活量之间存在较强的线性关系的错误结论。偏相关分析就是在研究两个变量之间的线性相关关系时控制可能对其产生影响的变量。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用2.2.基本原理基本原理 偏相关分析是在相关分析的基础上考虑了两个因素以外的各种作用,或者说在扣除了其他因素的作用大小以后,重新来测度这两个因素间的关联程度。这种方法的目的就在于消除其他变量关联性的传递效应。偏相关系数在计算时可以首先分别计算三个因素之间的相关系数,然后通过这三个简单相关系数来计算偏相关系数,公式如下:上式就是在控制了第三个因素的影响所计算的第一、第二个因素之间的偏相关系数。当考虑一个以上的
21、控制因素时的公式类推。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3.2 7.3.2 偏相偏相关关分析的分析的SPSSSPSS操作操作详详解解 Step01:打开主菜单 选择菜单栏中的【Analyze(分析)】【Correlate(相关)】【Partial(偏相关)】命令,弹出【Partial Correlations(偏相关)】对话框,如图7-9所示,这是偏相关检验的主操作窗口。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用 Step02:选择检验变量 在【Bivariate Correlations(偏相关)】对话框左侧的候选变量列
22、表框中选择两个或两个以上变量,将其添加至【Variables(变量)】列表框中,表示需要进行偏相关分析的变量。Step03:选择控制变量 在【Bivariate Correlations(偏相关)】对话框左侧的候选变量列表框中至少选择一个变量,将其添加至【Controlling for(控制)】列表框中,表示在进行偏相关分析时需要控制的变量。注意如果不选入控制变量,则进行的是简单相关分析。Step04:假设检验类型选择 在【Test of Significance(显著性检验)】选项组中可以选择输出的假设检验类型,对应有以下两个选项。Two tailed:系统默认项。双尾检验,当事先不知道相关
23、方向(正相关还是负相关)时选择此项。One tailed:单尾检验,如果事先知道相关方向可以选择此项。同时,可以勾选【Flag significant Correlations】复选框。它表示选择此项后,输出结果中对在显著性水平0.05下显著相关的相关系数用一个星号“*”加以标记;对在显著性水平0.01下显著相关的相关系数用两个星号“*”标记。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用Step05:其他选项选择 单击【Options】按钮,弹出的对话框用于指定输出内容和关于缺失值的处理方法,主要包括以下选项。Statistics:选择输出统计量。Means and
24、 standard deviations:将输出选中的各变量的观测值数目、均值和标准差。Zero-order correlation:显示零阶相关矩阵,即Pearson 相关矩阵。MissingValues:用于设置缺失值的处理方式。它有两种处理方式:Exclude cases pairwise:系统默认项。剔除当前分析的两个变量值是缺失的个案。Exclude cases listwise:表示剔除所有含缺失值的个案后再进行分析。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用Step06:相关统计
25、量的Bootstrap估计 单击【Bootstrap】按钮,在弹出的对话框中可以进行如下统计量的Bootstrap估计。描述统计表支持均值和标准差的Bootstrap 估计。相关性表支持相关性的Bootstrap 估计。Step07:单击【OK】按钮,结束操作,SPSS软件自动输出结果。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3.3 7.3.3 实实例分析:股票市例分析:股票市场场和和债债券市券市场场1.1.实例内容实例内容 在我国的金融市场中,股票市场和债券市场都是其中的重要组成部分。研究它们之间的关系有利于我们弄清楚金融市场之间的关联特征。但是我国债券市
26、场主要由银行间债券市场和证券交易所债券市场组成,并且它们处于相对分割状态,在投资主体、交易方式等方面存在显著差异。数据文件7-2.sav列出了近几年我国股票市场、交易所国债市场和银行间国债市场的综合指数,请利用相关分析研究这三个市场的关联特征 7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用2.2.实实例操作例操作 由于这里要研究三个金融市场之间的关系,因此首先可以利用7.2节的简单相关分析来初步探讨它们之间的联系。表7-6计算了这三个市场之间的Pearson相关系数。从表中数据看到,三个市场间的价格相关系数较高,其中交易所和银行间国债市场相关系数高达0.922,而它们
27、和股市的相关系数相对较低,分别是0.411和0.419,从数值大小看到这两个子市场和股市的关联性差异不明显。但是,就相关系数本身而言,它未必是两事物间线性关系强弱的真实体现,往往有夸大的趋势,因为它在计算时都没有考虑第三方的影响,这就有可能导致对事物的解释出现偏差。这里,股市、银行间国债市场和交易所国债市场之间肯定是相互关联的,两个市场间的关系强弱肯定要受到第三方的影响制约,市场间的关系强弱可能存在传递效应。基于这种考虑,这里要引入偏相关系数测度市场间的关系。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用3.3.实实例例结结果及分析果及分析(1)描述性统计分析表 执行
28、完上述操作后,首先给出的是当前样本进行描述性统计的结果表7-7。可以看到样本容量都等于1321,三个市场综合指数的样本均值和样本方差都有一定的差距。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用(2)偏相关系数表 表7-8表7-10列出了三个市场之间的偏相关系数。在控制了股市指数后,银行间和交易所市场间的相关系数没有发生太大变化,仍然高达0.906,说明了这两个市场的关系密切且股市对两市波动影响较小。而银行间国债市场、交易所国债市场与股市的偏相关系数却发生了显著变化:银行间市场和股市的Pearson相关系数为0.419,而在控制了交易所指数后,它们之间的偏相关系数下降
29、为0.114;同理,交易所国债市场和股市的相关系数也由0.411下降到0.070。这说明了第三方市场对剩余两个市场确实存在显著影响,通过简单相关系数还无法深入刻画市场之间的关系。这里引入偏相关系数是比较适合的。7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.3 SPSS7.3 SPSS在偏相在偏相关关分析中的分析中的应应用用7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用7.4.1 7.4.1 距离分析的基本原理距离分析的基本原理 简单相关分析和偏相关分析有一个共同点,那就是
30、对所分析的数据背景应当有一定程度的了解。但在实际中有时会遇到一种情况,在分析前对数据所代表的专业背景知识尚不充分,本身就属于探索性的研究。这时就需要先对各个指标或者案例的差异性、相似程度进行考察,以先对数据有一个初步了解,然后再根据结果考虑如何进行深入分析。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用 距离分析是对观测量之间或变量之间相似或不相似的程度的一种测度,是计算一对变量之间或一对观测量之间的广义的距离。根据变量的不同类型,可以有许多距离、相似程度测量指标供用户选择。但由于本模块只是一个预分析过程,因此距离分析并不会给出常用的P值,而只能给出各变量/记录间的距离大
31、小,以供用户自行判断相似性。调用距离分析过程可对变量内部各观察单位间的数值进行距离相关分析,以考察相互间的接近程度;也可对变量间进行距离相关分析,常用于考察预测值对实际值的拟合程度,也可用于考察变量的相似程度。在距离分析中,主要利用变量间的相似性测度(Similarities)和不相似性测度(Dissimilarities)度量研究对象之间的关系。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用7.4.2 7.4.2 距离分析的距离分析的SPSSSPSS操作操作详详解解Step01:打开对话框选择菜单栏中的【Analyze(分析)】【Correlate(相关)】【Dista
32、nces(距离)】命令,弹出【Distances(距离)】对话框,这是距离分析的主操作窗口。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用 Step02:选择检验变量 在【Distances(距离)】对话框左侧的候选变量列表框中选择两个或两个以上变量,将其添加至【Variables(变量)】列表框中,表示需要进行距离分析的变量。同时可以选择一个字符型标示变量移入【Label Cases(标注个案)】列表框中,在输出中将用这个标示变量值对各个观测量加以标记。缺省时,输出中用观测量的序号来标记。Step03:选择分析类型 在【Compute Distances(计算距离)】选
33、项组中可以选择计算何种类型的距离。Between cases:系统默认项。表示作变量内部观察值之间的距离相关分析。Between variables:表示作变量之间的距离相关分析。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用Step04:测度类型选择 在【Measure(度量标准)】选项组中可以选择分析时采用的距离类型。Dissimilarities:系统默认项。不相似性测距,系统默认采用欧式距离测度观测值或变量之间的不相似性。Similarities:相似性测距。系统默认使用Pearson相关系数测度观测值或变量之间的相似性。Step05:完成操作单击【OK】按钮,结
34、束操作,SPSS软件自动输出结果。上述第四步中除了采用系统默认的距离测度类型外,还可以根据用户的需要自己选择测度类型,由于这里专业性很强,而且实际中使用很少,下面只做些简单的介绍。在【Distances(距离)】对话框中,选择【Dissimilarities(不相似性)】距离类型后,单击【Measure】按钮,弹出下图所示的对话框。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用选择【Similarities(相似性)】时各种数据类型可用的测距方法有以下几种。Interval:计量资料。Pearson co
35、rrelation:以Pearson相关系数为距离。Cosine:以变量矢量的余弦值为距离,界于-1至+1之间。Binary:二分类变量。Russell and Rao:以二分点乘积为配对系数。Simple matching:以配对数与总对数的比例为配对系数。Jaccard:相似比例,分子与分母中的配对数与非配对数给予相同的权重。Dice:Dice配对系数,分子与分母中的配对数给予加倍的权重。Rogers and Tanimoto:Rogers and Tanimoto配对系数,分母为配对数,分子为非配对数,非配对数给予加倍的权重。Sokal and Sneath 1:Sokal and Sn
36、eath 型配对系数,分母为配对数,分子为非配对数,配对数给予加倍的权重。Sokal and Sneath 2:Sokal and Sneath 型配对系数,分子与分母均为非配对数,但分子给予加倍的权重。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用Sokal and Sneath 3:Sokal and Sneath 型配对系数,分母为配对数,分子为非配对数,分子与分母的权重相同。Kulczynski 1:Kulczynski 型配对系数,分母为总数与配对数之差,分子为非配对数,分子与分母的权重相同。Kulczynski 2:Kulczynski平均条件概率。Sokal
37、 and Sneath 4:Sokal and Sneath条件概率。Hamann:Hamann概率。Lambda:Goodman-Kruskai相似测量的值。Anderbergs D:以一个变量状态预测另一个变量状态。Yules Y:Yule综合系数,属于22四格表的列联比例函数。Yules Q:Goodman-Kruskal 值,属于22四格表的列联比例函数。Ochiai:Ochiai二分余弦测量。Sokal and Sneath 5:Sokal and Sneath 型相似测量。Phi 4 point correlation:Pearson相关系数的平方值。Dispersion:Disp
38、ersion相似测量。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用进行标准化的方法在【Standized(标准化)】后面的下拉列表中。单击矩形框右面的箭头按钮展开下拉列表,可选择的标准化方法如下。None:不作数据转换,系统默认项。Z-Scores:作标准Z分值转换,此时均值等于0,标准差等于1。Range-1 to 1:作-1至+1之间的标准化转换。Range 0 to 1:作0至1之间的标准化转换。Maximum magnitude of 1:作最大值等于1的标准转换。Mean of 1:作均数单位转换。Standard deviation of 1:作标准差单位转
39、换。【Transform Values(转换值)】复选项:选择测度转换方法。在距离测度计算完成后,才进行对测度的转换。共有3 个转换方法可以选择。每种转换方法给出一种转换结果。3 种转换方法可以同时选择。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用Abosolute values:对距离取绝对值。当符号表明的是相关的方向,且仅对相关的数值感兴趣时使用这种转换。Change sign:改变符号。把相似性测度值转换成不相似性测度值或相反。Rescale to 01 range:重新调整测度值到范围01转换法。对已经按有意义的方法标准化的测度,一般不再使用此方法进行转换。7.
40、4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用7.4.3 7.4.3 实实例分析:价格指例分析:价格指数数的相的相关关性性1.1.实例内容实例内容 价格指数是用来反映不同时期商品价格水平的变化方向、趋势和程度的经济指标,它属于经济指数的一种,通常以报告期和基期相对比的相对数来表示。价格指数是研究价格动态变化的一种工具,它为制定、调整和检查各项经济政策,特别是价格政策提供依据。表7-11列出了我国1991年2005年间居民消费价格指数、城市居民消费价格指数、农村居民消费价格指数、商品销售价格指数、工业品出厂价格指数、原材料等购进价格指数和固定资产投资价格指数。请研究这些价格指数
41、之间的关系。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用2.2.实实例操作例操作 本案例要讨论居民消费价格指数等七类价格指数之间关联特征。由于这些价格指数的构成复杂,因此可以采用距离分析来探讨它们之间的关系。由于都属于连续型数据,这里可以选择不相似性测距中的欧式距离来测度。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用3.3.实实例例结结果及分析果及分析(1)基本统计汇总表 表7-12是对个案的基本统计汇总分析。本案例的样本数目等于15,没有缺失数据。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用(2)距离矩阵 表7-13是根据欧式距离计算出的各个价格指数之间的距离。如果距离数值越小,说明两个价格指数越相关;反之。可以看到,居民消费价格指数和城市居民消费价格指数、农村居民消费价格指数和商品销售价格指数的距离都较小,说明它们都反映了社会总体或某方面价格水平的高低;但是它和工业品出厂价格指数、原材料等购进价格指数和固定资产投资价格指数的距离都较大,说明这些价格指数反映的类型有较大差别。其余指数之间的关系可以类似分析。7.4 SPSS7.4 SPSS在距离分析中的在距离分析中的应应用用
限制150内