【教学课件】第三讲SPSS的主要窗口和菜单.ppt
《【教学课件】第三讲SPSS的主要窗口和菜单.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第三讲SPSS的主要窗口和菜单.ppt(114页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三讲 SPSS的主要窗口和菜单1 SPSS的的3个主要窗口个主要窗口1-1 数据编辑器窗口(数据编辑器窗口(SPSS Data Editor):用来编辑和显):用来编辑和显示数据;在此窗口中的文件名称为示数据;在此窗口中的文件名称为*.sav。1-2 程序语句编辑器窗口(程序语句编辑器窗口(SPSS Syntax Editor):用来):用来编写各种程序;在此窗口中的文件名称为编写各种程序;在此窗口中的文件名称为*.sps。1-3 结果观看窗口(结果观看窗口(SPSS Viewer):显示统计运算结果;):显示统计运算结果;在此窗口中的文件名称为在此窗口中的文件名称为*.spo。2 SPSS
2、 数据编辑器的主要菜单数据编辑器的主要菜单2-1 File 菜单:文件管理菜单:文件管理 New;Open;Save;Save as;Exit。2-2 Edit 菜单:编辑菜单:编辑 Undo;Cut;Copy;Paste;Clear;Find;2-3 View菜单:视图菜单:视图 Fonts;Grid lines;Value labels。2-4 Data菜单:数据整理菜单:数据整理define variables;Insert variables;Insert case;go to case;sort case;select case。2-5 Transform菜单:数据转换菜单:数据转换
3、recode;compute;count。2-6 Statistics菜单:统计菜单:统计2-7 Graphs菜单:统计图菜单:统计图2-8 Utilities菜单:工具附件菜单:工具附件2-9 Windows菜单:窗口菜单:窗口2-10 Help菜单:帮助菜单:帮助第四讲 SPSS的单变量描述统计1 单变量描述统计介绍单变量描述统计介绍A变量的尺度:a 定类 Category Scale:只能计次b 定序 Ordinal Scale:计次、排序c 定距 Interval Scale:计次、排序、加减d 定比 Ratio Scale:计次、排序、加减、乘除B变量的统计描述:分布 Distrib
4、ution集中趋势 Central tendency离散趋势 Dispersion分布平均数中位数众数离散程度离散程度2 SPSS的单变量描述统计命令的单变量描述统计命令 A Frequencies:频数统计频数统计StatisticsSummarizeFrequencies变量值频数百分比有效百分比累计百分比中位数中位数百分比和有效百分比百分比和有效百分比B Descriptives:定距变量描述统计定距变量描述统计StatisticsSummarizeDescriptives变量名平均数标准差最小值最大值第四讲 SPSS的双变量关系描述统计(一)列联与方差分析1、变量关系概述、变量关系概述
5、寻找变量间的关系是科学研究的首要目的。变量寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。间的关系最简单的划分即是有关与无关。在统计学上,我们通常这样判断变量之间是否有在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则如果一个变量的变化不引起另一个变量的变化则二者无关。二者无关。性别与四级英语考试通过率的相关统计性别与四级英语考试通过率的相关统计表述:统计结果显示,
6、当性别取值不同时,通过率表述:统计结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率变量的取值并未发生变化,因此性别与考试通过率无关。无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上无差异,两变量无关。自变量的不同取值在因变量上有差异,两变量有关。自变量的不同取值在因变量上有差异,两变量有关。因变量自变量表述:统计结果显示,当性别取值不同时,收入变表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。量的取值发生了变化,因此性别与月收入有关。自变量因变量2、双变量关系的统计类型、双变量关系的统计类型3、列
7、联统计、列联统计3-1 列联表的格式列联表的格式自变量因变量人数行百分比列百分比总百分比边缘百分比边缘百分比条件百分比3-2 列联分析的原理:列联分析的原理:自变量发生变化,因变量取值是否也发生变化。自变量发生变化,因变量取值是否也发生变化。比较边缘百分比和条件百分比的差别比较边缘百分比和条件百分比的差别。4-1)变量关系强度的含义变量关系强度的含义:指两个变量相关程度的高低。统计学中是以准实指两个变量相关程度的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度验的思想来分析变量相关的。通常从以下的角度分析:分析:A)两变量是否相互独立。)两变量是否相互独立。B)两变量是否有共变
8、趋势。)两变量是否有共变趋势。C)一变量的变化多大程度上能由另一变量的变)一变量的变化多大程度上能由另一变量的变化来解释。化来解释。4 列联变量的关系强度测量列联变量的关系强度测量4-2)双变量关系强度测量的主要指标双变量关系强度测量的主要指标4-3)卡方测量的原理:)卡方测量的原理:卡方测量用来考察两变量是否独立(无关)。其原理是根据这一概率定理:若两变量无关,则其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发两变量中联合事件发生的概率应等于各自独立发生的概率乘积。生的概率乘积。在列联表中,这一定理就具体转化为:在列联表中,这一定理就具体转化为:若两变量无
9、若两变量无关,则两变量中条件概率应等于各自边缘的概率乘关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。积。反之,则两变量有关,或,两变量不独立。示例示例151565 5观察值边缘概率边缘概率边缘概率期望条件概率 9 9-9-9残差由此可见,期望值(独立模型)与观察值期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就的差距越大,说明两变量越不独立,也就越有相关。越有相关。因此,卡方的表达式如下:卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2)两种。4-4)的改进
10、标准化系数的改进标准化系数:为使 值有一固定的区间,便于比较,采用了以下几个修正:A、系数(Phi):(01),适用于22表。B、列联系数(Contingency Coefficient):(01),适用任意表。C、Cramer V系数:(01),适用任意表。D、系数(Lambda):(01),适用任意表。E、Goodman&Kruskal-tau系数:(01),适用任 意表。5 列联统计命令:列联统计命令:StatisticsSummarizeCrosstabs第五讲 SPSS的双变量关系描述统计(二)分组平均数比较(方差分析)1、分组平均数比较的含义、分组平均数比较的含义当一个变量为定类变
11、量,另一变量为定距变量时,当一个变量为定类变量,另一变量为定距变量时,两变量间是否有关,通常以分组平均数比较的方两变量间是否有关,通常以分组平均数比较的方法来考察。即按照定类变量的不同水平来分组,法来考察。即按照定类变量的不同水平来分组,看每个分组的定距变量的平均数是否有差异。不看每个分组的定距变量的平均数是否有差异。不同组间的平均数差异越小,两个变量间的关系越同组间的平均数差异越小,两个变量间的关系越弱;相反,平均数差异越大,变量间关系越强。弱;相反,平均数差异越大,变量间关系越强。2、分组平均数比较的格式、分组平均数比较的格式3、定类、定类定距变量的关系强度测量定距变量的关系强度测量定类变
12、量和定距变量的关系强度测量采用定类变量和定距变量的关系强度测量采用F统计的统计的方法,即方差分析。方法,即方差分析。3-1 F统计的原理统计的原理F统计的目的是分析分组的平均数是否相等。如果统计的目的是分析分组的平均数是否相等。如果相等,说明组间没有差别;如果不相等,说明组间相等,说明组间没有差别;如果不相等,说明组间平均数有差异,这时分组是有效的。但平均数有差异,这时分组是有效的。但F统计独特统计独特的地方是,它并不直接利用平均数来比较,而是利的地方是,它并不直接利用平均数来比较,而是利用与方差有关的统计指标总变差(用与方差有关的统计指标总变差(SST)、组间变)、组间变差(差(SSB)、组
13、内变差()、组内变差(SSW)的关系来进行判别。)的关系来进行判别。男男女女收收入入Y总总=800元元Y女女=800元元Y男男=800元元男男女女收收入入Y总总=800元元Y女女=600元元Y男男=1000元元收收入入YiYi男男女女SST=SSB+SSW三者的关系是三者的关系是:SST是总变差,即未分组的数据的变差,总方差的分子是总变差,即未分组的数据的变差,总方差的分子。SSTSSB+SSWSSB是组间变差,各组平均数与总平均数的离差平方和是组间变差,各组平均数与总平均数的离差平方和SSW是组内变差,每组数据和该组平均数的离差平方和。是组内变差,每组数据和该组平均数的离差平方和。由于方差和
14、变差标志着每一数据对其平均数的偏离(即由于方差和变差标志着每一数据对其平均数的偏离(即异质性),因此,异质性),因此,F值(值(F=SSB/SSW)含义就可理解为)含义就可理解为组间异质性和组内异质性的比较。组间异质性和组内异质性的比较。F值的范围在值的范围在 0到正无到正无穷大之间。当穷大之间。当F值值1,则说明组与组间的差别大于组内,则说明组与组间的差别大于组内的差别,也就说明这时组间平均数的差异是存在的。的差别,也就说明这时组间平均数的差异是存在的。3-2定类定类定距变量的关系强度系数定距变量的关系强度系数Eta2F值和列联统计中的值和列联统计中的X2一样,取值范围在一样,取值范围在0到
15、正无穷到正无穷大之间。因此,也需要对大之间。因此,也需要对F值加以修正,形成一个值加以修正,形成一个标准化的关系系数。标准化的关系系数。Eta2就是这样的一个系数。就是这样的一个系数。Eta2=SSB/SST即在总变差中,组间变差所占的比例。即在总变差中,组间变差所占的比例。Eta2的取值的取值范围在范围在0+之间,越接近之间,越接近1,就表明组间差异越大;,就表明组间差异越大;越接近越接近0,就表明组间平均数趋于一致。,就表明组间平均数趋于一致。Eta2=0.0264 SPSS中分组平均数和方差分析的统计命令中分组平均数和方差分析的统计命令StatisticsCompare MeansMea
16、ns第六讲 SPSS的双变量关系描述统计(三)相关1 定距定距定距尺度定距尺度 (Pearson Cor.)1)相关的含义)相关的含义:相关相关(Correlation)是用来作两个定距变量关系是用来作两个定距变量关系的统计分析,考察两变量是否存在共同变化的趋的统计分析,考察两变量是否存在共同变化的趋势。如年龄与收入。势。如年龄与收入。2)积矩相关的统计原理:)积矩相关的统计原理:两变量共同变化的趋势在统计中用两变量共同变化的趋势在统计中用共变异数共变异数(Covariance)来表示。即来表示。即A变量的取值从低到变量的取值从低到高(或从高到低)变化时,高(或从高到低)变化时,B变量是否也同
17、样发变量是否也同样发生变化。生变化。当两变量在同一方向上变化,称为有正相关;相反当两变量在同一方向上变化,称为有正相关;相反方向变化,称为负相关;无变化即无相关。相关系方向变化,称为负相关;无变化即无相关。相关系数即用来表示相关的程度。数即用来表示相关的程度。如:X(丈夫收入丈夫收入);Y(妻子收入妻子收入)YXP(xi,yi)Y=kkP(xi,yi)+-+共变异数共变异数(协方差协方差)=+-+散点越集中于散点越集中于1、3象限,共变异数的和正值约大;象限,共变异数的和正值约大;散点越集中于散点越集中于2、4象限,共变异数的和负值约大;象限,共变异数的和负值约大;散点越均匀分布于各象限,共变
18、异数的和越趋近于散点越均匀分布于各象限,共变异数的和越趋近于0。3)相关系数的计算公式:)相关系数的计算公式:由此公式可看出:由此公式可看出:1 相关就是共变异数的标准化。相关就是共变异数的标准化。2 相关系数相关系数r的取值范围在(的取值范围在(-1,+1)之间。)之间。+1代表完全正相关;代表完全正相关;-1表示完全负相关;表示完全负相关;0 表示无相关。表示无相关。示例:通过此题来演算相关系数示例:通过此题来演算相关系数。2 定序定序定序尺度定序尺度 (Spearman Cor.)积差相关的公式:积差相关的公式:积差相关又称等级相关,用来考察两个定序变量间积差相关又称等级相关,用来考察两
19、个定序变量间的相关关系。它的公式是由积矩相关转变而来,的相关关系。它的公式是由积矩相关转变而来,其中,D是每一对因变量和自变量的序数的差值;N是总的排序的序数。示例:示例:3 SPSS中的相关统计命令中的相关统计命令Statistics-Correlate-Bivariate4 相关统计的输出格式相关统计的输出格式相关系数人数1 回归的含义:回归的含义:回归(回归(Regression,或,或Linear Regression)和相)和相关同样都用来分析两个定距变量间的关系,但回关同样都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为归有明确的因果关系假设。即要假设
20、一个变量为自变量,一个为因变量,自变量对因变量的影响自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学表达,它具有统计构建了变量间因果关系的数学表达,它具有统计预测功能。预测功能。第六讲 SPSS的双变量关系描述统计(四)线性回归2 回归的统计原理:回归的统计原理:两个定距变量的回归是用函数两个定距变量的回归是用函数y=f(x)来分析的。我们最常用的是一元回归方程来分析的。我们最常用的是一元回归方程其中其中x为自变量;为自变量;y为因变量;为因变量;a为截距,即常量;为截距,即常量;b为回归系
21、数,表明自变量对因变量的影响程度。为回归系数,表明自变量对因变量的影响程度。Y=350+20 xY=350+20 x在统计学中,这一方程中的系数是靠在统计学中,这一方程中的系数是靠x与与y变量的变量的大量数据拟合出来的。大量数据拟合出来的。XYY=a+bx(x,y)由图中可以看出,回归直线应该是到所有数据点最由图中可以看出,回归直线应该是到所有数据点最短距离的直线。该直线的求得即使用短距离的直线。该直线的求得即使用“最小二乘方最小二乘方法法”,使,使:在拟合的回归直线方程中,回归系数:在拟合的回归直线方程中,回归系数:表示表示x每变化一个单位时,每变化一个单位时,x与与y共同变化的程度(共共同
22、变化的程度(共变异数)。变异数)。常数常数比如通过上学年数和工资的关系计算得出下列的比如通过上学年数和工资的关系计算得出下列的回归公式:回归公式:y=472+14.8x就可知上学年数每增长就可知上学年数每增长1年,工资会增加年,工资会增加14.8元;元;也可推测,上学年数为也可推测,上学年数为15年的人,工资收入应为年的人,工资收入应为472+14.8*15=694元。元。3 SPSS线性回归的统计命令线性回归的统计命令StatisticsRegressionLinear自变量因变量回归方式4 SPSS线性回归的输出格式:线性回归的输出格式:常数自变量回归系数标准化回归系数每月工资每月工资=8
23、23.3-3.487年龄年龄1 推断统计的一般概念推断统计的一般概念1.1 推断统计的含义及类型:推断统计的含义及类型:(1)含义:推断统计是指用概率分布的方法,)含义:推断统计是指用概率分布的方法,由由样本的统计量样本的统计量推断推断总体参数总体参数的统计方式。的统计方式。第七讲:SPSS的推断统计(一)参数估计和单变量的假设检验样本统计量样本统计量:样本中某个变量的统计值。如此次调:样本中某个变量的统计值。如此次调查中高中文化程度的人占查中高中文化程度的人占32%。样本样本 32%总体参数总体参数:与样本中某个变量的统计值相对应的:与样本中某个变量的统计值相对应的总体中的统计值。如全市人口
24、中高中比例为总体中的统计值。如全市人口中高中比例为38%。总体总体38样本统计量有可能等于总体参数,也有可能不等样本统计量有可能等于总体参数,也有可能不等于总体参数,但二者之间有着某种概率关系。于总体参数,但二者之间有着某种概率关系。推推断统计就是教会我们如何利用这种概率关系来由断统计就是教会我们如何利用这种概率关系来由样本统计量推估总体参数。样本统计量推估总体参数。为了区别样本和总体的不同,样本的平均数用为了区别样本和总体的不同,样本的平均数用来表示,标准差用来表示,标准差用S表示;总体的平均数用表示;总体的平均数用表表示,标准差用示,标准差用表示。因此,推断统计往往表示。因此,推断统计往往
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第三 SPSS 主要 窗口 菜单
限制150内