SPSS上机指导书.doc
《SPSS上机指导书.doc》由会员分享,可在线阅读,更多相关《SPSS上机指导书.doc(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS软件上机指导书北京交通大学经济管理学院前言SPSS(Statistics Package for Social Science)社会科学统计软件包是世界著名的统计分析软件之一。20世纪60年代末,由美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS。20世纪80年代以前,SPSS统计软件主要应用于企事业单位。1984年SPSS总部首先推出了世界第一个统计分析软件微机版本到今,已推出9个语种版本,应用于自然科学、技术科学、社会科学的各个领域,如经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。世界上许多有影响的报刊杂志对SPSS的自动统计绘图、数据的深
2、入分析、使用方便、功能齐全等方面给予了高度的评价与称赞。SPSS for Windows是一个组合式软件包,它集数据整理、分析功能于一身。SPSS的基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS也有专门的绘图系统,可以
3、根据数据绘制各种图形。SPSS for Windows的分析结果清晰、直观、易学易用,而且可以直接读取EXCEL及DBF数据文件,它和SAS、BMDP并称为国际上最有影响的三大统计软件。和国际上几种统计分析软件比较,它的优越性更加突出。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。SPSS for Windows操作简单,它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作
4、服务。目 录上机1:描述统计3一、上机目的3二、上机要求3三、上机演示内容与步骤3四、上机1报告概要15上机2:统计图的绘制15一、上机目的15二、上机演示内容与步骤15三、上机2报告概要28上机3:点估计与区间估计32一、上机目的32二、上机演示内容与步骤32上机4:相关分析41一、上机目的41二、上机演示内容与步骤演示41上机5:回归分析45一、上机目标45二、上机要求45三、上机演示内容与步骤45上机1:描述统计一、上机目的1学会应用两种以上的方法完成描述统计学所学的统计量的计算程序;如列出数据的频数分布表;计算算术平均数、中位数、众数;计算全距、四分位差、标准差、方差等。2能够完成统计
5、图的绘制(主要包括直方图、曲线图、饼形图、茎叶图);3能够撰写出规范的描述统计分析报告。二、上机要求1前20分钟,主讲老师通过例题演示描述统计方法的应用;2中间70分钟,学生仿照演示题,独立做一个练习题目;期间老师课堂巡视,随时解决学生提出的问题;3后20分钟,每位同学将自己的计算结果,以Word形式,撰写成统计分析报告,老师给出是否合格的评价。4在完成练习题的时候,鼓励学生之间相互交流探讨;5鼓励学生尝试发现软件的新功能。三、上机演示内容与步骤下面给出的一个例题是来自SPSS软件自带的数据文件“Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相
6、关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。计算各项描述统计量值的程序使用步骤如下:步骤1:用SPSS打开已知的数据文件选择菜单“FileOpenData”,在对话框中找到需要分析的数据文件“SPSS/Employee data”,然后选择“打开”。打开的数据文件显示如下:步骤2:计算所要求的描述统计量值及频数分布频数就是一个变量在各个变量值上取值的个案数。如要了解公司员工的薪水情况,需要知道所有员工薪水状况,以及在每个薪酬水平上有多少个员工,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,
7、它可以使人们非常清楚地了解变量取值的分布情况。1打开文件之后,选择菜单“AnalyzeDescriptive StatisticsFrequencies”。见下图。出现如下窗口之后,按后面的说明进行选项。2确定所要分析的变量本例中假设要分析的变量是雇员的当前工资(Current Salary)。此时,要在“Frequencies对话框”中选中左侧列表框中的“Current SalarySalary”,之后点击列表框中间的箭头按钮,将变量Current Salary加入到右侧Variable(s)列表框中。然后,选择位于小窗口下端的“Display frequency tables复选框”,以确
8、定要输出频数分布表。3选择所要计算的统计量在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,打开统计量对话框,如下图所示,选择统计输出选项。4选项说明(1)Percentile Values 栏Quartiles:显示25%,50%,75%的四分位数值在Cut points for _equal groups小框内,输入整数k时,表示将所选变量的数值从小到大划分为k等分,并将输出各等分点处的变量数值在Percentile(s)右边的小框内,键入0100间的一个数之后,单击Add按钮添加到下面的方框内,此操作过程可以重复。例如输入15,55,85时,输出结果将会显示15%,55
9、%,85%百分位处的变量值。单击Change和Remove按钮可以修改或删除框内的数值(2)Dispersion(离中趋势)栏各统计量符号表示如下:Std deviation 标准差 ;Minimum 最小值;Variance 方差 ;Maximum 最大值;Range 极差(3)Central Tendency(集中趋势)栏各统计量符号表示如下:Mean 均值(算术平均数);Mode 众数;Median 中位数;Sum 总和(4)Distribution(分布特征)栏各统计量符号表示如下:Skewness 偏度;Kurtosis 峰度步骤3:结果输出与分析点击Frequencies对话框中的
10、“OK”按钮,即得到下面的结果。(1)Statistics(统计量)汇总表从Statistics表中可以清楚的看到当前薪水(Current Salary)的各项描述统计量的数值,这些数值是按我们上一步选定的计算统计量的要求而计算的。我们可以看出,要求计算的均值、众数、标准差、方差等都在其中,分别为$34419.6、$30750、$17075.7、$2.9E+08。(2)Frequencies(频数)分布表从Frequencies表中可以清楚的看到在不同薪酬档次上员工的人数、所占比例。例如,薪水为$15250的员工有1人,占所有员工的0.2%。本处,没有对结果进行详细说明,希望同学们要学会解释所
11、计算的结果。到此为止,有关描述统计量与频数分布的spss计算步骤演示完毕。下面我们给出另一种计算程序,希望同学们也熟练掌握。描述统计数据探索(Explore)方法调用此过程可对变量进行更为深入详尽的描述性统计分析,故称之为探索分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面,对数据分析更进一步。探索分析一般通过数据文件在分组与不分组的情况下获得常用统计量和图形。一般以图形方式输出,直观帮助研究者确定奇异值、影响点、还可以进行假设检验,以及确定研究者要使用的某种统计方式是否合适。步骤1: 在打开的数据文件上,选择如下命令:选择菜单“AnalyzeDe
12、scriptive StatisticsExplore”,打开Explore对话框。步骤2: 确定所要计算的变量及描述统计量假定我们仍然研究的是前面给出的例题,想给出同样的计算结果。操作步骤如下:(1) 选择要研究的变量。从左侧源变量清单中选择“当前工资(Current Salary)”移至Dependent List(因变量)框中,若此时单击OK,即可获得所有系统默认的选项下作出的描述统计量的结果。(2)对数据分组。若想对数据先分组,然后再计算该变量的相关描述统计量时,则应从左侧源变量清单中选择一个或几个分组变量移至Factor List(因素)框,本例中,选择的分组变量是“雇员类别(Emp
13、loyment Category)”,若此时单击OK,即可获得因变量按各分组变量进行的各项系统默认的分组探索结果。(3)选择想要计算的描述统计量。在出现如下小对话窗口(Explore:Statistics)后,需要进行选项,以说明对选择好的变量要计算的是哪些描述统计量值。其各项选择说明如下。Descriptives:选择该选项则一次性地输出所有的描述统计量值,如算术平均值、中位数、众数、5%调整平均数、标准差、极差、方差等。因此不必逐一选择各个描述统计量其他项目简单说明如下:Confidence Interval for Mean将显示总体均值的95%置信区间,95%为系统默认的置信概率。取值
14、范围为199。M-estimators:输出稳健极大似然估计量Outliers:输出5个最大和最小的观测值Percentiles:输出5%,10%,25%,50%,75%,90%,95%的百分位数(4)对所要计算的变量的频数分布及其统计量值作图打开“Plots对话框”,出现如下图形。对有关的部分选项说明如下: Boxplots(箱图)选项栏Factor levels together:将每个因变量对于不同分组的箱图并列显示,利于比较各组在因变量同一水平上的差异Dependents together:所有因变量生成一个箱图,这样可以比较分组变量同一水平上各个因变量值的分布情况None:表示不显示
15、箱图 Descriptives栏Stem-and-leaf:显示茎叶图Histogram:显示直方图 选中Normality plots with tests框中输出显示正态分布图形,同时输出KolmogorovSmirnov统计量中的Lilifors显著性水平 Spread vs. Level with Levene Test框输出散布层次图,其中包括回归直线斜率以及方差齐次性的Levene检验。如果没有指定分组变量,那么此选项无效,其中:None:表示不生成散布层次图Power estimation:转换幂值估计,表示对每一组数据产生一个中位数范围的自然对数与四分位范围的自然对数的散点图T
16、ransformed:对原始数据进行转换,由用户在Power下拉框中指定幂变换使用的幂值,Power下拉框共有:三次方(Cube)、平方(Square)、平方根(1/Square root)、取对数(Logarithm)等Untransformed:不对原始数据进行转换步骤3: 结果的输出与说明(1)Case Processing Summary表在Case Processing Summary表中可以看出Clerical个案363,Custodial个案27,Manager个案84,均无缺失值。(2)Descriptives表Descriptives表是Current Salary变量的分组
17、描述统计结果。表的第一部分是Clerical薪水的统计,其中包括均数$27838.5,均数的标准误为$397.217,均数的95%置信区间为$27057.4$29619.7,5%修正均数为$27290.5,中位数为$26550.0,方差为5.7E+07,标准差为$7567.99,最小值为$15750,最大值$80000,全距为$64250,四分位全距为$8400.00,偏度系数为1.905,偏度系数的标准误为0.128,峰度系数为7.977,峰度系数的标准误为0.255。表的下面部分分别是Custodial和Manager的统计信息。(3)不同职位员工薪水直方图显示(4)茎叶图描述茎叶图自左向
18、右可以分为3大部分:频数(Frequency)、茎(Stem)和叶(Leaf)。茎表示数值的整数部分,叶表示数值的小数部分。每行的茎和每个叶组成的数字相加再乘以茎宽(Stem Width),即茎叶所表示的实际数值的近似值。上面是Clerical的茎叶图。该图最后一行表示两个个案。以第一行数据为例,频数为2,茎为1,叶为0.5,茎宽为10000,表示有两个个案的薪水为1.510000=15000。Custodial和Manager的茎叶图在此省略。(5)箱图图中红色区域的方箱为箱图的主体,上中下3条线分别表示变量值的第75、50、25百分位数,因此变量的50%观察值落在这一区域中。方箱中的中心粗
19、线为中位数。箱图中的触须线是中间的纵向直线,上端截至线为变量的最大值,下端截至线为变量的最小值。四、上机1报告概要1. 指明所计算各个结果的统计含义;2. 依据所计算的统计结果,撰写描述统计的分析报告;上机2:统计图的绘制SPSS绘图功能很强,能绘制许多统计图形,这些图形既可以在统计分析过程中产生,也可以直接由Graphs图形菜单中所包含的一系列选项来实现。一、上机目的1. 学会利用统计图把统计资料所反映的数量变化趋势、分布状态和相互关系等情况形象直观地表现出来;2. 学会对所制作的统计图进行阅读、比较和分析,从中发现数据所反映的社会经济现象与规律;3. 要求掌握制作条形图、饼图、直方图、曲线
20、图的方法;二、上机演示内容与步骤下面采用的数据文件同前例题,它是来自SPSS软件自带的数据文件Employee.data”,该文件包含某公司员工的工资、工龄、职业等变量,我们利用该数据文件学习统计图的绘制。步骤1:用SPSS打开已有的数据文件选择菜单“FileOpenData”,在对话框中找到需要分析的数据文件“SPSS/Employee data”,并“打开”。步骤2:绘制条形图(Bar Charts)作图要求:以该数据为例,先按员工教育水平分类(教育水平是按接受教育的年限为主的),然后在分好的类别中,再按员工职业类别分类(经理、保管员、服务员),最后计算各种类别人员的平均工资水平并绘制条形
21、图。作图步骤如下:(1)打开文件并选择绘制条形图选项。选择菜单“GraphsBar”,打开Bar Charts(条形图)选择对话框,见下图。出现下图所示之后,选择合适的命令选项,各项命令选项说明如下:(2)命令选项的选择 条形图形状的选择条形图图标说明l Simple:将各类别数值用平行且等宽的条形简单地并列在一起的图形。l Clustered:有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类,并用两个以上的条形图并列来分别表示。l Stacked(分段条形图):有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类。作图时,以
22、条形的全长代表分成的第一大类别,条形内部各段的长短代表第二类别的组成部分,各段之间是用不同的线条或颜色表示。 计算数据统计量的方式选择Data in Chart AreSummaries for groups of cases:先对所有数据分类,然后对每类创建条形图Summaries of separate variables:对每个变量创建条形图Values of individual cases:对每个数据创建条形图(3)条形图变量及参数选择在Bar Charts对话框中选定条形图类型后,单击Define按钮,打开条形图变量及参数选择对话框(1)Category Axis:表示坐标轴上的分
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 上机 指导书
限制150内