SPSS使用指导手册.docx
SPSS工具简介统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作假设离开统计软件几乎是无法正常开展。在准确理解和把握了各种统计方法原理之后,再来把握一两种统计分析软件的实际操作,是格外必要的。常见的统计软件有 SAS,SPSS,SPLUS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作治理和开放的数据接口以及敏捷而 美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。在本试验课程中我们选择SPSS 作为统计分析应用试验活动的工具。SPSSStatistical Product and Service Solutions, 意为统计产品与效劳解决方案。自 20 世纪60 年月SPSS 诞生以来,为适应各种操作系统平台的要求经受了屡次版本更,各种版本的SPSS for Windows 大同小异,本次试验的试验工具选择了SPSS for Windows 12.0 全模块英文版。1. SPSS 的运行模式Spss 主要有四种运行模式:(1) 批处理模式这种模式把已编写好的程序语句程序存为一个文件,提交给 开头菜单上SPSS for WindowsProduction Mode Facility程序运行。(2) 完全窗口菜单运行模式这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简洁易用。(3) 程序运行模式这种模式是在语句Syntax窗口中直接运行编写好的程序或者在脚本script窗口中运行脚本程序的一种运行方式。这种模式要求把握SPSS 的语句或脚本语言。(4) 混合运行模式以上各种方法的综合运行方式。本试验指导手册为初学者供给入门试验教程,承受“完全窗口菜单运行模式”。2. SPSS 的启动(1) 在 windows开头程序SPSS for Windows,在它的次级菜单中单击“SPSS 12.0 forWindows”即可启动 SPSS 软件,进入SPSS for Windows 对话框,如图 1.1 所示。(2) 在 SPSS for Windows 对话框中各选项的意义分别为:¨ Run the tutorial:运行操作向导¨ Type in data:在数据窗口中输入数据,选择此选项会直接翻开一个空的数据编辑窗口, 供用户自行输入数据。¨ Run an existing query:运行一个已经存在的查询。¨ Create new query using Database Wizard:用数据库处理工具建立的数据文件。¨ Open an existing data source:翻开一个已经存在的数据文件,这是系统默认选项,在下面的列表中有用户最近使用过的SPSS 数据文件供选择。¨ Open another type of file:翻开其他类型文件,如SPSS 结果输出文件、语句文件等。¨ Dont show this dialog in the future 复选框:选中之后,下次启动SPSS 时将不会再显示该对话框,而直接进入数据编辑窗口。图 1.1 SPSS for Windows 对话框3. SPSS 软件的退出SPSS 软件的退出方法与其他Windows 应用程序一样,有两种常用的退出方法:¨ 按 FileExist 的挨次使用菜单命令退出程序。¨ 直接单击 SPSS 窗口右上角的“关闭”按钮,答复系统提出的是否存盘的问题之后即可安全退出程序。4. SPSS 的主要窗口介绍SPSS 软件运行过程中会消灭多个界面,各个界面用处不同。其中,最主要的界面有三个: 数据编辑窗口、结果输出窗口和语句窗口。(1) 数据编辑窗口启动 SPSS 后看到的第一个窗口便是数据编辑窗口,如所示。在数据编辑窗口中可以进展数据的录入、编辑以及变量属性的定义和编辑,是SPSS 的根本界面。主要由以下几局部构成: 标题栏、菜单栏、工具栏、编辑栏、变量名栏、观测序号、窗口切换标签、状态栏。标题栏菜单栏工具栏编辑栏变量名栏观测序号窗口切换标签状态栏图 1.2 数据扫瞄界面¨ 标题栏:显示数据编辑的数据文件名。¨ 菜单栏:包括 SPSS 的 10 个主菜单。通过对这些菜单的选择,用户可以进展几乎全部的SPSS 操作。下面分别对这些菜单的主要功能作一个简要介绍,如表 1.1 所示。关于菜单的具体的操作步骤将在后续试验内容中分别介绍。表 1.1 SPSS 菜单功能简介菜单项File文件的存取以及打印,外部数据的读取功能简介Edit View DataTransform Analyze Graphs Utilities Window Help数据的复制、剪切、粘贴等根本的数据编辑功能数据窗口外观设置数据整理的局部功能,包括插入观测和变量、数据排序、选取、合并、拆分等数据整理及数据转换功能,包括计算变量、重编码等SPSS 统计分析程序汇总,包括全部的统计分析功能SPSS 图表绘制程序汇总,包括全部的SPSS 绘图功能包含变量信息、文件信息、定义和使用集合、菜单编辑器等SPSS 主窗口的呈现方式设定及窗口的转换供给各种类型的 SPSS 帮助为了便利用户操作,SPSS 软件把菜单项中常用的命令放到了工具栏里。当鼠标停留在某个工具栏按钮上时,会自动跳出一个文本框,提示当前按钮的功能。另外,假设用户对系统预设的工具栏设置不满足,也可以用ViewToolbars菜单命令对工具栏按钮进展定义。¨ 编辑栏:可以输入数据,以使它显示在内容区指定的方格里。¨ 变量名栏:列出了数据文件中所包含变量的变量名¨ 观测序号:列出了数据文件中的全部观测值。观测的个数通常与样本容量的大小全都。¨ 窗口切换标签:用于“Data View”和“Variable View”的切换。即数据扫瞄窗口与变量扫瞄窗口。数据扫瞄窗口用于样本数据的查看、录入和修改。变量扫瞄窗口用于变量属性定义 的输入和修改。¨ 状态栏:用于说明显示 SPSS 当前的运行状态。SPSS 被翻开时,将会显示“SPSS Processor is ready”的提示信息。(2) 结果输出窗口在 SPSS 中大多数统计分析结果都将以表和图的形式在结果观看窗口中显示。结果输出窗口如图 1.3 所示。窗口右边局部显示统计分析结果,左边是导航窗口,用来显示输出结果的名目,可以通过单击名目来开放右边窗口中的统计分析结果。当用户对数据进展某项统计分析, 结果输出窗口将被自动调出。固然,用户也可以通过双击后缀名为.spo 的SPSS 输出结果文件来翻开该窗口。(3) 语句窗口用户可以在语句窗口中直接编写SPSS 命令程序,也可以使用 Paste 按钮把菜单运行方式下的各种命令和选项粘贴到命令窗口中,再进展进一步修改,然后通过运行主菜单的Run 命令将编写好的程序一次性地提交给计算机执行。试验1 数据文件治理一、试验目的与要求通过本试验工程,使学生理解并把握 SPSS 软件包有关数据文件创立和整理的根本操作, 学习如何将收集到的数据输入计算机,建成一个正确的 SPSS 数据文件,并把握如何对原始数据文件进展整理,包括数据查询,数据修改、删除,数据的排序等等。二、试验原理SPSS 数据文件是一种构造性数据文件,由数据的构造和数据的内容两局部构成,也可以说由变量和观测两局部构成。一个典型的SPSS 数据文件如表 2.1 所示。表 2.1 SPSS 数据文件构造姓名性别年龄张三145李四223数据内容王五245变量观测SPSS 变量的属性SPSS 中的变量共有 10 个属性,分别是变量名Name、变量类型Type、长度Width、小数点位置Decimals、变量名标签Label、变量名值标签Value、缺失值Missing、数据列的显示宽度Columns、对其方式Align和度量尺度Measure。定义一个变量至少要定义它的两个属性,即变量名和变量类型,其他属性可以临时承受系统默认值,待以后分析过 程中假设有需要再对其进展设置。在spss 数据编辑窗口中单击Variable View标签,进入变量视窗界面如图 2.1 所示即可对变量的各个属性进展设置。三、试验内容与步骤图 2.1 变量视窗1. 创立一个数据文件数据文件的创立分成三个步骤:(1) 选择菜单 FileNewdata 建一个数据文件,进入数据编辑窗口。窗口顶部标题为“SPSS Data Editor”。(2) 单击左下角Variable View标签进入变量视图界面,依据试验的设计定义每个变量类型。(3) 变量定义完成以后,单击Data View 标签进入数据视窗界面,将每个具体的变量值录入数据库单元格内。2. 读取外部数据当前版本的SPSS 可以很简洁地读取Excel 数据,步骤如下:(1) 按FileOpendata 的挨次使用菜单命令调出Open File 对话框,在文件类型下拉列表中选择“Excel*.xls”,如图 2.2 所示。图 2.2 Open File 对话框(2) 选择要翻开的 Excel 文件,单击“翻开”按钮,调出Open Excel Data Source 对话框, 如图 2.3 所示。Open Excel Data Source 对话框中各选项的意义如下:¨ Read variable names from the first row of data复选框:选中此项,将Excel 数据表中第一行的有效字符作为SPSS 变量名。¨ Worksheet 下拉列表:选择被读取数据所在的Excel 工作表。¨ Range 输入框:用于限制被读取数据在Excel 工作表中的位置。图 2.3 Open Excel Data Source 对话框3. 数据编辑在 SPSS 中,对数据进展根本编辑操作的功能集中在Edit 和 Data 菜单中。(1)Edit 菜单中的数据编辑功能Undo Redo Cut Copy PasteClear表 2.2Edit 菜单项功能说明撤销上一步操作,快捷键为 CtrlZ恢复上一步被撤销的操作,快捷键为 Ctrl+R剪切选定内容,快捷键为 Ctrl+X复制选定内容,快捷键为 CtrlC将剪切或复制内容粘贴到指定位置,快捷键为 CtrlV删除选定的变量,观测,或清楚选定区域的内容,快捷键为 Delete(2) Data 菜单中的数据编辑功能Data 菜单中的数据编辑功能主要有 3 个:¨ Insert variable 在指定位置的左侧插入一个变量。¨ Insert case 在指定位置的上方插入一个观测¨ Go to case 用于数据的定位。选择该命令后,弹出如图2.4 所示的对话框,输入想要定位的观测号并确认,则SPSS 将自动将活动单元格定位到该序号所指定的观测中。4. SPSS 数据的保存图 2.4 按观测序号进展数据定位SPSS 数据录入并编辑整理完成以后应准时保存,以防数据丧失。保存数据文件可以通过FileSave 或者 FileSave as 菜单方式来执行。在数据保存对话框如图 2.5 所示中依据不同要求进展SPSS 数据保存。图 2.5 SPSS 数据的保存¨ “文件名”输入框中输入适当的文件名¨ “保存类型”下拉列表用于选择将数据保存为不同的数据格式¨ “write variables names to spreadsheet”和“Save value labels where defined instead of datavalues”两个复选框:当保存类型为 Excel 文件格式时可用。前者用于选择是否将变量名写入 Excel 文件的第一行,后者用于选择是否用值标签代替变量值写入Excel 文件。¨ Variables 按钮用于选择需要保存的变量。单击后弹出如图 2.6 所示的对话框,在对话框中被选中的变量才会保存到文件中,其余的则不被保存。5. 数据整理图 2.6 选择保存的变量在 SPSS 中,数据整理的功能主要集中在Data 和Transform 两个主菜单下。(1) 数据排序Sort Case对数据依据某一个或多个变量的大小排序将有利于对数据的总体扫瞄,根本操作说明如下:¨ 选择菜单DataSort Case,翻开Sort Cases 对话框,如图 2.7 所示图 2.7 Sort Case 对话框¨ Sort by:选择排序变量。数据将按该变量的大小进展排序。¨ Sort Order:指定排序方式。其中,Ascending 是按排序变量的升序排列,Descending 是按降序排列。¨ 选择完毕,点击ok 按钮,执行排序命令。(2) 抽样Select Case在统计分析中,有时不需要对全部的观测进展分析,而可能只对某些特定的对象有兴趣。 利用 SPSS 的Select Case 命令可以实现这种样本筛选的功能。以SPSS 安装配套数据文件为例, 选择年龄大于 10 的观测,根本操作说明如下:¨ 翻开数据文件,选择Data图 2.8 Select Cases 对话框¨ 指定抽样的方式:All cases 不进展筛选;If condition is satisfied 按指定条件进展筛选。本例设置age>=10,如图 2.9 所示;Random sample of cases 随机抽取观测;Based on time or case range 按挨次筛选;Use filter variable 用指定的过虑变量进展筛选。图 2.9 Select Cases if 对话框设置完成以后,点击continue,进入下一步。¨ 确定未被选择的观测的处理方法,这里选择默认选项filtered。¨0(3) 增加样品的数据合并Merge FileAdd cases将数据文件中的观测合并到原数据文件中,在 SPSS 中实现数据文件纵向合并的方法如下:¨ 选择菜单DataMerge Files1。¨ 通过选中Indicate case source as Variable复选框,并在下面的输入框中输入想要的变量名,即可指定生成一个 0-1 变量来指明合并后的数据文件中观测的来源。这里选择默认设置,点击ok 按钮,执行命令之后,可以觉察当前数据文件的观测量比原来增加了。1(4) 增加变量的数据合并Merge FileAdd variables增加变量时指把两个或多个数据文件实现横向对接。例如将不同课程的成绩文件进展合并, 收集来的数据被放置在一个的数据文件中。在SPSS 中实现数据文件横向合并的方法如下:¨ 选择菜单DataMerge FilesAdd Variables,翻开 Read file 对话框,选择外部数据文件,单击“翻开”2 所示。2¨ 单击Ok 执行合并命令。这样,两个数据文件将按观测的挨次一对一地横向合并。(5) 数据拆分Split File在进展统计分析时,常常要对文件中的观测进展分组,然后按组分别进展分析。例如要求按性别不同分组。在SPSS 中具体操作如下:¨ 选择菜单Data3 所示。3 Split file 对话框¨ 选择拆分数据后,输出结果的排列方式,该对话框供给了3 种方式:Analyze all cases, do not create groups对全部观测进展分析,不进展拆分;Compare groups 在输出结果种将各组的分析结果放在一起进展比较;Organize output by groups 按组排列输出结果,即单独显示每一分钟的分析结果。¨ 选择分组变量¨ 选择数据的排序方式¨ 单击 ok 按钮,执行操作(6) 计算变量在对数据文件中的数据进展统计分析的过程中,为了更有效地处理数据和反映事务的本质, 有时需要对数据文件中的变量加工产生的变量。比方常常需要把几个变量加总或取加权平均 数,SPSS 中通过Compute 命令来产生这样的变量,其步骤如下:¨ 选择菜单Transform4 所示。4 Compute Variable 对话框¨ 再 Target Variable输入框中输入生成的变量的变量名。单击输入框下面的 Type&label按钮,在跳出的对话框中可以对变量的类型和标签进展设置。¨ 在 Numeric Expression 输入框中输入变量的计算表达式。例如“age>10”。¨ 5 所示。Include all cases:对全部的观测进展计算;Include if case satisfied condition : 仅对满足条件的观测进展计算。¨ 单击Ok 按钮,执行命令,则可以在数据文件中看到一个生成的变量。四、备择试验5 If cases 子对话框某航空公司 38 名职员性别和工资状况的调查数据,如表 2.3 所示,试在 SPSS 中进展如下操作:(1) 将数据输入到SPSS 的数据编辑窗口中,将gender 定义为字符型变量,将salary 定义为数值型变量,并保存数据文件,命名为“”。(2) 插入一个变量income,定义为数值型变量。(3) 将数据文件按性别分组(4) 查找工资大于 40000 美元的职工(5) 当工资大于 40000 美元时,职工的奖金是工资的 20;当工资小于 40000 美元时,职工的奖金是工资的 10%,假设实际收入工资奖金,计算全部职工的实际收入,并添加到 income 变量中。表 2.3 某航空公司 38 名职员状况的调查数据表IdGenderSalaryIdGenderSalary1M$ 5700020F$ 262502M$ 4020021F$ 388503F$ 2145022M$ 217504F$ 2190023F$ 240005M$ 4500024F$ 169506M$ 3210025F$ 211507M$ 3600026M$ 310508F$ 2190027M$ 603759F$ 2790028M$ 3255010F$ 2400029M$ 13500011F$ 3030030M$ 3120012M$ 2835031M$ 3615013M$ 2775032M$ 11062514F$ 3510033M$ 4200015M$ 2730034M$ 9200016M$ 4080035M$ 8125017M$ 4600036F$ 3135018M$10375037M$ 2910019M$ 4230038M$ 31350试验2 描述统计一、试验目的与要求统计分析的目的在于争论总体特征。但是,由于各种各样的缘由,我们能够得到的往往只 能是从总体中随机抽取的一局部观看对象,他们构成了样本,只有通过对样本的争论,我们才 能对总体的实际状况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步 是进展正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、 数据分布的集中趋势和离散程度,或对数据进展初步的探究性分析包括检查数据是否有错误, 对数据分布特征和规律进展初步观看。本本试验旨在于:引到学生利用正确的统计方法对数据进展适当的整理和显示,描述并探究出数据内在的数量规律性,把握统计思想,培育学生学习统计学的兴趣,为连续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的根底。二、试验原理描述统计是统计分析的根底,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进展分析。集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。其中均数适用于正态分布和对称分布资料,中位数适用于全局部布类型的资料。离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。三、试验内容与步骤下面给出的一个例题是来自SPSS 软件自带的数据文件“Employee.dat,a该”文件包含某公司员工的工资、工龄、职业等变量,我们将利用此例题给出相关的描述统计说明,本例中,我们将以员工的当前工资为例,计算该公司员工当前工资的一些描述统计量,如均值、频数、方差等描述统计量的计算。1. 频数分析Frequencies1根本统计分析往往从频数分析开头。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是格外有用的。比方,在某项调查中,想要知道被调查者的性别分布状况。频数分析的第一个根本任务是编制频数分布表。SPSS 中的频数分布表包括的内容有:(1) 频数Frequency即变量值落在某个区间中的次数。(2) 百分比Percent即各频数占总样本数的百分比。(3) 有效百分比Valid Percent即各频数占有效样本数的百分比。这里有效样本数总样本缺失样本数。(4) 累计百分比Cumulative Percent即各百分比逐级累加起来的结果。最终取值为百分之百。频数分析的其次个根本任务是绘制统计图。统计图是一种最为直接的数据刻画方式,能够1频数分析多适用于离散变量,其功能是描述离散变量的分布特征。格外清楚直观地展现变量的取值状况。频数分析中常用的统计图包括:条形图,饼图,直方图等。频数分析的应用步骤在 SPSS 中的频数分析的实现步骤如下:¨ 选择菜单“File>Open>Data”在对话框中找到需要分析的数据文件 “SPSS/Employee data”,然后选择“翻开”。¨ 选择菜单“Analyze>Descriptive Statistics>Frequencies”。如图 2.1 所示询问是否输出频数分布表图2.1 Frequencies对话框¨ 确定所要分析的变量,例如Gender¨ 在变量选择确定之后,在同一窗口上,点击“Statistics”按钮,翻开统计量对话框,如以下图 2.2 所示,选择统计输出选项。图2.2 Statistics子对话框1 Percentile Values 栏表2.1 Percentile Values 栏选项说明选项QuartilesCut points forequal groups说明显示25%,50%,75%的四分位数值输入整数k 时,表示将所选变量的数值从小到大划分为k 等分,并将输出各等分点处的变量数值Percentile(s)右边的小框内,键入0100 间的1个数之后,单击Add 按钮添加到下面的方框内,此操作过程可以重复。例如输入15,55,85 时,输出结果将会显示15%,55%,85%百分位处的变量值。单击Change 和Remove 按钮可以修改或删除框内的数值 。(2) Dispersion离中趋势栏各统计量符号表示如下:Std deviation 标准差;Minimum 最小值;Variance 方差;Maximum 最大值;Range 极差(3) Central Tendency集中趋势栏各统计量符号表示如下: Mean 均值算术平均数;Mode 众数;Median 中位数;Sum 总和(4) Distribution分布特征栏各统计量符号表示如下: Skewness 偏度;Kurtosis 峰度单击 charts 按钮,弹出charts 子对话框如图2.3 所示,设置生成的统计图,对话框有两个选项栏:图2.3 Charts子对话框1Charts Type 选项栏:设置生成统计图的类型。表 2.2 Charts Type选项栏选项说明选项NoneBar charts Pie charts Histograms说明不生成任何统计图生成条形图生成饼图生成直方图,假设选中该选项,则下面的 With normal curve 复选框被激活,用户可以选择是否在直方图中参加正态曲线,这样可以直观地将变量的分布与正态分布进展比较。(2) Chart Values 选项栏:选择按频数或百分比作图。只有当Chart Type 选择Bar chart 或Pie charts 时这个选项栏才可用。¨ 单击 Format 按钮,弹出Format 子对话框,对输出的频数分布表的格式进展设置,如图2.4 所示。Order by选项栏表 2.3 Format 子窗口选项设置说明设置说明用于选择频数分布表是按变量值还是按频数排列,是按升序还是降序排列Multiple Variables仅适用于对两个以上变量作频数分析。Compare variable 表示将几个变量的频数分析结果在同一张表中显示,Organize output by variables 表示将不同变量的频数分析结果在不同的表中显示。Suppress tables with more假设分类数多余 n 则不输出频数分布表,这通常使用于变量取值过多时。than n categories¨ 结果输出与分析图2.4 Format子对话框点击Frequencies 对话框中的“OK”按钮,即得到下面的结果。表2.4 描述性统计量StatisticsGenderNValid Missing4740表 2.4 中给出了总样本量N,其中变量Gender 的有效个数Valid为 474 个、缺失值missing为 0。表2.5Gender频数分布表ValidValidFemale Male TotalFrequency216258474PercentPercentCumulative Percent表 2.5 中,Frequency 是频数,Percent 是按总样本量为分母计算的百分比,Valid Percent是以有效样本量为分母计算的百分比,Cumulative Percent 是累计百分比。图 2.5 变量Gender 的条形图,图 2.6 变量Gender 的饼图。Gender300y250cn200eu150qre100F5002. 描述统计Descriptives2FemaleMaleGender图2.5 变量gender的条形图GenderFemale Male图2.6 变量gender的饼图SPSS的Descriptives命令特地用于计算各种描述统计性统计量。本节利用某年国内上市公司的财务数据来介绍描述统计量在SPSS中的计算方法。具体操作步骤如下:¨ 选择菜单AnalyzeDescriptive StatisticsDescriptives,如图 2.7 所示图 2.7 Descriptives 对话框¨ 将待分析的变量移入Variables 列表框,例如这里将对资产负债率lev、前两大股东持股比例之比和前 5 大股东持股比例之和 3 个变量计算描述性统计,以观看上市公司股权集中度2 描述统计主要对定距型或定比型数据的分布特征作具体分析。状况和负债比率的凹凸。Save standardized values as variables,对所选择的每个变量进展标准化处理,产生相应的 Z 分值,作为变量保存在数据窗口中。其变量名为相应变量名前加前缀z。标准化计算公式:Zi = xi - xs¨ 单击 Options 按钮,如图 2.8 所示,选择需要计算的描述统计量。各描述统计量同Frequencies 命令中的Statistics 子对话框中大局部一样,这里不再重复。图 2.8 Options 子对话框¨ 在主对话框中单击ok 执行操作。¨ 结果输出与分析在结果输出窗口中给出了所选变量的相应描述统计,如表2.6 所示。从表中可以看到,我国上市公司前两大股东持股比例之比平均高达 102.9,说明“一股独大”的现象比较严峻;前五大股东持股比例之和平均为 51.8%,资产负债率平均为 46.78%。另外,从偏态和峰度指标看出,前两大股东持股比例之比的分布呈现比较明显的右偏,而且比较尖峭。为了验证这一结论,可以利用Frequencies 命令画出变量z 的直方图,如图表2.6 描述统计量表NMeanStd.SkewnessKurtosisStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. Error315.137.274315.51836.1496003.602.137.274315.4677.16773.137.274315Descriptive Statistics前两大股东持股比例之比前五大股东持股比例的平方和资产负债率Valid N (listwise)ycn eu qerF1501209060300Histogram8.00000-2.000000.000002.000004.000006.00000Mean = -1.4224733E-163. 探究分析ExploreZscore: 前两大股东持股比例之比图 2.9 变量 Z 的直方图Std. Dev. = 1.0000.调用此过程可对变量进展更为深入详尽的描述性统计分析,故称之为探究分析。它在一般描述性统计指标的根底上,增加有关数据其他特征的文字与图形描述,显得更加细致与全面, 对数据分析更进一步。探究分析一般通过数据文件在分组与不分组的状况下获得常用统计量和图形。一般以图形方式输出,直观帮助争论者确定奇异值、影响点、还可以进展假设检验,以及确定争论者要使用的某种统计方式是否适宜。¨ 在翻开的数据文件上,选择如下命令:选择菜单“Analyze>Descriptive Statistics>Explore”,翻开Explore 对话框。¨ 确定所要计算的变量 例如选择current Salary 作为待分析变量;选择 Gender 作为分组变量,在Display 栏中,选择Both,表示输出图形及描述统计量。¨ 选择 statistics按钮,选择想要计算的描述统计量。如下图Confidence Interval forMean 将显示总体均值的95%置信区间,95%为系统默认的置信概率,取值范围为199;M-estimators:输出稳健极大似然估量量;Outliers:输出5个最大和最小的观测值;Percentiles:输出5%,10%,25%,50%,75%,90%,95%的百分位数。¨ 对所要计算的变量的频数分布及其统