SPSS统计软件的操作与应用.pptx
《SPSS统计软件的操作与应用.pptx》由会员分享,可在线阅读,更多相关《SPSS统计软件的操作与应用.pptx(131页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1页/共131页统计学基本知识第2页/共131页统计学定义:它是关于收集分析表述和解释统计数据的方法论科学统计的功能:主要是信息咨询和监督现代统计学分科:描述统计学与推断统计学(统计方法构成)理论统计学与应用统计学(方法研究与应用)基本概念统计总体:是指客观存在的,在同一性质基础上结合起来的许多个别单位 的整体,如上海地区的人口总数样本总体:在统计总体里,按照一定抽样方法抽取的部分个体,这些个体客观地反映总体的特征,如合理抽样100个学生样本进行相关统计指标:反映现象总体数量特征的概念,如样本平均数变量:统计总体个单位所具有的共同特征。如年龄,性别一 基本概念基本概念第3页/共131页二 统
2、计数据分布特征的描述统计数据分布特征的描述1 1 统计变量集中趋势的测定统计变量集中趋势的测定2 2 统计变量离散程度的测定统计变量离散程度的测定3 3 变量分布偏度与峰度的描述变量分布偏度与峰度的描述第4页/共131页1 统计变量集中趋势的测定 定义定义:统计数据的集中趋势是指数据向其中心值靠近或集中的趋势 测定集中趋势的作用 1)反映总体各单位变量分布的集中趋势和一般水平 2)比较同类现象在不同单位的发展水平 3)比较同类现象在不同时期的发展变化趋势或规律 4)分析现象之间的依存关系 测量集中趋势的度量:位置平均数和数值平均数第5页/共131页位置平均数众数(Mode):总体中出现次数最多
3、的那个变量值,众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。求某医院当天出生新生儿的体重的众数,数据如表1-1所示。体重(斤)8 7 6 7 5 4 5 6 8 7 5 6 4 7 6 5.5 7 4第6页/共131页中位数(Median):将总体中的数据按顺序排列后,处于数列中点位置上的那个数据或变量值。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。如果N为奇数,那么该数列的中位数就是位置 上的数;如果N为偶数,中位数则是该数列中第 与第 +1位置上两个数值的平均数 求某班级学生身高的中位数,数据如表1-2所示。身高(cm
4、)174 168 164 174 176 150 183 162 171 146 189 167第7页/共131页四分位数四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离的一半又称为四分位差四分位差,记为Q。四分位差四分位差越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的数据越分散。越小,说明中间的数据越集中;四分位差越大,则意味着中间部分的数据越分散。第8页/共131页频数频数(Frequency):一个变量在各个
5、变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。变量的频数分析正是实现上述分析的最好手段,它可以使人们非常清楚地了解变量取值的分布情况。例子10个学生在某次数学、语文、化学考试中成绩如表1-3所示,试求学生在3门课程上的频数分布。第9页/共131页姓 名数 学语 文化 学hxh99.0098.00100.00yaju88.0089.0045.00yu99.0080.0056.00shizg89.0078.0067.00hah94.0078.0078.00lisa90.0089.0087.00watet79.00
6、87.0089.00jess75.0076.0097.00wish89.0056.0076.00iiakii80.0076.00100.00第10页/共131页数值平均数算术平均数算术平均数(mean):是表现数据的集中趋势和代表性水品,基本形式为总体标志总量比上总体单位总数。例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。加权算术平均数加权算术平均数(weightedmean):主要用于数据已经分组,并编制出次数分布的条件下,这时必须先将各组标志值乘以相应的次数,得到各组的标志总量,然后再相加得到总体标志总量。第11页/共131页三个常用描述性度量比较第12页/共1
7、31页2 统计变量离散程度的测定 集中趋势是统计总体数据特征之一,但由于个体的差异性,总体中的各数据还呈现相分散的离中趋势,因此对数据的统计分析,除了要反映其分布的集中趋势外,还要反映数据的离散程度,以到达对数据变动规律的全面描述。定义:离散程度是度量统计分布离中趋势的指标,同时反映了总体中各个单位标志值的变异程度和平均数的代表水平。测定变量离散程度的作用 1)反映现象总体中变量分布的离中趋势 2)衡量均值的代表性 3)测定现象变动的均匀性或稳定性程度 测量离中趋势的度量:极差平均差四分位差方差标准差离散系数等第13页/共131页极差(rangerange):又称全距,离散程度的最简单测度值,
8、是最大和最小变量值之间的距离在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。例子,某地农民人均年收入最高是8000元,最地是2600元一年,则该地区农民收入的极差是8000-2600等于5400元。第14页/共131页方差(variance):所有变量值与平均数偏差平方的平均值,它是测定离散程度最常用的指标,离散程度最灵敏的指标。标准差(standarddeviation):它是方差的平方根。它表示了一组数据关于平均数的平均离散程度。方差和标准差越大,说明变量值之间的差异越大,距离平均数这个方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心中心”的离
9、散趋势越大。的离散趋势越大。第15页/共131页四分位差(quartiledeviation):分位差是极差的一种改进,四分位差是在数列中剔除最大和最小各四分之一的数据,是第一和第三个分位数之间距离的二分之一,表明中位数到这两个四分位数的平均距离,是说明中位数代表性高低的测量值。平均差(meanabsolutedeviation):是分配数列中各单位标志值与其计算平均数之间离差绝对值的平均数。离散系数:适用于比较不同现象或不同水平数据的变异程度的情况。第16页/共131页峰度:指分布图形的尖峭程度或峰凸程度。峰度是分布集中趋势高峰的形状。用表示 当=0时,频率分布的峰度为正态分布的峰度 当0时
10、,频率分布的峰度比正态分布的峰度要高尖态峰,表明集中趋势显著,离中趋势低 当0时,频率分布的峰度比正态分布的峰度要低平坦峰,表明离中趋势显著,集中趋势低第18页/共131页小结小结本节主要介绍本节主要介绍平均数平均数、中位数中位数、众数众数、方差方差、百分位百分位、频数频数、峰度峰度、偏度偏度等统计学相关基等统计学相关基本知识,基本统计知识是进行本知识,基本统计知识是进行SPSS统计分析的基础和前提。通过基本统计方法的学习,可以统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。对要分析数据的总体特征有比较准确的把
11、握,从而有助于选择其他更为深入的统计分析方法。第19页/共131页希望大家课后多查阅相关资料书籍,以更好的运用希望大家课后多查阅相关资料书籍,以更好的运用SPSS社会学统计软件!社会学统计软件!第20页/共131页 欢迎你进入SPSS学习 第21页/共131页SPSS简介第22页/共131页一SPSS的产生、发展和应用领域二SPSS13.0的安装、启动和退出三SPSS的窗口简介四SPSS13.0的Help系统第23页/共131页一一SPSS的产生、发展和应用领域的产生、发展和应用领域社会科学统计软件包(StatisticalPackagefortheSocialScience,SPSS)是世界
12、著名的统计分析软件之一。1968年,3位美国斯坦福大学的学生开发了最早的SPSS系统,并基于这一系统于1975年在芝加哥合伙成立了SPSS公司。SPSS的基本功能包括数据管理数据管理、统计分析统计分析、图表分析图表分析、输出管理输出管理等。经近40年的发展,在全球已拥有大量的用户,SPSS主要应用于农业、工业、商业、医学、交通运输、公检法、社会学社会学、市场分析市场分析、股市行情、军事地理、旅游业等多个领域和行业,是世界上应用最广泛的专业统计软件。SPSS的最新版本为19.0,主要开发为vista使用系统,SPSS13.0的经典版,稳定性比较高。总之,可以这么说,有需要数据分析的地方,就可以用
13、到有需要数据分析的地方,就可以用到SPSS,同学们要认真学。,同学们要认真学。第24页/共131页请见演示请见演示二SPSS13.0 的安装、启动和退出第25页/共131页三SPSS的窗口简介的窗口简介SPSS主界面主要有两个两个,一个是SPSS数据编辑窗口数据编辑窗口,另一个是SPSS输出窗口输出窗口。数据编辑窗口由标题栏标题栏、菜单栏菜单栏、工具栏工具栏、编辑栏编辑栏、变量名栏变量名栏、内容区内容区、窗口切换标签页窗口切换标签页和状态栏状态栏组成,见下图。第26页/共131页数据编辑窗口第27页/共131页1、菜单介绍File:“文件”菜单用于新建SPSS各种类型文件,打开一个已存在的文件
14、,从文本文件或其它数据源读入数据。Edit:“编辑”菜单用于撤消操作、剪切、复制、粘贴、查找、改变SPSS默认设置等。View:运用“视图”菜单显示或隐藏状态行、工具栏、网络线、值标签和改变字体。Data:运用“数据”菜单对SPSS数据文件进行全局变化,例如定义变量,合并文件,转置变量和记录,或产生分析的观测值子集等。Transform:“转换”菜单在数据文件中对所选择的变量进行变换,并在已有变量值的基础上计算新的变量。第28页/共131页Analyze:“分析”菜单在以前版本中为“统计(Statistics)”,可进行各种统计分析,包括各种统计过程(Procedure),如回归分析、相关分析
15、、因子分析等等。Graphs:“图表”菜单产生条形图、饼图、直方图、散点图和其它全颜色、高分辨率的图形,以及动态的交互式图形。有些统计过程也产生图形,所有的图形都可以编辑。Utilities:“工具”菜单可以显示数据文件和变量的信息,定义子集,运行脚本程序,自定义SPSS菜单等。Window:“窗口”菜单用于选择不同窗口和最小化所有窗口。Help:“帮助”菜单包含SPSS帮助主题、SPSS教程、SPSS公司主页、统计教练等菜单项。第29页/共131页该窗口下方有两个标签:“DataView”(数据视图)和“VariableView”(变量视图)。(1)一个列对应一个变量,即每一列代表一个变量(
16、Variable)或一个被观测量的特征。例如问卷上的每一项就是一个变量。(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case)。例如,问卷上的每一个人就是一个观测。第30页/共131页SPSS结果输出窗口名为Viewer,它是显示和管理SPSS统计分析结果统计分析结果、报表及图形的窗口。SPSS结果输出窗口第31页/共131页用鼠标双击结果输出窗口中的图形,进入图形编辑窗口,可以对图形进行定义编辑图形编辑窗口第32页/共131页四四SPSS13.0的的Help系统系统 在运行SPSS的任何时候,单击“Help”菜单中的“topicstopics”命令,会弹出
17、帮助主题窗口。在其中选择相关的命令,即可得到所需的各种帮助。HelpHelp系统可以为不同级别的用户提供不同阶段的指导,有如入门级用户的tutorial”命令,命令,实例学习“Casestudies”过程,还有手把手的“StatisticsCoach”的过程第33页/共131页第34页/共131页小结小结SPSS是在当前社会经济分析中应用最广泛的软件之一。继是在当前社会经济分析中应用最广泛的软件之一。继SPSS13.0之后,之后,SPSS公司推出了最新的公司推出了最新的SPSS19.0,这是一个功能强大、设计人性化的统计学软件。,这是一个功能强大、设计人性化的统计学软件。SPSS的主界面有两个
18、,一个是的主界面有两个,一个是SPSS数据编辑窗口数据编辑窗口,一个是,一个是SPSS结果输出窗口结果输出窗口,例外还有一个例外还有一个图形编图形编辑窗口辑窗口。第35页/共131页下面让我们进入主题吧下面让我们进入主题吧!第36页/共131页数据输入和整理数据输入和整理第37页/共131页一一定义变量定义变量SPSS对数据的处理是以变量为前提的,因此本节主要介绍定对数据的处理是以变量为前提的,因此本节主要介绍定义变量、输入数据和数据整理。义变量、输入数据和数据整理。第38页/共131页输入数据前首先要定义变量。定义变量即要定义变量名、变输入数据前首先要定义变量。定义变量即要定义变量名、变量类
19、型、变量长度(小数位数)、变量标签(或值标签)和量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。变量的格式。单击数据编辑窗口左下方的单击数据编辑窗口左下方的“VariableView”标签或双击标签或双击列的题头(列的题头(Var),进入如下图所示的变量定义视图窗口,在),进入如下图所示的变量定义视图窗口,在此窗口中即可定义变量此窗口中即可定义变量。第39页/共131页在上图所示的窗口中每一行表示一个变量的定义信息,包括Name、Type、Width、Decimal、Label、Values、Missing、Columns、Align、Measure等。第40页/共131页1定
20、义变量名(Name)SPSS默认的变量为Var00001、Var00002等,用户也可以根据自己的需要来命名变量。SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下。变量名必须以字母、汉字或字符开头,其他字符可以是任何字母、数字或_、#、$等符号。变量最后一个字符不能是句号。变量名总长度不能超过8个字符(即4个汉字)。不能使用空白字符或其他特殊字符(如“!”、“?”等)。变量命名必须惟一,不能有两个相同的变量名。在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。图2-3 定义变量类型对话框 SPSS的保留字(Reserved Keywo
21、rds)不能作为变量的名称,如ALL、AND、WITH、OR等。第41页/共131页2定义变量类型(Type)单击单击TypeType相应单元中的按钮,弹出如图相应单元中的按钮,弹出如图2-32-3所示的对话框,在对话框中选所示的对话框,在对话框中选择合适的变量类型并单击择合适的变量类型并单击“OKOK”按钮,即可定义变量类型。按钮,即可定义变量类型。第42页/共131页SPSS的主要变量类型如下。的主要变量类型如下。Numeric Comma(带逗点的数值型)整数部分每三位数加一逗号,1,200,000 Dot(逗点作小数点的数值型)可定义小数,12345显示12.345,00 Scient
22、ificnotation(科学记数法)定义width为10,decimal places为 3,则1234567.89显示为1.235+E006 Date Dollar Customcurrency String第43页/共131页3变量长度(Width)设置变量的长度,当变量为日期型时无效。设置变量的长度,当变量为日期型时无效。第44页/共131页4变量小数点位数(Decimal)变量小数点位数设置数值变量的小数点位数,当变量为日期型时无效。第45页/共131页5变量标签(Label)变量标签是对变量名的进一步描述,变量标签可长达120 个字符,变量标签对大小写敏感,显示时与输入值完全一样,
23、需要时可用变量标签对变量名的含义加以解释。第46页/共131页6变量值标签(Values)变量值标签是对变量的每一个可能取值的进一步描述,当变量是定类或定序变量时,这是非常有用的。第47页/共131页7缺失值的定义方式(Missing)SPSS有两类缺失值:系统缺失值和用户缺失值。有两类缺失值:系统缺失值和用户缺失值。单击单击Missing相应单元中的按钮,在弹出的如下图所示的对话框中可改变缺失值的定义方式,在相应单元中的按钮,在弹出的如下图所示的对话框中可改变缺失值的定义方式,在SPSS中有中有两种定义缺失值的方式。两种定义缺失值的方式。可以定义可以定义3个单独的缺失值。个单独的缺失值。可以
24、定义一个缺失值范围和一个单独的缺失值。可以定义一个缺失值范围和一个单独的缺失值。默认值为None第48页/共131页8变量的显示宽度(Columns)输入变量的显示宽度,默认为输入变量的显示宽度,默认为8。第49页/共131页9变量显示的对齐方式(Align)选择变量值显示时的对齐方式:选择变量值显示时的对齐方式:Left(左对齐)、(左对齐)、Right(右对齐)、(右对齐)、Center(居中对齐)。默认是右(居中对齐)。默认是右对齐。对齐。第50页/共131页10变量的测量尺度(Measure)变量为定距变量或定比变量,则在Scale相应单元的下拉列表中选择Scale;如果变量为定序变量
25、,则选择Ordinal;如果变量为定类变量,则选择Nominal,Scale的测量水平最高,能加减乘除,Ordinal能进行排序测量,只能比较大小或顺序,Nominal只是一种类别代表,如性别,测量尺度和变量类型一样,都是对变量进行更准确的定义,其在数据分析中不是很明显。测量尺度和变量类型一样,都是对变量进行更准确的定义,其在数据分析中不是很明显。变量按测量精度可以分为变量按测量精度可以分为(1)定性变量。)定性变量。(2)定序变量。)定序变量。(3)定距变量。)定距变量。(4)定比变量。)定比变量。第51页/共131页问卷录入时注意的几个问题(1)注意定义不同的数据类型Type各色各样的问卷
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 统计 软件 操作 应用
限制150内