SPSS分析调查问卷数据的方法.pptx
《SPSS分析调查问卷数据的方法.pptx》由会员分享,可在线阅读,更多相关《SPSS分析调查问卷数据的方法.pptx(84页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、利用利用SPSS分析调查问卷数据分析调查问卷数据马青华问卷数据的预处理SPSS分析调查问卷数据的方法分析调查问卷数据的方法当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量定义变量定义变量定义变量数据录入数据录入数据录入数据录入统计分析和结果保存统计分析和结果保存统计分析和结果保存统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细的介绍.定义变量定义变量大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以
2、看到DataView,VariableView两个标签,只需单击左下方的VariableView标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位)、label(变量标签)、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类).调查问卷中的数据编码和录入调查问卷中的数据编码和录入调查问卷中的数据编码和录入调查问卷中的数据编码和
3、录入把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我们以问卷第一个问题为例来说明变量的设置.为了便于说明,可假设此题为:1.请问你的年龄属于下面哪一个年龄段()?A:2029B:3039C:4049D:50-59变量设置可如下变量设置可如下:name即变量名为即变量名为1,type即类型可根据答案的类型设置即类型可根据答案的类型设置,答案我答案我们可以用们可以用1、2、3、4来代替来代替A、B、C、D,所以我们选择数字型的,即选择所以我们选择数字型的,即选择Numeric,width宽度为宽度为4,decimals
4、即小数位数位为即小数位数位为0(因为答案没有小数点),(因为答案没有小数点),label即变量标签为即变量标签为“年龄段查询年龄段查询”。Values用于定义具体变量值的标签用于定义具体变量值的标签,单击单击Value框框右半部的省略号,会弹出变量值标签对话框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入在第一个文本框里输入1,第二个输入第二个输入2029,然后单击添加即可然后单击添加即可.同样道理我们可做如下设置同样道理我们可做如下设置,即即1=2029、2=3039、3=4049、4=50-59;Missing,用于定义变量缺失值,用于定义变量缺失值,单击单击missing框
5、右侧的省略号,框右侧的省略号,会弹出缺失值对话框会弹出缺失值对话框,界面上有一列三个单选钮,默认值为最上方的界面上有一列三个单选钮,默认值为最上方的“无缺失值无缺失值”;第二项为第二项为“不连续缺失值不连续缺失值”,最多可以定义,最多可以定义3个值;最后一项为个值;最后一项为“缺失值范围加可选缺失值范围加可选的一个缺失值的一个缺失值”,在此我们不设置缺省值,在此我们不设置缺省值,所以选中第一项如图;所以选中第一项如图;Colomns,定义显,定义显示列宽示列宽,可自己根据实际情况设置;可自己根据实际情况设置;Align,定义显示对齐方式,定义显示对齐方式,有居左、居右、居有居左、居右、居中三种
6、方式;中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。,定义变量类型是连续、有序分类还是无序分类。开放式题型的设置:诸如你所在的省份是_这样的填空题即为开放题,设置这些变量的时候只需要将Value、Missing两项不设置即可.数据录入:数据录入:Spss数据录入方式在spss的数据录入窗口中直接输入就可以了,几点注意事项:a.在数据录入窗口,可看到有一个表格,这个表格中的每一行代表一份问卷,也称为一个个案.b.在数据录入窗口中,可看到表格上方出现了1、2、3、4、5.的标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变量名,即1代表第一题,2代表第二题
7、.以次类推.只需要在变量名下面输入对应问题的答案即可完成问卷的数据录入.比如上述年龄段查询的例题,如果问卷上勾选了A答案,在1下面输入1就行了(不要忘记我们通常是用1、2、3、4来代替A、B、C、D的).c.一行代表一份问卷,所以有几分问卷,就要有几行的数据.在数据录入完成后,要做的关键部分就是 问卷的统计分析了.1.读取SPSS格式的数据2.读取Excel等格式的数据3.读取文本数据(Fixed和Delimiter)4.读取数据库格式数据(分如下两步)(1)配置ODBC(2)在SPSS中通过ODBC和数据库进行Rich.sav数据Rich.xls数据录入数据录入(rich.sav):福布斯世
8、界富豪排行榜Rank:排名Name:姓名Citizenship:国籍Region:地区Age:年龄NetWorth:净财富(10亿美元)Residence:居住地问卷调查数据常用的统计分析方法频数分析、描述统计分析和列联表分析频数分析、描述统计分析和列联表分析这是问卷调查最基本、这是问卷调查最基本、最常用的分析方法。频数分析是描述统计的初步,分门别类的最常用的分析方法。频数分析是描述统计的初步,分门别类的统计有效样本量,计算其比重。频数分析可以计算的统计量有:统计有效样本量,计算其比重。频数分析可以计算的统计量有:分位数、中位数、众数等,并可以绘制柱状图、直方图、饼图。分位数、中位数、众数等,
9、并可以绘制柱状图、直方图、饼图。描述统计分析主要是计算一些 基本的统计量,其中比较重要的统计量有均值、方差和标准差、峰度、偏度。数据的描述在在对对数数据据进进行行深深入入加加工工之之前前,总应该对数据有所印象。总应该对数据有所印象。可可以以借借助助于于图图形形和和简简单单的的运运算算,来了解数据的一些特征。来了解数据的一些特征。由由于于数数据据是是从从总总体体中中产产生生的的,其其特特征征也也反反映映了了总总体体的的特特征征。对对数数据据的的描描述述也也是是对对其其总总体体的的一个近似的描述。一个近似的描述。1如何用图来表示数据?如何用图来表示数据?定量变量的图表示定量变量的图表示:1.直方图
10、直方图对于一个定量变量,比如某个地区对于一个定量变量,比如某个地区(地区(地区1)测量了)测量了163个高三男生的身个高三男生的身高高(S3height1.txt)。用图形来表示这个数据,使人们能够用图形来表示这个数据,使人们能够看出这个数据的大体分布或看出这个数据的大体分布或“形状形状”的一个办法是画的一个办法是画直方图直方图(histogram)。图图1就是利用这个数据由就是利用这个数据由SPSS软件所画软件所画的直方图。的直方图。该图的横坐标是身高区间,这里每一格代表该图的横坐标是身高区间,这里每一格代表5cm的身高范围(格子的身高范围(格子宽度因不同的数据性质或要求而定,这里的格子宽度
11、为宽度因不同的数据性质或要求而定,这里的格子宽度为5cm),而),而纵坐标为各种身高区间的身高的频数。纵坐标为各种身高区间的身高的频数。直方图直方图定量变量的图表示定量变量的图表示:2.盒型图盒型图简单一些的是简单一些的是盒形图盒形图(boxplot,又称,又称箱图、箱线图、盒子图箱图、箱线图、盒子图)。图图2的左边一个是根据地区的左边一个是根据地区1高三男生高三男生的身高数据所绘的盒形图;其右边的的身高数据所绘的盒形图;其右边的图代表另一个地区(地区图代表另一个地区(地区2)的高三)的高三学生的身高学生的身高(height.txt,height.sav,第三章例第三章例.xls)。盒型图盒型
12、图盒子的中间横线是数据的中位数盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线,封闭盒子的上下两横线(边)为上下四分位数(点);按照(边)为上下四分位数(点);按照SPSS的默认选项,如果所有的默认选项,如果所有样本中的数目都在离四分位点样本中的数目都在离四分位点1.5倍盒子长度之内,则线的端点为最倍盒子长度之内,则线的端点为最大和最小值,否则线长就是大和最小值,否则线长就是1.5倍的盒子长度(盒子长度称为四分位倍的盒子长度(盒子长度称为四分位间距),在其外面的度量单独点出间距),在其外面的度量单独点出定量变量的图表示定量变量的图表示:3.茎叶图茎叶图 在直方图和盒形图中,很
13、难恢复数据在直方图和盒形图中,很难恢复数据的原貌。而另一种图:的原貌。而另一种图:茎叶图茎叶图(stem-and-leafplots)可以恢复数据可以恢复数据以地区以地区1高三男生身高为例(图高三男生身高为例(图3),),茎叶图既展示了分布形状又有原始数茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。大位数的数字,叶为较小位数的数字。茎叶图茎叶图其中茎叶图中茎的单位为其中茎叶图中茎的单位为10cm,而叶子单位为,而叶子单位为1cm。比如,由于。比如,由于第一行茎为第一行茎为150cm,因此叶子中的九个数字,因此叶
14、子中的九个数字001223344代表九个数代表九个数目目150、150、151、152、152、153、153、154、154cm等。每等。每行左边有一个频数(比如第一行有行左边有一个频数(比如第一行有9个数目,第二行有个数目,第二行有17个等等);个等等);可以看出最长的一行为从可以看出最长的一行为从165cm到到169cm的一段(有的一段(有35个数)。个数)。定量变量的图表示定量变量的图表示:4.散点图散点图 数据会有两个变量,如美国男士和女数据会有两个变量,如美国男士和女士初婚年限数据(士初婚年限数据(marriage.txt)。)。该数据描述了自该数据描述了自1900年到年到1998
15、年男女年男女第一次婚姻延续的时间。第一次婚姻延续的时间。这里年份是一个变量,婚姻延续时间这里年份是一个变量,婚姻延续时间是第二个变量。由于不可能将所有人是第二个变量。由于不可能将所有人的婚姻年限都给出来,所以每年就取的婚姻年限都给出来,所以每年就取了一个中间的值了一个中间的值(中位数中位数)作为代表。作为代表。散点图散点图定性变量的图表示:饼图定性变量的图表示:饼图定性变量(或属性变量,分类变定性变量(或属性变量,分类变量)不能点出直方图、散点图或量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类茎叶图,但可以描绘出它们各类的比例。的比例。下面用下面用SPSS绘的图绘的图5(饼图,(饼图
16、,piechart)表示了说世界各种主要语表示了说世界各种主要语言人数的比例言人数的比例(language.txt).饼图饼图定性变量的图表示:条形图定性变量的图表示:条形图而用同样数据画的图而用同样数据画的图6称为称为条形条形图(图(barchart)。从每一条可以看出讲各种语言从每一条可以看出讲各种语言的实际人数,而且分别给出了的实际人数,而且分别给出了每个语种中母语和日常使用的每个语种中母语和日常使用的人数(在图中并排放置)。条人数(在图中并排放置)。条形图显示比例不如饼图直观。形图显示比例不如饼图直观。条形图条形图如何用少量数字来概括数据?如何用少量数字来概括数据?大量的数字既繁琐又不
17、直观;需大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允要对数据做人们时间和耐心所允许的简化许的简化我们可以用我们可以用“平均平均”,“差距差距”或百分比等来概括大量数字。或百分比等来概括大量数字。由于定性变量主要是计数,比较由于定性变量主要是计数,比较简单,常用的概括就是比例或百简单,常用的概括就是比例或百分比。下面主要介绍关于定量变分比。下面主要介绍关于定量变量的数字描述。量的数字描述。37小结小结例(rich.sav):福布斯世界富豪排行榜Rank:排名Name:姓名Citizenship:国籍Region:地区Age:年龄NetWorth:净财富(10亿美元)Residence
18、:居住地38定量变量的图表示定量变量的图表示直方图直方图Age,NetWorthSPSS:GraphsInteractiveHistogram39横坐标横坐标要研究的变量的取值范围格子的宽度因数据性质而定纵坐标纵坐标频数百分比数据分布的简单描述数据分布的简单描述单峰/双峰对称/非对称数据的疏密40盒型图盒型图不同区域年龄分布SPSS:GraphsInteractiveBoxplot41中间横线中间横线中位数封闭盒子的上下两边封闭盒子的上下两边上下四分位点线段的端点线段的端点最大值,最小值(线长小于1.5倍盒长)离群点离群点(outlier),极端值极端值(extreme)42茎叶图茎叶图欧洲区
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 分析 调查 问卷 数据 方法
限制150内