2022年《社会统计学与SPSS应用》实验指导书 .pdf
《2022年《社会统计学与SPSS应用》实验指导书 .pdf》由会员分享,可在线阅读,更多相关《2022年《社会统计学与SPSS应用》实验指导书 .pdf(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 社会统计学与SPSS 应用的实验指导书一、实验指导书撰写说明(一)撰写宗旨与社会统计的理论知识相结合,力求简单易懂,以案例数据模拟分析。(二)撰写大纲首先,说明 SPSS 的数据库建立。围绕问卷的不同题型介绍录入的方式,以及问卷数据的录入。第二, SPSS 的数据与变量的重组。主要围绕原始数据如何生成研究者所需要的新变量数据来谈。第三, SPSS 的数据分析。这是撰写的重点部分,就简单的描述统计、两变量的相关分析、回归分析和检验等进行案例式讲解。第四, SPSS 的数据在 Word文档中的编辑使用。(三)适用学生人群已经上过社会统计学理论课程的学生; 如果正在上社会统计学课程的学生,其应当
2、是与理论课交叉结合或者是先上完理论课再上实验课。因为 SPSS软件本身是一种数据分析软件,只有具备基本知识才可以深入地掌握软件中的统计意义。(四) SPSS的版本本指导书是在 13.0 基础上来操作实现的。二、数据库结构的建立首先打开 SPSS窗口,出现如下窗口名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 29 页 - - - - - - - - - 2 单击下面的变量窗口,出现然后开始录入数据库,录入方式如下:名称,通常就是问卷上的题号编码,不能直接录入数字,界定方法
3、有三种:一种是根据问卷各部分为准, 如 A01/B01/C01; 一种是按照问题顺序, P (Problem缩写) 01/02;一种是研究者自己可以识别的标准。2类型当点击 1 行的类型对应的空白时, 出现如下窗口,通常我们选择数值或字符类型。当是录入汉字时,就为字符型;当录入数字时就为数值型。3宽度表示录入的字数,一个汉字两个字符,因此在类型为字符型时,要将宽度增大。4小数点表示的数字后面的小数点位数。默认为 2。5标签表示测量的变量名称,简单来讲,就是问卷中的问题6值表示测量变量的选项, 也就是问卷中一道题所对应的选项。 当点击值下的空白时,出现如下窗口,在该窗口中可以定义变量值,如1=男
4、,0=女。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 29 页 - - - - - - - - - 3 7缺失值在如下窗口定义缺失值。8列表示列宽度,通常默认为8。9对齐有左对齐、右对齐和居中三种。10测量标准社会统计上分为四个层次:定类、定序和定距(定比)。因此测量标准也就三个。11具体的录入方法第一,开放题的录入当是数字测量时,则类型选择数值型,在值一栏不需要定义。当是汉字填写时,则类型选择字符型,在值一栏不需要定义。名师资料总结 - - -精品资料欢迎下载 -
5、- - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 29 页 - - - - - - - - - 4 第二、单选题的录入当选择项中没有 “其他”项时就不需要另外设置一道题补充说明,具体录入如下(见 A02 和 A02a) :第三、多选题的录入当没有限制选项的多选题, 录入标准是:一道题有多少个选项则单独设置为多少道题,且选项作为“标签” ,值定义为“ 1=是或选, 0=否或不选”。如果其中有其他,则设置为开放题形式。当限制选项的多选题,录入标准是:限制选多少项,就设置为多少道题,“标签”为问卷的问题, 每一道题的值就为全
6、部选项值。如果选项中有其他, 则需要在另外补充一道题进行说明。定义了所有变量后,单击“ Data View” 标签,即可在出现的数据视图(编辑)窗中输入数据。三、变量的重组在讲变量重组之前, 需要说明的是, 你必须已经录入好了数据。 录入数据的时候,由于样本量大, 通常是建立一个同一的数据库结构,也就是 Variable view,名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 29 页 - - - - - - - - - 5 然后分为几个人来共同录入, 但是如何才能够将
7、分散录入的数据进行整合呢,我们在合并文件 data-Merge file 菜单下完成。Add case : 要求合并的两个文件中的所有变量名称要相同;Add variable:要求合并的两个文件中的案例数相同。由于录入好的数据, 有时候并不能够直接用来分析, 因此需要对变量进行重组或者称为转换,将数据分组、合并等,实现这样的功能有两种操作菜单:(一) ,该任务是在 transform 转换中的 compute计算变量来完成的,主要有三种形式: 第一是将定距变量进行分组。 例如,想要对过去一年家庭年纯收入进行分组, 具体操作过程式首先选择函数组中的算术,然后在函数和特殊变量中选择 TRUNC 函
8、数(取整表示舍弃小数点后的数字) ,然后再点击向上箭头,进入数字表达式栏TRUNC (?), 在下图左边的类型与标签栏中找出想要转换的变量(如蓝色标示) ,然后点击向右的箭头,进入到数字表达式,为TRUNC(A14/3000) ,最后在“目标变量”下面录入重组后的变量名称,如“分组后的家庭年纯收入”,最后点击“确定”即可。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 29 页 - - - - - - - - - 6 第二种,条件转化。如将分组后的家庭年纯收入,进行再集中
9、。具体操作如下:点击上图中的“如果” ,然后出现如下窗口:在该窗口中,需选“如果个案满足条件则包括”,则灰色就变成黑色,然后就在左边栏选择“分组后的家庭年纯收入”变量后点击向右的箭头,则“分组后的家庭年纯收入= 10”后,点击继续,窗口返回到计算变量窗口,在数字表达式栏中,输入“ 10”后,检察目标变量确定为“分组后的家庭年纯收入”,最后点击“确定”即可。请注意如下变化:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 29 页 - - - - - - - - - 7 第三
10、种,将两个可以直接进行数学运算的变量进行运算。如计算“家庭人均年纯收入” ,则是用“家庭年纯收入”/“家庭总人口数”来实现。(二)在 Transform 转换下的 recode菜单下 Recode into different variable完成名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 29 页 - - - - - - - - - 8 将左边的变量移入右边空白栏中,然后在输出变量栏下的名称命名,并点击change 更改,则在输入变量 -输出变量栏会同时显示原来的变
11、量名称和更改后的变量名称。点击 old and new旧值和新值,出现如下窗口:旧值有不同的设定方式:(1)当为确定值则直接选择Value 值,如另 10,添加到下面的旧新栏下。(2)当时一个范围 Range时,则选择范围,如下图1 0 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 29 页 - - - - - - - - - 9 总之,旧值是什么,然后将其定义为新值,并点击添加,直到定义完毕,点击继续,返回到前一个页面,则点击ok 即可。注意:我们不要选择定义为相同变
12、量,如果这样可能丧失原始数据信息。四、SPSS 的数据分析本部分主要围绕社会统计学教材,讲述单变量的描述、双变量的交互分类、相关系数测量。这主要是在Analyze 下的 descriptive statistics完成。第一, frequency 频率名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 9 页,共 29 页 - - - - - - - - - 10 (1) 选择左边栏中的变量到右边variables 变量栏(没有变量层次限制),就可以点击 ok,就只有频率表格。(2) 当
13、选择了变量后,如果点击statistics,则出现A、百分位值有四分位数,是分别为25%、50%、75%;割点表示你将其分为多少等分,如果为 10,则表示其直接分位10等分;百分位数, 你可以进行自定义;B、集中趋势:定类众数;定序中位数;定距均值。C、离散趋势:定距标准差和方差;范围=最大值与最小值的差;均值的标准误,也就是标准差 / n;D、分布:偏度 Skewness,表示是否是对称的,左偏还是右偏;峰度Kurtosis表示分布是偏平的还是高耸的。例如,当选择“客厅数”这一定距变量时,所呈现出的统计结果:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - -
14、 - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 29 页 - - - - - - - - - 11 通过统计,结果显示,在500个调查样本中,有效样本数为489,整体上平均拥有客厅数 1.21 件,有 75%的调查者只有 1 间以下的客厅,由于均值在中位值的右边,且偏度值为正,则说明该分布呈现正向偏态。注意:请根据变量测量层次选择统计的量,点击继续然后返回到前页面框,点击ok 即可。(3)当选择了变量后,并向选择charts图表,出现选择条形图、饼状图、直方图的窗口,则可以输出图形。(4)可以选择输出的格式。将变量按照变量值还是分布次数从低到高还是从高
15、到低等。第二,描述( descriptive )步骤: Analyzedescriptive 使用变量层次: 主要适用于定序 (在社会学中可以将其赋予分值后视为定距看待)和定距变量。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 29 页 - - - - - - - - - 12 如上图,可以选择需要描述的统计选项, 也可以将其标准化得分另存为一个新变量。该部分与 Frequency的区别在于:A、 Descriptive 菜单中没有百分位统计; B、Descripti
16、ve 菜单中只有定距变量统计量;C、二者的输出结果的行列不同(具体如下)第三、探索分析1)目的:由于收集到的数据分布我们并不清楚,因此,需要对数据进行初步探索,以便确定选择的统计方法。 目的是为了发现数据中的错误,探索变量分布特征。2) 步骤:点击 Analyzedescriptiveexplore, 就打开 explore 对话窗口。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 29 页 - - - - - - - - - 13 3)界面解释:Dependent l
17、ist:因变量列表;Factor list:因子列表Label Cases by :标注个案Display:统计量( statistics)和绘制图 ( plots)都显示4)具体操作:A) 点击 statistic 后,出现的统计窗口,M-estimators 描述集中趋势的稳健极大似然估计量,这些估计量的值在用于观测值时分配于不同的权重而得到的,极端值权重小于接近于中心观测值的权重,对具有长尾的对称分布或有极端值时,其给出比平均值或中位数更好的均值估计。分别为 Huber 稳健估计; Hampel非降稳健估计; Andrew 波估计; Tukey 复权重估计。B) 点击 plots 后,出
18、现绘图窗口(如上图) ,则有Boxplots(箱图):按照factor level together(因子水平分组)、Dependent together(因变量分组 )、none(无);Descriptive(描述):Stem and leaf( 茎叶图 )、histogram(直方图 );检验: normality plots by tests;Spread( 扩展 )或 levene 水平检验: none(无)、power estimate(幂估计)、transformed(已转换 )可以选择各种形式的幂(如自然对数) 、名师资料总结 - - -精品资料欢迎下载 - - - - - -
19、- - - - - - - - - - - - 名师精心整理 - - - - - - - 第 13 页,共 29 页 - - - - - - - - - 14 5)结果呈现6)结果解释:表示进行 M 估计与中位值 77.50 和 57.00 相差不太大 ;但是离均值不近,因此可以认为分布不具合理的正态性。M-Estimators78.9878.4578.7078.4457.0956.3556.9956.3168.5667.9568.2767.9450.6049.9050.8649.89城市韶关广州韶关广州建筑面 积实住面 积HubersM-Estim atoraTukeysBiweig htb
20、HampelsM-Estim atorcAndrewsWavedThe weighting constant is 1.339.a. The weighting constant is 4.685.b. The weighting constants are 1.700, 3.400, and 8.500c. The weighting constant is 1.340*pi.d. 95%置信度下的均值间距区间5%修正均值四分位差名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14
21、 页,共 29 页 - - - - - - - - - 15 极端值表给出了在不同区域的调查者建筑面积对应的最高和最低的5 个调查对象对应的面积数。极端值表能够直观地告诉我们数据的极端分布情况。方差齐性检验, 由于都显著,说明韶关和广州的建筑面积在均值和中位值的差异显著,正态曲线拟和差。Test of Homogeneity of Variance29.1691395.00025.5901395.00025.5901356.863.00028.1611395.00025.8111395.00023.5771395.00023.5771372.213.00025.2861395.000Based
22、 on MeanBased on MedianBased on Median andwith adjusted dfBased on trim med meanBased on MeanBased on MedianBased on Median andwith adjusted dfBased on trim med mean建筑面积实住面积LeveneStatisticdf1df2Sig.Extreme Values217男28099女230137男19036男180172男150156女1134女2029女2063男2215女22305女395402女160306女150345男1503
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 社会统计学与SPSS应用 2022年社会统计学与SPSS应用实验指导书 2022 社会 统计学 SPSS 应用 实验 指导书
限制150内