《组织行为学研究技术.pptx》由会员分享,可在线阅读,更多相关《组织行为学研究技术.pptx(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、SPSS基础知识介绍数据录入数据整理数据分析第1页/共48页SPSS for Windows中的两个基本窗口数据编辑窗口和数据输出窗口SPSS的数据编辑窗口窗口标题为data editor,是对分析对象SPSS数据文件进行录入、修改、管理等基本操作的窗口。(SPSS数据文件均以.sav作为文件扩展名存储。)数据编辑窗口包括几部分:窗口主菜单、工具栏、数据编辑区、系统状态显示区窗口主菜单File:文件操作菜单;Edit:文件编辑菜单;Data:文件建立和编辑菜单;View:用户界面基本状态设置等菜单;Transform:基本处理菜单;Analyze:分析菜单;Graphs:统计图形菜单;Util
2、ities:相关应用和设置菜单;Windows:窗口切换菜单;Help:帮助菜单第2页/共48页SPSS数据文件的特点它是一种有结构的数据文件,包括文件结构和数据两部分。一列数据称为一个变量,每个变量都有一个名称,即变量名,变量名是存取SPSS每个变量的惟一标识。SPSS数据文件的结构是对每个变量及相关属性的描述。SPSS数据文件中的一行数据称为一条个案(Case),所有Case组成了SPSS数据文件的数据部分。建立SPSS数据文件分两步:第一步是定义SPSS数据文件的结构;第二步是输入分析数据。第3页/共48页SPSS数据文件的结构SPSS数据文件的结构是对每列变量及其相关属性的描述,包括D
3、ata Editor的Variable View界面是定义变量结构的界面,一行代表一个变量定义,列代表变量的特征。第4页/共48页变量特征(1)Name(变量名)长度不超过8个字符,由英文字母或汉字开头(后跟数字或字母的字符串)组成Type(变量类型)指变量取值的特征。系统默认的变量类型为NumericNumeric标准数值型,Comma带逗号的数值型,Dot圆点数值型,Scientific Notation科学记数法,Date日期型,Dollar带美元符号的数值型,Custom Currency自定义数值型,String字符型以上红色标示出的为数值型变量,其值可参加运算第5页/共48页变量特
4、征(2)Width(变量长度)变量值的取值长度,系统默认为8Decimals(小数位数)系统默认为2Label(变量名标签)对简洁的变量名作进一步的解释或说明Values(变量值标签)使用变量值标签可简化数据的输入和处理,系统默认为None第6页/共48页变量特征(3)Missing(缺失值定义)缺失值指在收集数据过程中的无记录或失真数据。系统默认为No missing values(无缺失值定义)Discrete missing values离散值。在矩形框中输入(最多)三个值,在进行统计分析时遇到这三个值均当作缺失值处理。Range plus one optional discrete m
5、iss连续的数值范围加上一个离散值Column(变量列宽)系统默认为8第7页/共48页变量特征(4)Align(数值对齐方式)指变量值显示时的左对齐(Left)、右对齐(Right)、居中对齐(Center)方式系统默认数值型变量的对齐方式为右对齐(Right),字符型变量的对齐方式是LeftMeasure(变量特性的测量尺度)Scale:比例尺度,连续取值的变量Ordinal:有序尺度,其值按某种符合逻辑的顺序排列Nominal:名义尺度,既无数量表示,也无次序关系,只是表现为某种状态,其值通常是非数值数据字符型变量默认为Nominal请各举一例第8页/共48页定义数据文件的结构手工逐个定义
6、变量第9页/共48页数据的录入与保存数据录入的方法有两种:按行输入:每次输入一个样品行按列输入:每次输入一个变量常用的光标移动键:或shift+Tab或Tab或EnterHome当前单元格所在行的首单元格End当前单元格所在行的末单元格Ctrl+Home数据文件的最左上角单元格Ctrl+End数据文件最右下角单元格第10页/共48页数据的整理产生一个新变量排序重新赋值第11页/共48页描述性统计分析-Descriptive Statistics菜单详解第12页/共48页Descriptive Statistics菜单Frequencies过程产生频数表及图,对分类资料和定量资料都适用。Desc
7、iptives过程(使用频率最高的功能)进行一般性的统计描述,适用于服从正态分布的定量资料。Explore过程用于对数据分布状况不清时的探索性分析。Ratio过程(SPSS11.0以上版本新增)用于对两个连续性变量计算相对比指标。Crosstabs过程完成分类资料/等级资料的统计描述和各种各样“常规”的统计检验。第13页/共48页Frequencies过程专门为产生频数表而设计。不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的统计图。更适合于对分类变量以及不服从正态分布的连续性变量进行描述。第14页/共48页例:打开文件CH3CH4,请绘制频数表、直方图,计算均数、标准差
8、、变异系数、中位数、p2.5和p97.5AnalyzeDescriptive StatisticsFrequencies,进入频次分析模块点击Statistics钮,选择Quartiles四分点、Mean样本均值、Median中位数、Mode众数、Sum样本和、Std.deviation标准差点击Chart,进入图形子窗口OK第15页/共48页操作步骤AnalyzeDescriptive StatisticsFrequenciesVariables框:XStatistics :选择Mean Median Std.deviation Percentiles:键入2.5Percentile:键入9
9、7.5Add选入要分析的变量要求计算均数、标准差和中位数要求计算P2.5和P97.5百分位数做出频数分布的直方图第16页/共48页界面说明主对话框Variable(s):用于选入需要进行描述的变量Display frequency tables:确定是否在结果中输出频数表Statistics子对话框Percentile Values复选框组:定义需要输出的百分位数Central tendency复选框组:用于定义描述集中趋势的一组指标Dispersion复选框组:用于定义描述离散趋势的一组指标。Distribution复选框组:用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度
10、系数(Kurtos)。Values are group midpoints:当输出的数据是分组频数数据,且具体数值是组中值时,这样计算机在计算各种百分数的时候会按数据频数表对待(如果不计算百分位数,选不选无所谓)第17页/共48页Charts子对话框:定义统计图类型无;条图;圆图;直方图(是否加上正态曲线)Chart Values单选钮组:是按照频数还是按百分比作图Format子对话框用于定义输出频数表的格式,采用默认设置,一般不用更改。界面说明第18页/共48页Descriptives过程可将原始数据转换成标准正态评分值,并以变量的形式存入数据库供以后分析第19页/共48页界面说明主对话框S
11、ave standardized values as variables:确定是否将原始数据的标准正态变换结果存为新变量,选中则该变量自动命名为“Z+原变量名”Option子对话框Display Order:变量列表顺序(默认);字母顺序;均值升序;均值降序第20页/共48页量表制作的两种方法量表制作的两种方法利用现有的量表(back-translation)开发新的量表第21页/共48页利用现有的量表利用现有的量表常常需要将英文量表翻译成中文最起码的要求是回译。在正式使用量表之前最好要对量表进行试测。第22页/共48页例:I worry a great deal about what my
12、superiors think of me.翻译:我担心主管对我的看法.回译:I am very concerned with my superiors opinion of me.我紧张主管对我的意见.翻译及回译第23页/共48页常用翻译技术简单直接翻译专家指导下的直接翻译双盲翻译第24页/共48页简单直接翻译研究者自己翻译。委托专家翻译。第25页/共48页专家指导下的直接翻译翻译者在翻译过程中与专家组至少会面两次。第一次会面专家在翻译上给予意见,翻译者作出必要的改动。第二次会面翻译者与专家联合讨论作出最佳的翻译。第26页/共48页双盲翻译两位翻译者独自翻译,然后比较结果。不公平的事常令我不
13、安。(翻译 1)不公平常烦扰我。(翻译 2)Unfairness disturbs me.(原文)第27页/共48页量表的信度和效度检验信度:可靠性(trustworthiness),指测验结果结果的一致性(consistency)或稳定性,(stability)信度的类型:重测信度,复本信度,折半信度,Conbach信度,评分者信度效度:正确性,指测验或其它测量工具确能测出其所欲测量的特质或功能之程度。效度愈高,表示测验的结果愈能显现其所欲测量对象的真正特征。效度是测量工具重要的必备条件。效度的类型:内容效度,效标关联效度,结构效度(集聚效度,区分效度)第28页/共48页信度分析的信度分析的
14、SPSS操作步骤操作步骤第29页/共48页信度分析练习数据“信度分析.sav”记录了某问卷测量的数据,该问卷共有10道题目,均为9分量表,高分数代表同意此观点,共测量了100人。现请你考察该问卷的信度。第30页/共48页操作步骤AnalyzeScaleReliability Analysis如果什么选项都不选,结果异常简单,只会给出信度系数。信度接近0.8,可以认为本问卷的内部信度较好。第31页/共48页操作步骤AnalyzeScaleReliability AnalysisStatistics子对话框 Descriptives for用于选择一些可供输出的统计量Item:给出各变量的均值和标
15、准差Scale:给出各变值之和(即总分)的均值、方差和标准差Scale if item deleted:给出当在问卷中删除当前变量(题项)后,问卷相应指标的改变情况第32页/共48页调整后的项目调整后的项目-总体相关(总体相关(Corrected Item-Total Correlation)小于)小于0.4的条目,予以删除。的条目,予以删除。第33页/共48页步骤步骤1:产生项目产生项目(归纳式和演绎式归纳式和演绎式)步骤步骤2:制作初始问卷并收集数据:制作初始问卷并收集数据步骤步骤3:项目删减项目删减(EFA)步骤步骤4:验证性因子分析验证性因子分析步骤步骤5:效度检验(:效度检验(CFA
16、,集聚,集聚/区分效度)区分效度)步骤步骤6:流程复制:流程复制 开发新的量表开发新的量表信度分析探索性因子分析第34页/共48页步骤1:产生项目/条目演绎式需要:(a)对将要调查的现象有所了解;(b)充分的文献回顾,以发展概念的理论性定义。第35页/共48页利:通过充分的构念定义,项目应能覆盖所有与构念相关的内容,从而保证量表的内容效度。弊:需要研究者拥有关于现象的较丰富的知识;这对于探索性研究可能是苛求。步骤1:产生项目/条目演绎式第36页/共48页文献回顾后发现并不能找到较清晰的概念维度时,怎么办?研究者们可以小范围地询问被试,让被试描述其对于组织的感受,或者描述行为的某些方面对访谈结果
17、进行内容分析,基于关键词或某主题或是采用一种分类的流程,将这些反应分成不同的类别步骤1:产生项目/条目归纳式第37页/共48页利:适用于探索性研究弊:由于概念的定义没有基于前人的文献,所以发展一些在概念上一致的项目比较困难。需要内容分析方面的专家依赖于因子分析,但因子分析也许并不能保证负载于相同因子的项目拥有相同的理论构念步骤1:产生项目/条目归纳式第38页/共48页每个构念应有多少条项目?对于大多数构念而言,4-6 条就可以了。初次生成的项目,应是4-6 条的两倍。第39页/共48页项目的测量所使用的量表应反映出被试足够的差异。Likert量表在调查研究中使用频率最高。Likert 量表由五
18、个相等间距组成,中间的不偏不倚。第40页/共48页步骤2:制作初始问卷并收集数据样本规模:项目-样本比建议为1:4 到 1:10 例:如果有30个项目,做探索性因子分析时样本规模可以为305=150。做验证性因子分析时,样本规模最小为200。第41页/共48页步骤3:初步项目删减内部一致性信度检验信度有关测量工具的准确度或精度,是效度的必要条件。使用Cronbachs alpha系数来测量内部一致性信度。项目之间的相关系数调整后的项目-总体相关小于0.4的条目,予以删除。第42页/共48页Cronbach Alpha 系数需要多高的水平?在探索性研究中,量表是为了新的构念而开发的,Alphas
19、 值需要超过0.70在基本研究中,研究者使用已有的量表,Alphas 需要超过0.80在应用研究中,研究者需要基于测量结果来作出决策,Alphas 值需要超过0.90第43页/共48页步骤3:初步项目删减EFA探索性因子分析 删除负载小于0.40的项目同一项目在不同因子上载荷差值应该大于0.3,否则应予以删除;如果一个因子只有一个项目,则删除该因子。第44页/共48页主成分因子分析法主成分因子分析法(PFA)是一种简化资料结构的方法,将量表中原来含有很多变量的潜在特质,尽可能予以归并至极少数的因子或共同特质,以简化描述特质时所使用的类别数。当一个量表经过主成分因子分析将主要因子找出后,即可了解
20、此份量表所测量的共同特质是什么。我们再利用各个因子的载荷量来表示这份量表的有效性。如果原来的量表经主成分因子分析法所产生的特质结构符合其理论上的结构,则表示这一量表具有较好的结构效度。第45页/共48页步骤4:验证性因子分析(CFA)验证性因子分析可以通过结构方程模型(Structure Equation Modeling,SEM)来实现它是以研究者最初构建的模型为基础,通过对数据的迭代计算来验证模型对数据的支持程度研究者可以根据理论和数据调整模型。如果模型拟合程度较高,则表明结构效度良好。验证性因子分析通过因子载荷来判断聚合效度,通过信赖区间检定法(Confidence Interval T
21、est)和变异数抽取估值法(Variance Extracted Estimate)来验证区分效度。信赖区间检验法就是考察两个因子之间的相关系数加减标准误的两倍是否包含1,如果不包含1,则表明数据有较高的区别效度(Anderson&Gerbing,1988)。GFI,t-,2第46页/共48页步骤5:效度检验(集聚效度/区分效度)集聚效度(Convergent validity)when there is a high correspondence between scores from two or more different measures of the same construct.区分效度(Discriminant validity)-when scores from measures of different constructs do not converge.第47页/共48页感谢您的观看!第48页/共48页
限制150内