《统计软件使用教程.pptx》由会员分享,可在线阅读,更多相关《统计软件使用教程.pptx(35页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、会计学1统计软件使用教程统计软件使用教程2023/4/172SPSS统计软件简介统计软件简介n nSPSS是社会科学统计软件包是社会科学统计软件包(Statistics Package For Social Science)的缩写)的缩写,经过几十年的,经过几十年的改进,该产品发展成为集统计分改进,该产品发展成为集统计分析、数据挖掘、商业智能、顾客析、数据挖掘、商业智能、顾客关系管理等多功能的统计产品和关系管理等多功能的统计产品和服务解决方案服务解决方案(Statistics Product For Service Solutions)的软件。适用于社会学、医学、的软件。适用于社会学、医学、心
2、理学、经济学等领域。心理学、经济学等领域。第1页/共35页2023/4/1731.20世纪世纪60年代末,美国斯坦福大学的三位研究生年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件研制开发了最早的统计分析软件SPSS,同时成立,同时成立了了SPSS公司公司2.1975年在芝加哥组建了年在芝加哥组建了SPSS总部总部3.1984年开发了年开发了DOS操作系统下的操作系统下的PC+1.0版本版本4.1992年的年的DOS版升级为版升级为Windows版本,即最初的版本,即最初的4.0版版5.1999年升级到年升级到10.0版、版、2001年升级为年升级为11.0版、版、2003年年W
3、indows操作平台下的最新版本为操作平台下的最新版本为12.0;目前已有目前已有17.0与著名统计软件与著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员相比,更适用于统计初学者或非统计学专业人员SPSSSPSS统计软件简介统计软件简介统计软件简介统计软件简介第2页/共35页2023/4/174SPSS的安装、启动和退出的安装、启动和退出安装安装安装安装启动启动启动启动方法一:方法一:进进进进入入入入WindowsWindows 开开开开始始始始 程程程程序序序序 SPSSSPSS forforwindowswindows单击单击单击单击方法二:方法二:直接双击桌面上的直接双击桌面
4、上的直接双击桌面上的直接双击桌面上的SPSSSPSS图标图标图标图标第3页/共35页2023/4/175安装后启动的界面安装后启动的界面安装后启动的界面安装后启动的界面SPSS的安装、启动和退出的安装、启动和退出第4页/共35页2023/4/176SPSS常用的窗口常用的窗口SPSS的安装、启动和退出的安装、启动和退出第5页/共35页2023/4/177SPSS的安装、启动和退出的安装、启动和退出退出退出退出退出方法:方法:单击主菜单中的单击主菜单中的单击主菜单中的单击主菜单中的FileFile单击单击单击单击ExitExit注:退出前要保存新建立的或修改的文件内容。注:退出前要保存新建立的或
5、修改的文件内容。与与SPSS相关文件的后缀名的意义:相关文件的后缀名的意义:.SAV.SAVSPSS的数据文件的数据文件.SPO.SPOSPSS在运行中产生的统计分析结果文件在运行中产生的统计分析结果文件.SPS.SPSSPSS语法程序文件语法程序文件第6页/共35页2023/4/178学习学习SPSS统计软件的目的统计软件的目的学会应用学会应用SPSSSPSS统计软件进行数据库的建统计软件进行数据库的建立和数据的正确录入立和数据的正确录入能够正确地选择适当的统计方法对录入能够正确地选择适当的统计方法对录入的数据进行分析的数据进行分析能够对统计结果进行正确的解释能够对统计结果进行正确的解释第7
6、页/共35页2023/4/179一、分析数据库的建立一、分析数据库的建立指把科研或日常工作中采集的各种指把科研或日常工作中采集的各种指把科研或日常工作中采集的各种指把科研或日常工作中采集的各种信息、数据,以某种方式存入到计算机信息、数据,以某种方式存入到计算机信息、数据,以某种方式存入到计算机信息、数据,以某种方式存入到计算机磁盘中,建立可随时存取、修改、统计磁盘中,建立可随时存取、修改、统计磁盘中,建立可随时存取、修改、统计磁盘中,建立可随时存取、修改、统计分析的数据文件的全过程。分析的数据文件的全过程。分析的数据文件的全过程。分析的数据文件的全过程。定义变量定义变量数据录入数据录入保存数据
7、保存数据第8页/共35页2023/4/1710变量格式设置窗口变量格式设置窗口变量格式设置窗口变量格式设置窗口(VariableView)(VariableView)定义变量定义变量第9页/共35页2023/4/1711例如例如例如例如 在在在在VariableViewVariableView窗口中窗口中窗口中窗口中Name更改变量名称Type选择变量类型(如numeric、date、string)Decimals设定小数显示的位数Label分析输出结果中变量的显示名称Values分析输出结果中变量内容的显示名称定义变量定义变量第10页/共35页2023/4/1712数据录入数据录入数据编辑窗
8、口(数据编辑窗口(数据编辑窗口(数据编辑窗口(DataEditorDataEditor)操作演示操作演示第11页/共35页2023/4/1713保存数据保存数据操作操作单击单击FileFileSave(As)Save(As)在文件名在文件名栏输入盘符:栏输入盘符:路径路径文件名文件名单击单击保存保存保存保存SPSSSPSS数据转换功能较强数据转换功能较强:可存取和转换多种数据类型可存取和转换多种数据类型,Spss,Spss(*.sav.sav),),Excel(*.xls)Excel(*.xls),Text(*.txt),dBase(*.dbf)Text(*.txt),dBase(*.dbf)
9、文件等。文件等。第12页/共35页2023/4/1714学生操作学生操作n n建立一个以自己名字为文件名的建立一个以自己名字为文件名的SPSS数据数据库库n n调查变量包括:姓名、性别(调查变量包括:姓名、性别(1=男性,男性,2=女性)、出生日期(美式)、身高(单位女性)、出生日期(美式)、身高(单位cm,保留,保留2位小数)位小数)n n输入自己的数据并保存输入自己的数据并保存第13页/共35页2023/4/1715二、数据的统计分析二、数据的统计分析用统计指标、统计表、统用统计指标、统计表、统计图等方法去对资料的数计图等方法去对资料的数量特征及分布规律进行测量特征及分布规律进行测定和描述
10、定和描述统计分析统计分析统计分析统计分析统计描述统计描述统计描述统计描述指如何抽样以及如何用指如何抽样以及如何用样本信息推断总体特征样本信息推断总体特征的问题的问题 统计判断统计判断统计判断统计判断第14页/共35页2023/4/1716统计描述统计描述(descriptive statistics 过程过程)n n新建数据库或打开已有数据库新建数据库或打开已有数据库(如:如:diameter_sub.savdiameter_sub.sav数据库记录了数据库记录了216216个人体脊柱椎体的矢状面个人体脊柱椎体的矢状面管径,试对变量管径,试对变量“trueap_mean”(trueap_mea
11、n”(矢状面管径矢状面管径)作描述性分作描述性分析,并绘制直方图析,并绘制直方图)AnalyzeDescriptivestatisticsFrequencies使左侧源变量栏进入右侧使左侧源变量栏进入右侧variable(s)栏栏单击单击statistics选择统计指标选择统计指标continuechat选择要输出的图形选择要输出的图形continueformat选择要输出的格式选择要输出的格式continueOK1.1.频数表分析频数表分析(frequencies)第15页/共35页2023/4/1717第16页/共35页2023/4/1718频数表分析频数表分析(frequenciesfr
12、equencies)Quartiles四分位数四分位数Mean均数均数Median中位数中位数Mode众数众数Sum总和总和Std.devation标准差标准差Variance方差方差Range极差极差S.E.mean标准误标准误 displaydisplayfrequencyfrequencytablestables 显显示示频频数数分分布布表表(是是针针对对每每一一个个数数值,并非分组段)值,并非分组段)percentile(s)percentile(s)显显示示分分布布分分析析:选选 择择P2.5和和P97.5或或P5和和P95(即即95%和和90%正正常常值范围)值范围)distrib
13、utiondistribution:选择:选择skewness(偏度系(偏度系数),数),kurtosis(峰(峰度系数)度系数)第17页/共35页2023/4/17192.描述性统计分析描述性统计分析(descriptives)建立或打开已有的数据文件建立或打开已有的数据文件操操操操作作作作AnalyzeDescriptiveStatisticsDescriptives 使使左左侧侧源源变变量量栏栏进进入入右右侧侧variable(s)栏栏单单击击opions选选择择统统计计量量OK该模块的特殊功能该模块的特殊功能:数据标准化数据标准化第18页/共35页2023/4/17203.探索性描述探
14、索性描述(explore)建立或打开已有的数据文件建立或打开已有的数据文件操操操操作作作作AnalyzeDescriptive StatisticsExplore使使左左侧侧源源变变量量栏栏进进入入右右侧侧dependent栏栏,分分组组变变量量进进入入factor栏栏单单击击statistics,plots选选择择统统计计量量OK该模块的特殊功能该模块的特殊功能:数据的异常值分析以及资料特数据的异常值分析以及资料特征分析:正态性以及方差齐性征分析:正态性以及方差齐性第19页/共35页2023/4/1721统计推断统计推断3.配对样本均数比较配对样本均数比较t检验检验Paired-sample
15、stTestt检检验验1.样本均数与总体均数比较样本均数与总体均数比较t检验检验Onesamplettest2.两样本均数比较两样本均数比较t检验检验Independent-samplestTest计量资料统计推断计量资料统计推断第20页/共35页2023/4/1722统计推断统计推断计数资料统计推断计数资料统计推断双变量直线相关与回归双变量直线相关与回归4.4.2 2检验检验crosstablecrosstable5.5.相关系数相关系数r r的假设检验的假设检验Correlation-bivariateCorrelation-bivariate6.6.回归系数回归系数b b的假设检验的假设
16、检验Regression-linearRegression-linear多变量相关与回归多变量相关与回归第21页/共35页2023/4/1723统计推断统计推断统计推断统计推断1.单样本单样本t检验检验数据文件数据文件“t-test_1.sav”,根据营养学要求,成年女性每日摄入食物的推荐平均热量为,根据营养学要求,成年女性每日摄入食物的推荐平均热量为7725kcal。今随机抽取。今随机抽取11名名20至至30岁成年女性每日摄入的热量如下:岁成年女性每日摄入的热量如下:5260,5470,5640,6180,6390,6515,6805,7515,7515,8230,8770问:现今问:现今2
17、0至至30岁成年女性每日摄入食物的平均热量是否足够?岁成年女性每日摄入食物的平均热量是否足够?AnalyzeCompareMeansOnesampleTtest使使左左侧侧源源变变量量栏栏变变量量进进入入右右侧侧Test栏栏在右下方在右下方Test中输入总体均数中输入总体均数OK第22页/共35页2023/4/1724结果解释结果解释双侧检验的双侧检验的P值值标准差标准差标准误标准误自由度自由度t值值均数均数第23页/共35页2023/4/1725AnalyzeCompareMeansIndependentSampleTtest使使左左侧侧源源变变量量中中的的分分析析变变量量进进入入右右侧侧T
18、est栏栏左左侧侧源源变变量量中中的的分分组组变变量量进进入入Grouping栏栏单单击击DefineGroups输输入入组的变量值组的变量值ContinueOK统计推断统计推断统计推断统计推断2.2.两样本均数比较两样本均数比较两样本均数比较两样本均数比较t t检验检验检验检验以临床试验的数据文件以临床试验的数据文件以临床试验的数据文件以临床试验的数据文件“clinicaltrial.sav”clinicaltrial.sav”为例,为了检验随机分组变量的均衡性,对治疗前两组的为例,为了检验随机分组变量的均衡性,对治疗前两组的为例,为了检验随机分组变量的均衡性,对治疗前两组的为例,为了检验随
19、机分组变量的均衡性,对治疗前两组的“age(age(年龄)、年龄)、年龄)、年龄)、heigh(heigh(身高)、身高)、身高)、身高)、wtwt(体重)、(体重)、(体重)、(体重)、SBPSBP(收缩压)、(收缩压)、(收缩压)、(收缩压)、DBPDBP(舒张压)以及(舒张压)以及(舒张压)以及(舒张压)以及pulsepulse(心率)(心率)(心率)(心率)”做两独立样本的做两独立样本的做两独立样本的做两独立样本的t t检验检验检验检验注:成组设计的两个变量必须一个是检验变量注:成组设计的两个变量必须一个是检验变量X,另一个是分组变量,另一个是分组变量group。第24页/共35页20
20、23/4/1726结果解释结果解释结果解释结果解释方差齐性检验方差齐性检验如果方差齐如果方差齐如果方差不齐如果方差不齐第25页/共35页2023/4/1727统计推断统计推断统计推断统计推断3.3.配对样本配对样本配对样本配对样本t t检验检验检验检验根据数据文件根据数据文件根据数据文件根据数据文件“clinicaltrial.sav”clinicaltrial.sav”分别比较试验组和安慰剂组治疗前后分别比较试验组和安慰剂组治疗前后分别比较试验组和安慰剂组治疗前后分别比较试验组和安慰剂组治疗前后4 4对血常规检查指标,即变量对血常规检查指标,即变量对血常规检查指标,即变量对血常规检查指标,即
21、变量“hb1hb1和和和和hb2hb2(血红蛋白含量)、(血红蛋白含量)、(血红蛋白含量)、(血红蛋白含量)、rbc1rbc1和和和和rbc2rbc2(红细胞记数)、(红细胞记数)、(红细胞记数)、(红细胞记数)、wbc1wbc1和和和和wbc2wbc2(白细胞记数)、(白细胞记数)、(白细胞记数)、(白细胞记数)、plt1plt1和和和和plt2plt2(血小板记数),变量名中(血小板记数),变量名中(血小板记数),变量名中(血小板记数),变量名中“1”1”代表治疗前,代表治疗前,代表治疗前,代表治疗前,“2”2”代表治疗后代表治疗后代表治疗后代表治疗后Analyze Compare Mea
22、ns PairedSampleTtest同同时时使使左左侧侧配配对对的的两两个个变变量量进入右侧进入右侧pairedvariables栏栏OK注:配对资料必须成对输入,分别以注:配对资料必须成对输入,分别以X1和和X2表示,无分组变量表示,无分组变量第26页/共35页2023/4/1728结果解释结果解释结果解释结果解释差值均数差值均数第27页/共35页2023/4/1729统计推断统计推断统计推断统计推断4.2检验检验为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹患者随机分为两组,临床观察结果见下表,问两组的总体有效患者随机分为两
23、组,临床观察结果见下表,问两组的总体有效率有无差别?(文件名为率有无差别?(文件名为“chi2_2.sav)组别有效无效合计有效率抗病毒组31255655.36紫外线组5596485.94合计863412071.67紫外线和抗病毒药物治疗带状疱疹疗效比较第28页/共35页2023/4/1730注:如果数据库为原始数据则不用加权注:如果数据库为原始数据则不用加权Dataweightcasesweightcasesby将频数将频数调入变量栏调入变量栏okAnalyzeDescriptivestatisticsCorsstabs分分别调入行变量别调入行变量Rows、列变量、列变量ColumnsSta
24、tisticsChi-squareContinueCells选择结果要输出选择结果要输出的内容的内容Continueok第29页/共35页2023/4/1731结果解释结果解释结果解释结果解释不须校正不须校正校正校正确切概率计算确切概率计算 2值值第30页/共35页2023/4/1732n n5.相关系数相关系数r的假设检验的假设检验n n随机抽取随机抽取123名不同年龄的人检测名不同年龄的人检测TRF(限制性端粒片段长度,(限制性端粒片段长度,bp)结果见数据文件)结果见数据文件“correlate_1.sav”,试分析,试分析人的年龄(人的年龄(age)和)和trf是否相关是否相关?统计推
25、断统计推断统计推断统计推断AnalyzeCorrelateBivariate两个变量同时进两个变量同时进入分析变量栏入分析变量栏选择相关分析方法(选择相关分析方法(Pearson,KendallorSpearman)ok本例选择本例选择Pearson相关,相关,Kendall和和Spearman 为等级相关为等级相关第31页/共35页2023/4/1733结果解释结果解释结果解释结果解释r=-0.732P0.001,两者存在显著负相关关系,两者存在显著负相关关系第32页/共35页2023/4/17346.回归系数回归系数b的假设检验的假设检验数据文件数据文件“correlate_1.sav”,age为自变量,为自变量,TRF为应为应变量,建立直线回归方程。变量,建立直线回归方程。AnalyzeRegressionLinearTRF入入Dependent栏,栏,age入入Independent栏栏ok常数项常数项a回归系数回归系数b回归系数回归系数b的假设检验的假设检验t检验检验统计推断和结果解释统计推断和结果解释统计推断和结果解释统计推断和结果解释第33页/共35页2023/4/1735请同学们上机操作请同学们上机操作第34页/共35页
限制150内