《定量资料统计描述》PPT课件.ppt
定量资料的统计描述定量资料的统计描述描述性统计分析是进行统计分析的第一步,做好这一步是正确进行统计推断的先决条件。1 1、集中趋势指标、集中趋势指标(Central Tendency):包括均数、几何均数、均数、几何均数、中位数中位数等。其中均数适用于正态分布和对称分布资料;几何均数适用于对数正态分布和呈等比的数据资料;中位数适合于所有分布类型的资料,但在实际中,中位数主要应用于偏态分布资料、分布不明资料和开口资料。2 2、离散趋势指标、离散趋势指标(Dispersion):包括全距、四分位数间距、全距、四分位数间距、方方差、标准差、变异系数、标准误等。差、标准差、变异系数、标准误等。方差、标准差用于正态分布资料,四分位数间距用于偏态分布资料,变异系数用于度量单位不同和均数相差悬殊的资料,标准误用于反映样本均数的离散程度,说明均数抽样误差大小。在在SPSSSPSS环境下建立数据文件的步骤:环境下建立数据文件的步骤:2 2、输入数据、输入数据 直接敲入即可直接敲入即可3、数据保存(、数据保存(File Save)1 1、定义变量、定义变量:(名字、类型)(名字、类型)1 1、排序(小排序(小大)(大)(Sort)2、频数加权(、频数加权(Weight Cases)3、计算产生新变量、计算产生新变量(Compute):变量变换等变量变换等4、重新赋值(、重新赋值(Recode):划分组段划分组段5、均数(、均数(Means)6、统计描述(、统计描述(Descriptives)7、频数(、频数(Frequencies)8、探索、探索(Explore)SPSS相关命令相关命令 分析用分析用数据数据准备准备集中趋势和离散趋势描述常用命令简介集中趋势和离散趋势描述常用命令简介(定量资料的统计描述定量资料的统计描述)SPSS软件主要命令软件主要命令:两个地方、四个命令。两个地方、四个命令。l案例:案例:l某地某地101例健康男子血清总胆固醇值测定结果如下,请绘例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数制频数表、直方图,计算均数、标准差、变异系数CV、中位数中位数M、和。、和。一、建立数据文件一、建立数据文件l1、定义变量:在数据窗口,点击、定义变量:在数据窗口,点击Variable View ,定义一,定义一个变量,变量名(个变量,变量名(Name)“x”,类型类型(Type)“数值数值(Numeric)”,宽度(宽度(Width)8,小数位数(小数位数(Decimals)2,变量标签,变量标签(Label):“血清总胆固醇血清总胆固醇”。l2、输入数据:略、输入数据:略选择统计指标选择统计指标选择统计图选择统计图把需计把需计算的变量算的变量移入框内移入框内OK(1)Frequencies功能简介功能简介集中集中趋势指标趋势指标离散离散趋势指标趋势指标百分位数百分位数仅给出仅给出P25P25、P75P75自定义百分位数自定义百分位数(1)Frequencies功能简介功能简介直方图(频数分布图)直方图(频数分布图)饼图(构成图)饼图(构成图)直条图直条图(1)Frequencies功能简介功能简介(2)Descriptives功能简介功能简介结果输出结果输出计算结果计算结果图图结果和图结果和图选择选择移入要计移入要计算的变量算的变量(3)Explore功能简介功能简介4、Means 分组变量分组变量(必需)(必需)分析的变量分析的变量(4)Means功能简介功能简介命令:命令:Means的应用的应用Means命令:命令:可用于计算所有的定量资料的统计描述指标可用于计算所有的定量资料的统计描述指标(包括:均数、几何均数、中位数)(包括:均数、几何均数、中位数)操作:操作:1、建立数据时,必须、建立数据时,必须多多加加组别组别;(切记!切记!)2、分析:、分析:Analyze Compare Means Means Dependent List(分析指标)Independent List(组别)Options(选择计算指标)continue OKMeans,case summaries:几何均数几何均数(记(记得增加组别)得增加组别)Frequencies:特殊百分位数:特殊百分位数 频数表资料频数表资料计算中位数计算中位数Descriptives:(均数:(均数标准差)方法最简单标准差)方法最简单 Explore:功能最齐全(:功能最齐全(95%CI)统计描述首选命令统计描述首选命令lFrequencies过程:产生频数表;按要求给出某百分位数。对定量资料和分类资料的描述都适用lDescriptives过程:进行一般性的统计描述,用于服从正态分布的资料,计算产生均数、标准差等;lExplore过程:用于对数据概况不清时的探索性分析;频数表编制的步骤频数表编制的步骤:(按数量大小分组,统计各(按数量大小分组,统计各组的频数)组的频数)1、找出最大、最小值:、找出最大、最小值:2、计算全距:、计算全距:3、确定组距、划分组段确定组距、划分组段:4、划记:对号入座、划记:对号入座5、计算频数:、计算频数:定量资料分组方法定量资料分组方法统计各组的频数统计各组的频数l二、求最大值、最小值、全距(二、求最大值、最小值、全距(R),确定组距),确定组距和组段和组段l由于由于SPSS给出精细的频数分布表(列出每个观察给出精细的频数分布表(列出每个观察值的频数),不能指定组距和组段,需要人工制值的频数),不能指定组距和组段,需要人工制定,故求出组距,确定组距和组段,对数据重新定,故求出组距,确定组距和组段,对数据重新编码后在做频数分析编码后在做频数分析lAnalyze=Descriptive Statistics=Descriptives资料的最大值是,最小值是,全距是。资料的最大值是,最小值是,全距是。则频数表的组距则频数表的组距 I=R/10=0.452,取。第取。第1组段的下限取,组段的下限取,最后一个组段是,共分最后一个组段是,共分10个组段。个组段。l三、对原始数据进行分组三、对原始数据进行分组 根据上述划分的组段,用Recode命令对数据进行分组。l操作方法:lAnalyze=Transform=Recode=Into Different Variables运行后产生新的变量运行后产生新的变量x1,其值其值110,最好对,最好对x1的的值定义标签,值定义标签,以便在统计分析的结果中以便在统计分析的结果中明确明确1-10所所对应的数值范围。对应的数值范围。四、对原始数据四、对原始数据(变量变量X)进行进行Frequencies过程分析过程分析Analyze=Descriptive Statistics=Frequencies Variables框:选入框:选入X l单击单击Statistics钮:钮:l选中选中Mean、Median复选框复选框 l单击单击Percentiles:输入:单击:输入:单击Add:输入:单击:输入:单击Add:记得记得Continuel单击单击Charts钮:钮:l选中选中Histograms (绘制直方图绘制直方图)l别忘了别忘了Continue和和OKl得出结果后手工计算出得出结果后手工计算出CVl五、对重新分组的数据(五、对重新分组的数据(X1)进行)进行Frequencies过过程分析程分析lAnalyze=Descriptive Statistics=Frequencies lVariables框:选入框:选入X1 l单击单击Charts钮:钮:l选中选中Bar charts(输出直条图输出直条图)l单击单击Continue钮钮 l单击单击OK注意:注意:SPSSSPSS只适用于原始数据只适用于原始数据,对,对于频数表数据于频数表数据仅为近似计算(用组中值)仅为近似计算(用组中值)1 1、一定用组中值、一定用组中值2 2、一定记得打勾、一定记得打勾频数表资料:频数表资料:1、建立数据文件:、建立数据文件:定义变量;输入数据;保存。(注:注:组段输组中值组段输组中值!)3、分析、分析Frequencies2、频数加权:、频数加权:Data-Weight Cases!频数表资料频数表资料l案例案例2l110名名7岁男童身高频数分布资料如下表岁男童身高频数分布资料如下表,对对该资料进行统计描述。该资料进行统计描述。l1、建立数据文件、建立数据文件l设立两个变量:分析变量设立两个变量:分析变量Height(输入身高的(输入身高的组中值),频数变量组中值),频数变量F,输入各个组段的频数。输入各个组段的频数。HeightF111111331159:l2、统计分析过程(1)Data=Weight Cases.=Weight Cases by =Frequency Variable框中选入:F (按F对数据进行加权)=OK(2)Analyze=DescriptiveStatistics=Frequency 在Variable(s)框选入height;在Statistics选入相应统计描述指标;Chart选直方图(3)选中 Value are group midpoint(说明数据是频数表资料,并且使用组中值进行计算)