spss05基本统计分析.ppt
第第5 5章章 基本统计分析基本统计分析返回返回频数分布分析一维频数分布分析过程q交叉表分析过程q频数分布分析实例描 述 统 计最简单的描述统计过程与实例q探索分析探索分析过程习题及部分参考答案目 录返回返回频数分布分析一维频数分布分析过程一维频数分布分析过程 返回频数分布主对话框频数分布主对话框 返回选择输出统计量对话框选择输出统计量对话框 返回图形参数选择对话框图形参数选择对话框 返回频数分布表格式对话框频数分布表格式对话框 返回交叉表分析过程 返回 交叉表分析主对话框交叉表分析主对话框 返回选择统计量对话框选择统计量对话框 返回精确检验对话框精确检验对话框 返回有关公式:有关公式:列联系数:列联系数:Cramer V:返回显示单元格值对话框显示单元格值对话框 返回格式对话框格式对话框 返回频数分布分析实例 返回不同年龄人员与其受教育年限的统计表不同年龄人员与其受教育年限的统计表 返回受教育年限的频数分布表受教育年限的频数分布表 返回age变量的直方图变量的直方图 返回educ变量直方图变量直方图 返回观测量统计处理摘要观测量统计处理摘要 返回各变量之间的多维频数分布表各变量之间的多维频数分布表 返回卡方检验卡方检验 返回观测量统计处理摘要观测量统计处理摘要 返回交叉表交叉表 及卡方检验结果卡方检验结果 返回描 述 统 计最简单的描述统计过程与实例 返回描述统计分析对话框描述统计分析对话框 返回选择项对话框选择项对话框 返回全美各种犯罪数据描述统计量全美各种犯罪数据描述统计量 返回探 索 分 析 返回箱图箱图 返回茎叶图茎叶图 返回箱图与箱图与Spread vs level图图(a)返回箱图与箱图与Spread vs level图图(b)返回探探 索索 分分 析析 过过 程程 返回数据探索对话框数据探索对话框 返回选择描述统计量对话框选择描述统计量对话框 返回统计图对话框统计图对话框 返回实例输出之一:观测量摘要表实例输出之一:观测量摘要表 返回salary变量的描述统计量变量的描述统计量 返回变量的极端值变量的极端值 返回数据正态分布检测统计量数据正态分布检测统计量 返回方差齐性检验方差齐性检验 返回 按照性别分组后的按照性别分组后的Current Salary的茎叶图的茎叶图 返回男、女组薪水数据的箱图男、女组薪水数据的箱图 返回习题及参考答案 返回习题11、分析不同性别的受访者的工资水平与订阅报纸的比例之间是否存在差异。使用的数据文件为data05-05,“inccat”变量为工资分类情况、“News”变量为报纸订阅情况,“gender”变量为性别。返回习题习题1操作步骤操作步骤(1)读取数据文件data05-08,按AnalyzeDescriptive StatisticsCrosstabs的顺序打开Crosstabs主对话框。(2)将变量“inccat”选入Row(s)框中,将变量“news”选入Column(s)框中,设置行列变量。将变量“gender”选入Layer of框中,作为控制变量。(3)单击Statistics按钮,展开Statistics对话框,选中Chi-square复选项。(4)单击Cells按钮,展开Cell Display对话框,在Counts栏中选中Observed复选项。(5)在主对话框中,单击OK按钮,提交系统执行。返回习题习题1结果结果此表说明合法观测量此表说明合法观测量6400个,没有缺失值个,没有缺失值 返回习题习题1结果分析结果分析1.男女订阅报纸的比例分别为43.8、42.7。2.被调查的男、女性工资水平高的,订阅报纸的比率也高。被调查者工资水平与订阅报纸的比率是否真有关系,见检验的结果。返回习题习题1结果分析结果分析 卡方检验表(其零假设为行列变量相互独立),由于男女各项卡方检验表(其零假设为行列变量相互独立),由于男女各项测试指标的显著水平值均小于测试指标的显著水平值均小于0.01,由此可以判明,工资水平与订,由此可以判明,工资水平与订阅报纸的比例有着明显的联系。阅报纸的比例有着明显的联系。返回习题2 使用data05-08数据,利用频数表简单说明家庭收入数据的分布情况与修整数据的方案。返回(1)打开spss05-08数据,按照AnalyzeDescriptive StatisticsFrequencies的顺序打开“Frequencies”对话框;(2)选择 变量Household income in thousands(income)进入Variable(s)框中;(3)选择Display frequency tables选择项;(4)打开“Statistics”对话框,选择Mean、Median、Std.deviation、Minimum和Maximum;(5)打开“Charts”对话框,选择Histograms With normal curve选择项;(6)单击OK按钮提交运算习题习题2操作步骤操作步骤 返回 在本例中发现平均值与中位数相差25左右,可能预示数据不会是正态分布习题习题2输出表之一输出表之一 返回习题习题2输出表之二输出表之二收入的频数分布表收入的频数分布表 返回 在图中可以发现绝大部分观测量集中在坐标的左侧,也就是说绝大部分家庭的收入少于100,000 元,只有很少一部分家庭的收入超过500,000元 但是这些很少的观测量却又会显著地影响着整个观测量的平均值。习题习题2输出之三输出之三 返回1.为了修整数据的分布情况,对本例“income”进行对数转换,按照Transform Compute.的顺序打开Compute Variables 对话框,在“target variable”框中输入一个新变量的名称(本例输入“lnin”),在“Numeric Expression”框中输入转换公式和变量名称(本例输入(income)。单击“OK”按钮提交运算。数据文件中生成新变量lnin。2.(1)按照AnalyzeDescriptive StatisticsFrequencies的顺序打开“Frequencies”对话框;(2)选择 变量lnin进入Variable(s)框中;(3)打开“Charts”对话框,选择Histograms With normal curve选择项;(5)单击OK按钮提交运算。习题2结果 返回上图为重新生成的直方图,其数据已经比较接近正态分布。习题2结果 返回 使用data05-09(ceramics.sav)数据,利用数据探索过程分析一种新型合金耐高温所得数据的分布情况。习题3 返回习题3操作步骤(1)打开spss05-09数据,按照AnalyzeDescriptive StatisticsExplore的顺序打开“Explore”对话框。(2)选择 变量“Degrees Centigrade”进入dependent List框中,作为因变量;选择 变量“Alloy”进入Factor List框中,作为因素变量。(3)选择变量“labrunid”,作为标签变量接入Label cases by 框中。(4)打开“Statistics”对话框,选择M-estimators、Outliers和Descriptive统计量(5)打开“Plots”对话框,选择Normality plots with tests选择项;(5)单击OK按钮提交运算。返回习题3结果分析 返回使用基本统计分析功能使用基本统计分析功能了解变量的基本特征了解变量的基本特征返回返回