spss统计分析实例分析.ppt
《spss统计分析实例分析.ppt》由会员分享,可在线阅读,更多相关《spss统计分析实例分析.ppt(91页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1、基本统计分析、基本统计分析基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中,包括分析,但专门为该目的而设计的几个模块则集中在描述菜单中,包括:1.1频数分析频数分析频数分析目的:基本统计分析往往从频数分析开始。通过频频数分析目的:基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是数分析能够了解变量取值的状
2、况,对把握数据的分布特征是非常有用的。非常有用的。(1)编制频数分布表)编制频数分布表频数:即变量值落在某个区间(或某个类别)中的次数频数:即变量值落在某个区间(或某个类别)中的次数百分比:即各频数占总样本数的百分比百分比:即各频数占总样本数的百分比有效百分比:即各频数占有效样本数的百分比,有效样本数总样本缺失样本有效百分比:即各频数占有效样本数的百分比,有效样本数总样本缺失样本数数累计百分比:即各百分比逐级累加起来的结果。最终取值为累计百分比:即各百分比逐级累加起来的结果。最终取值为100。(2)绘制统计图)绘制统计图1.1 频数分析频数分析频数分析的基本操作频数分析的基本操作(1)分析)分
3、析描述统计描述统计频率频率(2)将频数分析变量选择到)将频数分析变量选择到变量框中变量框中(3)单击表格按钮选择绘制)单击表格按钮选择绘制统计图形,选择饼图统计图形,选择饼图1.1频数分析频数分析1.1频数分析频数分析输出结果输出结果1.1频数分析例频数分析例1例例11分析住房状况调查数据中户主的从业状况分析住房状况调查数据中户主的从业状况和目前所住房屋的产权情况和目前所住房屋的产权情况思路:利用频数分布表及图形思路:利用频数分布表及图形条件:都是分类变量,直接分析条件:都是分类变量,直接分析步骤:步骤: 调用命令:调用命令: AnalyzeDescriptive StatisticsFreq
4、uencies 选择分析变量选择分析变量 选择图形选择图形 选择分布表输出格式选择分布表输出格式1.1频数分析例频数分析例1分析结果分析结果从从 业业 状状 况况130043.443.443.450416.816.860.346715.615.675.92959.99.985.72859.59.595.31424.74.7100.02993100.0100.0国营企业行政事业单位私营企业其它失业大专院校科研单位TotalValidFrequencyPercentValid PercentCumulativePercent房房 屋屋 产产 权权145648.648.648.671523.923.
5、972.542014.014.086.62147.27.293.71183.93.997.7612.02.099.79.3.3100.02993100.0100.0多层商品房无产权部分产权经济适用房其它二手房高层商品房TotalValidFrequencyPercentValid PercentCumulativePercent分布表中累计百分比基本分布表中累计百分比基本没有意义,应该删除。没有意义,应该删除。1.1 频数分析扩展功能频数分析扩展功能分位数分位数(Pencentile Values) 计算分位数计算分位数:适用于定距数据适用于定距数据 数据按升序排序后,找到若干个分位点上的变量
6、值数据按升序排序后,找到若干个分位点上的变量值 quartiles:计算计算四分位数四分位数25%(QL)、50%(中位数中位数)、75%(QU) cut points for n equal groups:n等份等份 percentile:自定义百分位点自定义百分位点 其他基本统计量集中趋势(Central Tendency)离散趋势(Dispersion)分布形态(Distribution)1.1 频数分析扩展功能例频数分析扩展功能例案例案例12 分析人均住房面积的分布,并对本市户口和外地户口家分析人均住房面积的分布,并对本市户口和外地户口家庭的人均住房面积分布情况进行比较。庭的人均住房面
7、积分布情况进行比较。 特点:特点:“人均住房面积人均住房面积”是定距型变量是定距型变量 步骤:步骤: 根据“人均住房面积”建立分组变量; 调用命令频数分析命令Frequencies 选择分组变量作为分析变量 再一次使用频数分析命令Frequencies选择“人均住房面积”作为分析变量不选择生成频数表,选择不生成图形选择计算四分位数 根据“户口状况”对数据进行拆分(Split File) 再重复上一步的工作(计算分类的四分位数)案例案例12分析结果分析结果1人人 均均 面面 积积 ( 分分 组组 )33711.311.311.3134244.844.956.183527.927.984.0478
8、16.016.0100.02992100.0100.01.02993100.010平米以下1020平米2030平米30平米以上TotalValidSystemMissingTotalFrequencyPercentValid PercentCumulativePercent案例案例12分析结果分析结果2S St ta at ti is st ti ic cs sa a人均面积2825013.666719.400026.6667ValidMissingN255075Percentiles户口状况 = 本市户口a. S St ta at ti is st ti ic cs sa a人均面积1680
9、13.437521.125035.0000ValidMissingN255075Percentiles户口状况 = 外地户口a. StatisticsStatistics人均面积2993013.666719.625026.6667ValidMissingN255075Percentiles频数分析频数分析例:例:测量测量100名健康名健康成人的血清蛋白总含成人的血清蛋白总含量,形成数据量,形成数据serum(克(克/升),使用频数升),使用频数分析了解这一数据的分析了解这一数据的统计特征。统计特征。频数分析频数分析该教学案例数据解析该教学案例数据解析均值(平均值、平均数)表示的是某变量均值(平
10、均值、平均数)表示的是某变量所有取值的集中趋势或平均水平。例如,所有取值的集中趋势或平均水平。例如,学生某门学科的平均成绩、公司员工的平学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。均收入、某班级学生的平均身高等。中值是在一组数据中居于中间的数中值是在一组数据中居于中间的数(特别注意的特别注意的地方是:这组数据之前已经经过升序排列!地方是:这组数据之前已经经过升序排列!),即在这组数据中,有一半的数据比它大,有,即在这组数据中,有一半的数据比它大,有一半的数据比它小。如果这组数据包含偶数个数一半的数据比它小。如果这组数据包含偶数个数字,中值是位于中间的两个数的平均值。字,
11、中值是位于中间的两个数的平均值。 10 20 40 50 70 10 20 30 40 50 60 百分位数分析:比如,假设某个考生在入学考试百分位数分析:比如,假设某个考生在入学考试中的语文部分的原始分数为中的语文部分的原始分数为54分。相对于参加同分。相对于参加同一考试的其他学生来说,他的成绩如何并不容易一考试的其他学生来说,他的成绩如何并不容易知道。但是如果原始分数知道。但是如果原始分数54分恰好对应的是第分恰好对应的是第70百分位数,我们就能知道大约百分位数,我们就能知道大约70的学生的考分的学生的考分比他低,而约比他低,而约30的学生考分比他高。的学生考分比他高。 众数(众数(Mod
12、e)统计学名词,在统计分布上具有)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。众数可以不存在或多于一个)。 修正定义:是修正定义:是一组数据中出现次数最多的数值,叫众数,有时一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用众数在一组数中有好几个。用M表示。表示。 理性理解理性理解:简单的说,就是一组数据中占比例最多的那个:简单的说,就是一组数据中占比例最多的那个数。数。全距也称为极差全距也称为极差,是数据的最大值与最小,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下值之
13、间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距的两组数据,全距大的一组数据要比全距小的一组数据更为分散。小的一组数据更为分散。 计算公式:最大值最小值。计算公式:最大值最小值。1.2 描述分析描述分析描述分析目的:获取数据的均值、标准差描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把握数据的、峰度等数据,进一步把握数据的集中趋集中趋势势、离散程度离散程度和和分布形状分布形状。基本描述统计量基本描述统计量 刻画集中趋势的统计量刻画集中趋势的统计量 刻画离散程度的统计量刻画离散程度的统计量 刻画分布形态的统计量刻画分布形态的统计量1.2 描述分析描述分析刻画集中趋势
14、的统计量刻画集中趋势的统计量集中趋势指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的统计量正是要寻找能够反应数据一般水平的集中趋势的统计量正是要寻找能够反应数据一般水平的“代表值代表值”或或“中心值中心值”。常用统计量:常用统计量:均值均值、中位数中位数、众数众数1.2 描述分析描述分析刻画离散程度的统计量刻画离散程度的统计量离散程度离散程度是指一组数据远离其是指一组数据远离其“中心值中心值”的程度。的程度。 如果数据都紧密地集中在如果数据都紧密地集中在“中心值中心值”的周围,数据的离的周围,数据的离散程度较小,说明这个散程度较小,说明这个
15、“中心值中心值”对数据的代表性好;对数据的代表性好;相反,如果数据仅是比较松散地分布在相反,如果数据仅是比较松散地分布在“中心值中心值”的周的周围,数据的离散程度较大,则此围,数据的离散程度较大,则此“中心值中心值”说明数据特说明数据特征是不具有代表性的。征是不具有代表性的。常用统计量:常用统计量:全距、方差、标准差全距、方差、标准差 标准差(standard deviation-Std Dev):表示某变量的所有变量值离散程度的统计量。SPSS中计算的是样本标准差。中计算的是样本标准差。 方差(variance):标准差的平方。SPSS中计算的是样本方差。中计算的是样本方差。 极差 (ran
16、ge): (maximum)(minimum)1.2 描述分析描述分析刻画分布形态的描述统计量刻画分布形态的描述统计量数据分布形态主要指数据分布数据分布形态主要指数据分布是否对称是否对称,偏斜程度偏斜程度如何,如何,分布分布陡峭程度陡峭程度等。等。常用统计量:常用统计量:偏度、峰度偏度、峰度偏度偏度:描述变量取值分布:描述变量取值分布形态对称性形态对称性的统计量。的统计量。当分布为对称分布时,正负总偏差相等,偏度值等于当分布为对称分布时,正负总偏差相等,偏度值等于0;当分布为不对称分;当分布为不对称分布时,正负总偏差不相等,偏度值大于布时,正负总偏差不相等,偏度值大于0或小于或小于0。偏度值。
17、偏度值大于大于0表示正偏差表示正偏差值大,称为值大,称为正偏或右偏正偏或右偏;偏度值;偏度值小于小于0表示负偏差值大,称为表示负偏差值大,称为负偏或左偏负偏或左偏。偏度偏度绝对值越绝对值越大,表示数据分布形态的大,表示数据分布形态的偏斜程度越大偏斜程度越大。峰度:描述变量取值分布峰度:描述变量取值分布形态陡峭程度形态陡峭程度的统计量。的统计量。当数据分布与标准正态分布的陡峭程度相同时,峰度值等于当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0;峰度;峰度大于大于0表表示数据的分布比标准正态分布示数据的分布比标准正态分布更陡峭更陡峭,为,为尖峰分布尖峰分布;峰度;峰度小于小于0表示数据的表
18、示数据的分布比标准正态分布分布比标准正态分布平缓平缓,为,为平峰分布平峰分布。1.2 描述分析描述分析计算基本描述统计量的操作计算基本描述统计量的操作(1)分析)分析描述统计描述统计描述描述(2)将分析变量选择到变量框中)将分析变量选择到变量框中(3)单击选项按钮指定基本统计量)单击选项按钮指定基本统计量1.2 描述分析描述分析1.2.2应用例一应用例一案例案例13:计算人均住房面积的基本描述统计量:计算人均住房面积的基本描述统计量,并对本市户口和外地户口家庭的情况进行比较,并对本市户口和外地户口家庭的情况进行比较。操作步骤:操作步骤: 调用命令调用命令AnalyzeDescriptive S
19、tatisticsDescriptives 选择“人均面积”作为分析变量 选择必要的分析指标 根据户口状况对数据进行拆分根据户口状况对数据进行拆分(Split File) 重新调用命令重新调用命令Descriptives计算不同户口状况的指计算不同户口状况的指标值标值1.2.2应用例一分析结果应用例一分析结果Descriptive StatisticsDescriptive Statistics28251682.403.33115.00101.0021.725826.716512.1753918.967482.1811.429.046.1878.3112.121.092.373Statisti
20、cStatisticStatisticStatisticStatisticStatisticStd. ErrorStatisticStd. ErrorNMinimumMaximumMeanStd. DeviationSkewnessKurtosis人均面积人均面积本市户口外地户口户口状况Descriptive StatisticsDescriptive Statistics29932.40115.0022.006012.701062.1607.739.045.089NMinimumMaximumMeanStd. DeviationSkewnessKurtosisSkewnessKurtosis
21、StatisticStd.Error人均面积全部数据分析结果分组数据分析结果1.2 描述性分析 描述性分析主要用于输出变量的各类描述性统计量的值,通过上一节的学习可知,频数分析同样可以做到,都是以计算数值型单变量的统计量为主。描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准正态评分值,并以变量形式存入数据文件中,以便后续分析时应用。 在多元统计分析中,对均值差异较大的变量,采在多元统计分析中,对均值差异较大的变量,采用变量标准化后的数据进行分析,可以消除均值用变量标准化后的数据进行分析,可以消除均值差异带来的影响。差异带来的影响。描述统计量描述统计量例:例:调
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- spss 统计分析 实例 分析
限制150内