应用统计学统计描述讲稿.ppt
《应用统计学统计描述讲稿.ppt》由会员分享,可在线阅读,更多相关《应用统计学统计描述讲稿.ppt(88页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学统计描述第一页,讲稿共八十八页哦 在在数数据据收收集集、整整理理完完毕毕后后,进进行行深深入入统统计计分分析析之之前前,首首要要的的工工作作就就是是去去了了解解这这个个数数据据的的整整体体情情况况,随随后后考考虑虑作作深深入入的的推推断断。用用少少量量数数字字(描描述述指指标标)概概括括大大量量原原始始数数字字,对对数数据据进进行行描描述述的的统统计计方方法法即即为为描描述述性性统统计分析。计分析。统计描述统计描述 连续变量的统计描述连续变量的统计描述 分类变量的统计描述分类变量的统计描述第二页,讲稿共八十八页哦集中趋势的描述指标集中趋势的描述指标 算术均数算术均数:适合单峰和基本对
2、称的分布:适合单峰和基本对称的分布 中位数中位数:适用于任意分布类型:适用于任意分布类型 截尾均数截尾均数:数据中有极端值,用截尾均数更好:数据中有极端值,用截尾均数更好 几何均数几何均数:适用于原始数据分布不对称,但经过对数转换:适用于原始数据分布不对称,但经过对数转换 后呈对称分布的资料后呈对称分布的资料 众数众数(Mode):样本数据中出现频次最大的那个数字:样本数据中出现频次最大的那个数字 调和均数调和均数(H):较少使用,观察值:较少使用,观察值x倒数之均数的倒数,倒数之均数的倒数,常用于完成的工作量相等而所用时间不常用于完成的工作量相等而所用时间不 同,求平均速度的情况同,求平均速
3、度的情况第三页,讲稿共八十八页哦 全距全距 大体了解数据的分布范围,用于预备性检查大体了解数据的分布范围,用于预备性检查 方差和标准差方差和标准差 适用于正态分布适用于正态分布 百分位数百分位数 如中位数(如中位数(P50)、四分位数()、四分位数(P25、P50、P75)四分位间距四分位间距 即即P75-P25,适用于任意分布类型,不受极端值影响,适用于任意分布类型,不受极端值影响 变异系数变异系数(CV)S/,适用于测量尺度相差太大或数据量纲不同时,适用于测量尺度相差太大或数据量纲不同时,比较两组数据离散程度的大小比较两组数据离散程度的大小离散趋势的描述指标离散趋势的描述指标第四页,讲稿共
4、八十八页哦 SPSS的的许许多多模模块块均均可可完完成成统统计计描描述述的的任任务务,除除各各种种用用于于统统计计推推断断的的过过程程会会附附带带进进行行相相关关的的统统计计描描述述外外,SPSS还还专专门门提提供供了了几几个个用用于于连连续续变变量量统统计计描描述述的的过过程程,均均集集中中于于AnalyzeDescriptive Statistics子菜单中。子菜单中。Frequencies 过程过程 Descriptives 过程过程 Explore 过程过程 Ratio 过程过程第五页,讲稿共八十八页哦 Frequencies:产产生生原原始始数数据据的的频频数数表表,并并能能计计算算
5、各各种种百百分分数数,并并可可绘绘制制频频数数图图,如如连连续续型型变变量量的的直直方方图图,或或分分类类变变量量的的饼饼图图或或条条图。下面以图。下面以demo.sav为例,对人群的年龄数据(为例,对人群的年龄数据(age)进行描述。)进行描述。Frequencies 过程过程第六页,讲稿共八十八页哦 若无变量标签,则列表框中只显示变量名若无变量标签,则列表框中只显示变量名 对话框中,从左边变量列表中选择要分析的变量,对话框中,从左边变量列表中选择要分析的变量,放入右边的放入右边的Variables(变量)列表中(变量)列表中至至少少一一个个变变量量选选入入后后,OK按按钮钮才才可使用可使用
6、Frequencies 过程过程变量标签变量标签变量名变量名第七页,讲稿共八十八页哦 鼠标右键单击变量,可以获得更多变量信息鼠标右键单击变量,可以获得更多变量信息 选择下拉按钮,显示所有定义的值标签选择下拉按钮,显示所有定义的值标签Frequencies 过程过程第八页,讲稿共八十八页哦:表示该变量为数值型变量表示该变量为数值型变量:表示该变量为字符型变量,且右下角的表示该变量为字符型变量,且右下角的表示短字符,表示短字符,即变量长度即变量长度=8位位Frequencies 过程过程第九页,讲稿共八十八页哦 Statistics:设定要分析的统计量:设定要分析的统计量分位数值分位数值集中趋势集
7、中趋势离散趋势离散趋势分布指标分布指标若若数数据据为为组组中中值值,将其选中将其选中本本例例选选择择四四分分位位数数和和5、95分分位数位数Frequencies 过程过程第十页,讲稿共八十八页哦本例选中绘制直方图本例选中绘制直方图图图表表类类型型:箱箱式式图图、饼饼图图、直方图等直方图等Frequencies 过程过程 Charts:设定要绘制的统计图:设定要绘制的统计图第十一页,讲稿共八十八页哦 Format:在:在SPSS对话框中,用于设定结果文件中的对话框中,用于设定结果文件中的 数据格式,通常默认即可。数据格式,通常默认即可。数据排序方式数据排序方式 多变量分析时的显示方式多变量分析
8、时的显示方式 设定组别超过设定组别超过n组时不显示表格组时不显示表格Frequencies 过程过程第十二页,讲稿共八十八页哦 通过大纲视图可以快速定位各项结果通过大纲视图可以快速定位各项结果 例如:点击大纲视图上的例如:点击大纲视图上的Histogram,则可快速定位至,则可快速定位至 age的频数直方图的频数直方图Frequencies 过程过程第十三页,讲稿共八十八页哦分析结果分析结果(1)统计量统计量 人人群群年年龄龄无无缺缺失失值值,四四分分位位数数为为33岁岁、41岁岁、51岁岁,即即人人群群中中有有1/4小小于于33岁岁,1/2小小于于41岁岁,1/4大大于于51岁岁。另另外外,
9、90的的人人在在2464岁之间。岁之间。Frequencies 过程过程第十四页,讲稿共八十八页哦Frequencies 过程过程分析结果分析结果(2)频数表频数表Frequency:频数:频数Percent:百分比:百分比当前频数当前频数/总数(包括缺失值)总数(包括缺失值)Valid Percent:有效百分比:有效百分比当前频数当前频数/有效总数(不包括缺失值)有效总数(不包括缺失值)Cumulative Percent:累积百分比:累积百分比累积频数累积频数/有效总数(不包括缺失值)有效总数(不包括缺失值)第十五页,讲稿共八十八页哦Frequencies 过程过程分析结果分析结果(3)
10、频数直方图)频数直方图第十六页,讲稿共八十八页哦 Descriptive:一一般般性性统统计计描描述述,相相对对于于Frequencies,它它不不能能绘绘制制统统计计图图,所所能能计计算算的的统统计计量量也也较较少少,适适用用于于对对服服从从正正态态分分布布的的连连续续型型变变量量进进行行描描绘绘。同同样样以以demo.sav为为例例,对对人人群群的的年年龄龄数数据据(age)进行描述。)进行描述。Descriptives 过程过程第十七页,讲稿共八十八页哦 单击中间的箭头,可以实现变量从一张表移入另一张表,单击中间的箭头,可以实现变量从一张表移入另一张表,现将变量现将变量age移入右边移入
11、右边variable列表中列表中Descriptives 过程过程第十八页,讲稿共八十八页哦 Options:设定要分析的统计量及数据的显示顺序:设定要分析的统计量及数据的显示顺序本例选择:本例选择:均均数数、标标准准差差、最最大大值值、最最小小值、峰度系数、偏度系数等值、峰度系数、偏度系数等Descriptives 过程过程第十九页,讲稿共八十八页哦 人人群群年年龄龄的的最最小小值值为为18岁岁,最最大大值值为为77岁岁,均均数数42.06岁岁,标标准准差差12.29岁岁,偏偏度度系系数数0.299,峰峰度度系系数数-0.602,基基本本近近似似正正态。态。Descriptives 过程过程
12、分析结果分析结果描述性统计量描述性统计量第二十页,讲稿共八十八页哦 Explore:对对连连续续型型资资料料分分布布不不清清楚楚时时的的探探索索性性分分析析,可可以以分分类类别别进进行行描描述述(Frequencies和和Descriptives不不行行),计计算算多多种种描描述述统统计计量量,给给出出各各种种统统计计图图,进进行行简简单单参参数数估估计计。以以demo.sav为为例例,对对男男女女性性(gender)的年龄()的年龄(age)分别进行描述。)分别进行描述。Explore 过程过程第二十一页,讲稿共八十八页哦要进行分析的应变量:要进行分析的应变量:age分类变量:分类变量:ge
13、nderExplore 过程过程第二十二页,讲稿共八十八页哦点估计中的稳健估计:点估计中的稳健估计:M估计估计极端值极端值百分位数百分位数一般描述一般描述 默认情况下,选择的是默认情况下,选择的是Descriptives,本例选择默认,本例选择默认Explore 过程过程第二十三页,讲稿共八十八页哦箱式图箱式图用于正态性检验的用于正态性检验的QQ图图 茎叶图茎叶图直方图直方图Levenes方差齐性检验选项方差齐性检验选项Explore 过程过程第二十四页,讲稿共八十八页哦 缺失值的设置,一般默认即可缺失值的设置,一般默认即可Explore 过程过程第二十五页,讲稿共八十八页哦 本例无缺失值,有
14、效人数女性本例无缺失值,有效人数女性3179人,男性人,男性3221人人Explore 过程过程分析结果分析结果(1)缺失值报告缺失值报告第二十六页,讲稿共八十八页哦 现仅对女性的分析结果依次解释,现仅对女性的分析结果依次解释,查看详情查看详情Explore 过程过程分析结果分析结果(2)统计量统计量第二十七页,讲稿共八十八页哦集中趋势指标、离散趋势指标集中趋势指标、离散趋势指标分布特征指标、参数估计分布特征指标、参数估计Explore 过程过程分析结果分析结果第二十八页,讲稿共八十八页哦 集集中中趋趋势势指指标标:3179名名女女性性的的平平均均年年龄龄为为41.74岁岁(Mean),去去掉
15、掉两两侧侧各各5的的极极端端值值后后,截截尾尾均均数数为为41.45岁岁(5 Trimmed Mean),中中位位数数41.00岁岁(Median),本本例例上上述述三三指指标标值值基基本本相相同同,可可推推测测数数据应当是对称分布的。据应当是对称分布的。Explore 过程过程 离离散散趋趋势势指指标标:年年龄龄的的方方差差为为142.988岁岁2(Variance),其其平平方方根根即即标标准准差差为为11.958岁岁(Std.Deviation)。全全部部女女性性中中最最小小的的18岁岁(Minimum),最最大大的的76岁岁(Maximum)。两两者者之之差差即即全全距距58岁岁(Ra
16、nge),中中 间间 一一 半半 女女 性性 的的 年年 龄龄 差差 即即 四四 分分 位位 数数 间间 距距17岁岁(Interquartile Range)。)。第二十九页,讲稿共八十八页哦 分分布布特特征征指指标标:表表明明数数据据偏偏离离正正态态分分布布程程度度的的偏偏度度系系数数(Skewness)为为0.327,峰峰度度系系数数(Kurtosis)为为-0.534。偏偏度度系系数数大大于于0为为正正偏偏态态,峰峰度度系系数数小小于于0表表明明峰峰比比正正态态低低,本本例例偏偏度度和和峰度系数均接近峰度系数均接近0,因此认为近似正态分布。,因此认为近似正态分布。参参数数估估计计:均均
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 统计 描述 讲稿
限制150内