第四章基本统计分析.ppt
《第四章基本统计分析.ppt》由会员分享,可在线阅读,更多相关《第四章基本统计分析.ppt(51页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1-1-1 1第四章第四章 SPSS的基本统计分析的基本统计分析1-1-2 2SPSS的基本统计分析的基本统计分析频数分析频数分析-对应表格法对应表格法计算描述统计量计算描述统计量-对应数值法对应数值法探索性描述分析探索性描述分析-结合结合交叉分组下的频数分析交叉分组下的频数分析多选项分析多选项分析统计图统计图-对应图形法对应图形法1-1-3 3频数分析频数分析目的粗略把握变量的总体分布状况。粗略把握变量的总体分布状况。例:例:对某个问题的总体看法,如新业务的使用愿望、教学效对某个问题的总体看法,如新业务的使用愿望、教学效果等果等 对某事物的客观描述,如通话的漫游类型、大客户的行对某事物的客观
2、描述,如通话的漫游类型、大客户的行业分布业分布采用的方法n n制作频数分布表:包括计算制作频数分布表:包括计算 频数、累计频数、频数、累计频数、百分比、累计百分比百分比、累计百分比n n绘制统计图形:条形图(品质数据)、饼图、绘制统计图形:条形图(品质数据)、饼图、直方图(数量数据)直方图(数量数据)1-1-4 4频数分析频数分析基本操作步骤(1)菜单选项:Analyze-Descriptive Statistics-Frequencies(2)选择几个待分析的变量到variables框.(3)chart选项,选择所需要的图形例:班级男女生频数分布表、成绩分布表1-1-5 5频数分析应用举例移
3、动通话的漫游类型分析特点:定类数据使用频数、百分比、总数(不可缺少的)不使用频数表中给出的累计频数和累计百分比移动通话时间分析、移动客户话费分析特点:定序数据、数量数据除使用频数、百分比、总数外,还可以充分使用累计频数和累计百分比1-1-6 6频数分析数据中存在缺失值使用有效百分比(分母为有效样本数)例:学生成绩得优率、得良率Frequencies-Format频数分布表输出按变量值、频数升序、降序输出1-1-7 7频数分析频数分析中的其他分析计算中位数、分位数:适用于定序、定距数据数据按升序排序后,找到若干个分位点上的变量值quartiles:计算四分位数25%(QL)、50%(中位数)、7
4、5%(QU)cut points for n equal groups:n等份percentile:自定义百分位点计算众数:适用于定类数据(但必须是数值型)1-1-8 8频数分析频数分析中的其他分析分位数的应用 从一个侧面比较两组样本数据的集中趋势例:(QL=50,QU=80)和 (QL=70,QU=75)的比较在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和 (QL=70,QU=75)的比较分位数、中位数、众数的应用举例不同类型的移动客户月话费比较(数据拆分)利用分位数(不显示频数分布表),比较男女生成绩集中程度1-1-9 9计算描述统计
5、量计算描述统计量目的n n精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法n n计算基本描述统计量1-1-1010计算描述统计量计算描述统计量描述集中趋势的统计量描述集中趋势的统计量n n均值均值(mean):mean):表示某变量所有变量值集中趋势或平均水平表示某变量所有变量值集中趋势或平均水平的统计量。的统计量。l l适用于定距数据。适用于定距数据。l l特点:利用了全部数据,易受极端值的影响。特点:利用了全部数据,易受极端值的影响。描述离散程度的统计量描述离散程度的统计量n n标准差标准差(standard deviation-Std Dev):st
6、andard deviation-Std Dev):表示某变量的所有表示某变量的所有变量值离散趋势的统计量。变量值离散趋势的统计量。l lSPSSSPSS中计算的是样本标准差。中计算的是样本标准差。n n方差方差(variance):variance):标准差的平方。标准差的平方。l lSPSSSPSS中计算的是样本方差。中计算的是样本方差。n n极差极差(range):range):最大值最大值(minimum)-minimum)-最小值最小值(minimum)minimum)1-1-1111计算描述统计量计算描述统计量描述对称程度的统计量 n n偏度(skewness):描述某变量所有变量
7、值分布形态的偏斜程度和方向的统计量.l l偏度为偏度为0 0表示表示对称对称;l l大于大于0 0表示正偏差大表示正偏差大(右偏右偏),),众数比均值众数比均值小小,极值大于均值极值大于均值;l l小于小于0 0表示负偏差大表示负偏差大(左偏左偏)。1-1-1212计算描述统计量计算描述统计量描述陡峭程度的统计量n n峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。l l峭度为峭度为0 0表示与正态分布峭度相同。表示与正态分布峭度相同。l l大于大于0 0表示比正态分布陡,尖峰。表示比正态分布陡,尖峰。l l小于小于0 0表示比正态分布缓;平峰。表示比正态分布缓;平峰。
8、1-1-1313计算描述统计量计算描述统计量其他统计量 n n均值标准误差(S.E means)l l中心极限定理认为:样本均值中心极限定理认为:样本均值 N(u,N(u,2 2/n)/n)l l反映样本均值与总体真值间的平均离散反映样本均值与总体真值间的平均离散程度程度l l样本数越大,样本均值的离散程度越小,样本数越大,样本均值的离散程度越小,对真值的估计越准确对真值的估计越准确 1-1-1414计算描述统计量计算描述统计量基本操作步骤基本操作步骤(1)(1)菜单选项菜单选项:Analyze-Descriptive SAnalyze-Descriptive Statisticstatist
9、ics-DescripiveDescripive(2)(2)选择将参加计算的选择将参加计算的数值型数值型数值型数值型变量名到变量名到V Variablesariables框。框。仅适用于仅适用于数值型数值型数值型数值型变量变量分析比较男生和女生的学习成绩分析比较男生和女生的学习成绩l l比较集中趋势比较集中趋势l l比较离散趋势比较离散趋势l l比较偏斜程度比较偏斜程度l l比较陡峭程度比较陡峭程度l l实现方式:数据拆分实现方式:数据拆分1-1-1515其他功能n n数据标准化处理数据标准化处理l l新变量的均值为新变量的均值为0,0,标准差为标准差为1;1;l l小于小于0 0表示在平均水
10、平下表示在平均水平下,大于大于0 0反之反之.l l正态分布的数据标准化后呈标准正态分布(正态分布的数据标准化后呈标准正态分布(68%68%,95%95%,99%99%)l lsave standardized values as variablessave standardized values as variables选项选项l l将变量作标准化后将变量作标准化后,结果存入名为结果存入名为“Z+“Z+原变量名原变量名”的新变量中的新变量中.n n数据标准化处理应用举例数据标准化处理应用举例l l快速找到移动话费出众的客户快速找到移动话费出众的客户l l网通集团企业效益评价网通集团企业效益评
11、价计算描述统计量计算描述统计量1-1-1616探索性描述分析探索性描述分析目的目的:在未知数据分布特点情况下在未知数据分布特点情况下,通过计算详尽描述统计量通过计算详尽描述统计量,辅助全面的统计图辅助全面的统计图,认识数据分布。认识数据分布。基本操作步骤基本操作步骤(1)(1)菜单选项菜单选项:analyze-descriptive analyze-descriptive statistics-statistics-ExploreExplore(2)(2)选择将参加计算的选择将参加计算的数值型数值型数值型数值型变量名到变量名到Dependent listDependent list框框(3)(
12、3)进行分组描述分析时,将分组变量选入进行分组描述分析时,将分组变量选入Fact listFact list框框描述统计量:描述统计量:MM统计量:集中趋势的估计值,不受极端值影响。用于判断统计量:集中趋势的估计值,不受极端值影响。用于判断有无异常值。有无异常值。1-1-1717探索性描述分析探索性描述分析相关图形n n箱线图箱线图n n茎叶图茎叶图n n直方图直方图n n正态分布图:检验变量是否符合正态分布正态分布图:检验变量是否符合正态分布n n方差齐性检验:各组离散程度是否相同方差齐性检验:各组离散程度是否相同l lH0H0:方差相等:方差相等举例:两班学生成绩分布情况,离散程度是否相同
13、。购买购买数量数量已婚者已婚者单单身者身者多3152少6948列总计100100个案数700300购买购买数量数量男性男性女性女性已婚者已婚者单单身者身者已婚者已婚者单单身者身者多35402560少65607540列总计100100100100个案数400120300180购买购买数量数量全部全部样样本本多37.3少62.7列总计100个案数1000购买流行服装 1-1-1919交叉分组下的频数分析交叉分组下的频数分析针对定类数据和定序数据的频数分析(用于定类用于定类定序数据分析有定序数据分析有custom tablelogisticcustom tablelogisticloglinearl
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四 基本 统计分析
限制150内