第五章基本统计分析优秀课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第五章基本统计分析优秀课件.ppt》由会员分享,可在线阅读,更多相关《第五章基本统计分析优秀课件.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章基本统计分析第1页,本讲稿共49页SPSS的基本统计分析频数分析频数分析-对应表格法对应表格法计算描述统计量计算描述统计量-对应数值法对应数值法探索性描述分析探索性描述分析-结合结合交叉分组下的频数分析交叉分组下的频数分析多选项分析多选项分析统计图统计图-对应图形法对应图形法第2页,本讲稿共49页频数分析v目的粗略把握变量的总体分布状况。例:对某个问题的总体看法,如新业务的使用愿望、教学效果等 对某事物的客观描述,如通话的漫游类型、大客户的行业分布v采用的方法制作频数分布表:包括计算 频数、累计频数、百分比、累计百分比绘制统计图形:条形图(品质数据)、饼图、直方图(数量数据)第3页,本讲
2、稿共49页频数分析v基本操作步骤(1)菜单选项:analyze-descriptive statistics-frequencies(2)选择几个待分析的变量到variables框.(3)chart选项,选择所需要的图形第4页,本讲稿共49页频数分析v应用举例移动通话的漫游类型分析特点:定类数据使用频数、百分比、总数(不可缺少的)不使用频数表中给出的累计频数和累计百分比移动通话时间分析、移动客户话费分析特点:数量数据除使用频数、百分比、总数外,还可以充分使用累计频数和累计百分比第5页,本讲稿共49页频数分析v数据中存在缺失值v使用有效百分比(分母为有效样本数)v例:学生成绩得优率、得良率fre
3、quencies-format频数分布表输出按变量值、频数升序、降序输出第6页,本讲稿共49页频数分析v频数分析中的其他分析计算中位数、分位数:适用于定序、定距数据v数据按升序排序后,找到若干个分位点上的变量值vquartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)v cut points for n equal groups:n等份vpercentile:自定义百分位点计算众数:适用于定类数据(但必须是数值型)第7页,本讲稿共49页频数分析v频数分析中的其他分析分位数的应用 v从一个侧面比较两组样本数据的集中趋势例:(QL=50,QU=80)和 (QL=70,QU=
4、75)的比较v在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和 (QL=70,QU=75)的比较分位数、中位数、众数的应用举例不同类型的移动客户月话费比较(数据拆分)利用分位数(不显示频数分布表)第8页,本讲稿共49页计算描述统计量v目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。v基本方法计算基本描述统计量第9页,本讲稿共49页计算描述统计量v描述集中趋势的统计量均值(mean):表示某变量所有变量值集中趋势或平均水平的统计量。v适用于定距数据。v特点:利用了全部数据,易受极端值的影响。v描述离散程度的统
5、计量标准差(standard deviation-Std Dev):表示某变量的所有变量值离散趋势的统计量。vSPSS中计算的是样本标准差。方差(variance):标准差的平方。vSPSS中计算的是样本方差。极差(range):最大值(minimum)-最小值(minimum)第10页,本讲稿共49页计算描述统计量v描述对称程度的统计量 偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量.v偏度为0表示对称;v大于0表示正偏差大(右偏),众数比均值小,极值大于均值;v小于0表示负偏差大(左偏)。第11页,本讲稿共49页计算描述统计量v描述陡峭程度的统计量峰度(ku
6、rtosis):描述某变量所有变量值分布形态陡缓程度的统计量。v峭度为0表示与正态分布峭度相同。v大于0表示比正态分布陡,尖峰。v小于0表示比正态分布缓;平峰。第12页,本讲稿共49页计算描述统计量v其他统计量 均值标准误差(S.E means)v中心极限定理认为:样本均值N(u,2/n)v反映样本均值与总体真值间的平均离散程度v样本数越大,样本均值的离散程度越小,对真值的估计越准确 第13页,本讲稿共49页计算描述统计量v基本操作步骤(1)菜单选项:analyze-descriptive statistics-descripive(2)选择将参加计算的数值型数值型变量名到variables框
7、。仅适用于数值型数值型变量v分析比较男生和女生的学习成绩v比较集中趋势v比较离散趋势v比较偏斜程度v比较陡峭程度v实现方式:数据拆分第14页,本讲稿共49页v其他功能数据标准化处理v新变量的均值为0,标准差为1;v小于0表示在平均水平下,大于0反之.v正态分布的数据标准化后呈标准正态分布(68%,95%,99%)vsave standardized values as variables选项v将变量作标准化后,结果存入名为“Z+原变量名”的新变量中.数据标准化处理应用举例v快速找到移动话费出众的客户v网通集团企业效益评价计算描述统计量第15页,本讲稿共49页探索性描述分析v目的:在未知数据分布
8、特点情况下,通过计算详尽描述统计量,辅助全面的统计图,认识数据分布。v基本操作步骤(1)菜单选项:analyze-descriptive statistics-Explore(2)选择将参加计算的数值型数值型变量名到Dependent list框。(3)进行分组描述分析时,将分组变量选入Fact list框v描述统计量:vM统计量:集中趋势的估计值,不受极端值影响。用于判断有无异常值。第16页,本讲稿共49页探索性描述分析v相关图形箱线图茎叶图直方图正态分布图:检验变量是否符合正态分布方差齐性检验:各组离散程度是否相同vH0:方差相等v举例:两班学生成绩分布情况,离散程度是否相同。第17页,本
9、讲稿共49页交叉分组下的频数分析v目的 通过了解不同变量在不同水平下的数据分布情况,判断水平对变量是否有影响v例:女生的学习成绩比男生好吗?(两变量)v 不同专业的女生学习成绩都比男生好吗?(三变量)v分析的主要步骤产生交叉列联表分析列联表中变量间的关系v针对定类数据和定序数据的频数分析第18页,本讲稿共49页产生交叉列联表什么是列联表多个变量在不同取值下的数据分布频数表列变量行变量工商管理控制变量频数性别成绩优良差男女第19页,本讲稿共49页产生交叉列联表v基本操作步骤(1)菜单选项:analyze-descriptive statistics-crosstabs(2)选择一个变量作为行变量
10、到row框.(3)选择一个变量作为列变量到column框.(4)可选一个或多个变量作为控制变量到layer框.(5)是否显示各分组的条图(display clustered bar charts)第20页,本讲稿共49页产生交叉列联表v定距数据可做适当分组后再产生列联表v仅利用频数,信息利用不充分v进一步计算 cells选项:选择在频数分析表中输出各种百分比.vrow:行百分比(Row pct);vcolumn:列百分比(Col pct);vtotal:总百分比(Tot pct);第21页,本讲稿共49页分析列联表中变量间的关系v目的:通过列联表分析,检验行列变量之间是否独立。v方法:卡方检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 基本 统计分析 优秀 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内