《管理统计学》马庆国著_课件2.ppt





《《管理统计学》马庆国著_课件2.ppt》由会员分享,可在线阅读,更多相关《《管理统计学》马庆国著_课件2.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 样本数据特征的样本数据特征的 初步分析初步分析 一、整理样本数据 信息在被操纵或处理后并没有超出其原有的格式信息在被操纵或处理后并没有超出其原有的格式 原始数据原始数据原始数据原始数据 -两种整理原始数据的基本方法两种整理原始数据的基本方法两种整理原始数据的基本方法两种整理原始数据的基本方法 数据阵列数据阵列数据阵列数据阵列 频数分布频数分布频数分布频数分布 2、整理数据-数据阵列 保留了数据的原值保留了数据的原值,并按数值的升序或降序显示数据。并按数值的升序或降序显示数据。易观察到:易观察到:数据集中包含最大观察值和最小观察值数据集中包含最大观察值和最小观察值 确认在某个数据集
2、中哪些数组具有相同的值确认在某个数据集中哪些数组具有相同的值 很容易发现各个值之间的差异很容易发现各个值之间的差异 3、样本数据结构的基本特征:频次与频率、样本数据结构的基本特征:频次与频率一、一些基本概念一、一些基本概念1、频次(频数)、频次(频数)在有限的样本数据集合中,同样的数据值(样本值)在有限的样本数据集合中,同样的数据值(样本值)出现的次数出现的次数 称为该样本值出现的频次称为该样本值出现的频次。2、频率频率 该样本值出现的频次该样本值出现的频次/该数据集合的数据总数。该数据集合的数据总数。常用表示方法:常用表示方法:(1)表)表 ;(2)饼图;)饼图;(3)条形图;)条形图;二、
3、样本数据集合的基本特征的延伸:累积频率二、样本数据集合的基本特征的延伸:累积频率 当样本数据的测度在顺次级以上时,把样本值小于等于当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据某个样本数据xi的的频率值累加起来,就得到频率值累加起来,就得到“小于等于小于等于xi”的累积频率。的累积频率。注:名义级的样本数据集合,不存在累积频率问题。注:名义级的样本数据集合,不存在累积频率问题。表示法同上。表示法同上。整理数据-频数分布 将数据值分成几组将数据值分成几组 显示各组中有多少数值显示各组中有多少数值很容易发现数据的图形特点很容易发现数据的图形特点 无法保留原始数据的值无法保留原始数据的
4、值 频数分布 定义定义定义定义某个变量所有可能值的集合某个变量所有可能值的集合 显示了变量的图形特点显示了变量的图形特点 分布分布 P当数据集为小型时,数据之间的变化特点很容易观察出来当数据集为小型时,数据之间的变化特点很容易观察出来 P随着数据集变为中型或大型,变量的特性一般表现得越来随着数据集变为中型或大型,变量的特性一般表现得越来越不明显越不明显 定定定定 义义义义频数分布的类别频数分布的类别 频数分布 频数频数 每一组包含的观察值数目每一组包含的观察值数目 组组 组限组限 每一组的上限和下限每一组的上限和下限 组宽组宽 上限和下限之间的间距上限和下限之间的间距 如何将数据转换成表格如何
5、将数据转换成表格?哪些重要或必要的信息应当包括在内哪些重要或必要的信息应当包括在内?确定确定“组数组数”和和“组宽组宽”频数分布一般包括与每组有关的频数、累积频数、相对频数分布一般包括与每组有关的频数、累积频数、相对频数和相对累积频数频数和相对累积频数频数分布 频数分布 累积频数累积频数累积频数累积频数 相对相对相对相对频数频数频数频数 相对累积频数相对累积频数相对累积频数相对累积频数 显示每组范围内或其下有多少观察值显示每组范围内或其下有多少观察值 相对频数描述每组范围内观察值所占的百分比,相对频数描述每组范围内观察值所占的百分比,即每组的频数除以观察值的总数目即每组的频数除以观察值的总数目
6、 显示每组范围内或其下观察值所占的百分比显示每组范围内或其下观察值所占的百分比 对于定性变量而言对于定性变量而言-常常根据变量结果的种类来选择组常常根据变量结果的种类来选择组 例如,为了研究本班例如,为了研究本班100名学生的性别名学生的性别 -频数分布 对于定量变量而言对于定量变量而言-选择选择“组数组数”和和“组宽组宽”是主要问题是主要问题频数分布 应当遵循哪些基本原则来确定组应当遵循哪些基本原则来确定组-1.各个组之间必须是各个组之间必须是“相互排斥相互排斥”的的 2.各个组必须将各个组必须将“所有数据均包括在内所有数据均包括在内”3.组数组数K 的经验法则的经验法则 2K n,此处此处
7、n代表观察值的总数目代表观察值的总数目4.各组之间的宽度最好相等,但这并不是必要条件。各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时,当组宽相等时,W 频数分布 5.应当尽量避免开口组应当尽量避免开口组 6.组宽最好是整数组宽最好是整数 例如例如,为了研究某班为了研究某班100名学生的身高名学生的身高-我们确定将整个数据分成我们确定将整个数据分成5组,每组宽度相等,组,每组宽度相等,W=10厘米厘米频数分布 1.一张整理有序的表格可以使数据中隐藏的信息清楚地表现出一张整理有序的表格可以使数据中隐藏的信息清楚地表现出 来来2.有助于采用图形方式来汇总数据有助于采用图形方式来汇总数据 3
8、数据集表格不具有唯一性数据集表格不具有唯一性频数分布 频数分布 以下数据表示一个当地咖啡馆进行的以下数据表示一个当地咖啡馆进行的30笔交易笔交易 举例举例举例举例 141464641515343475752424818167671919252548485757696962624141464635352727727264644848515177776464515150502626424283833838频数分布 首先首先首先首先-确定确定“组数组数”和和“组宽组宽”样本大小样本大小 n=3025=32 305 组组最小观察值最小观察值=14,最大观察值最大观察值=83最好采用最好采用“整数整数”
9、W=15 组组数数 组宽组宽 频数分布 茎叶图形 数据必须按照升序排列数据必须按照升序排列 为了构造图形,我们将数值的第一个数字作为茎为了构造图形,我们将数值的第一个数字作为茎 茎叶排列使我们可以通过图形来了解数据的分布茎叶排列使我们可以通过图形来了解数据的分布 茎叶图形 例如例如,我们想将我们想将12个数据转换成一张茎叶图形个数据转换成一张茎叶图形:4.4 3.6 4.4 3.7 7.6 3.9 3.6 3.5 3.0 4.5 3.8 2.22|23|0 5 6 6 7 8 94|4 4 55|6|7|6茎叶图形 用直观方式显示定量变量 三种最常使用的图形类型三种最常使用的图形类型 -直方图
10、直方图 频数多边形频数多边形 分布曲线分布曲线 在构造图形之前,需要用频数分布来显示数据在构造图形之前,需要用频数分布来显示数据用直观方式显示定量变量-直方图 应当将数据转换成频数分布表应当将数据转换成频数分布表 水平轴代表变量的数值,核对符号代表每一组的中点水平轴代表变量的数值,核对符号代表每一组的中点 垂直轴代表计数频数或百分比频数垂直轴代表计数频数或百分比频数 每个条形图的高度与每一组的频数或百分比相对应每个条形图的高度与每一组的频数或百分比相对应 每个条形图的宽度与每一组的宽度相对应每个条形图的宽度与每一组的宽度相对应 用直观方式显示定量变量-直方图例如,我们在本单元中想通过绘制直方图
11、来表示例如,我们在本单元中想通过绘制直方图来表示100名学生的身名学生的身高分布高分布 身高身高185.0175.0165.0155.0145.0计数频数计数频数403020100用直观方式显示定量变量-频数多边形 身高身高190.0180.0170.0160.0150.0计数频数计数频数403020100200.0140.0用线段将各组中点和频数(或相对频数)的交叉点连接起来,用线段将各组中点和频数(或相对频数)的交叉点连接起来,就可以得到频数多边形图形就可以得到频数多边形图形 身高身高.190.0180.0170.0160.0150.0累积计数频数累积计数频数806040200140.01
12、00用直观方式显示定量-分布曲线 图形显示了每一组的累积频图形显示了每一组的累积频数或相对累积频数数或相对累积频数 它可以用它可以用“小于小于”或或“大于大于”来来表示表示 定性变量定性变量常常用非数值刻度来测量常常用非数值刻度来测量 对这些变量可以进行分类对这些变量可以进行分类 可以采用两种最为常见的图形来描述定性变量的分布可以采用两种最为常见的图形来描述定性变量的分布 饼图饼图 条形图条形图 用直观方式显示定性变量 饼图饼图的圆圈代表了所有观察值的集合的圆圈代表了所有观察值的集合 根据定性变量的类型数目将饼图分成几个部分根据定性变量的类型数目将饼图分成几个部分 饼图每一部分的大小与每一类型
13、的相对频数成正比饼图每一部分的大小与每一类型的相对频数成正比 用直观方式显示定性变量-饼图 例如,我们可以用饼图来描述某班例如,我们可以用饼图来描述某班100名学生的性别分布状名学生的性别分布状况况 男性男性60%女性女性40%用直观方式显示定性变量-饼图 对于定性变量而言,条形图表示每一类型的百分比或对于定性变量而言,条形图表示每一类型的百分比或 计数频数计数频数 每个条形图的高度代表每一类型的百分比或比例每个条形图的高度代表每一类型的百分比或比例 条形图的宽度没有意义,所有类型的宽度均相同条形图的宽度没有意义,所有类型的宽度均相同 用直观方式显示定性变量-条形图 例如,我们用条形图来显示某
14、班例如,我们用条形图来显示某班100名学生的性别分布状况名学生的性别分布状况020406080男性男性女性女性用直观方式显示定性变量-条形图SPSS统计软件给我们的工作带来了方便 饼图饼图:图形图形 饼图饼图 对各组情形进行总结对各组情形进行总结 条形图条形图:图形图形 条形图条形图 对各组情形进行总结对各组情形进行总结 SPSS统计软件给我们的工作带来了方便 直方图直方图:图形图形 直方图直方图 选择关心的变量选择关心的变量 茎叶图形茎叶图形:分析分析 描述统计学描述统计学 寻找寻找 选择绘图选项选择绘图选项 集中趋势测度-未分组数据 定义定义定义定义所有观察值所有观察值 的平均值的平均值均
15、值均值 所有观察值中位于最中心位置的那个值所有观察值中位于最中心位置的那个值 中位数中位数 出现最频繁的数据值出现最频繁的数据值 众数众数 均值均值 -总体均值总体均值 样本均值样本均值 集中趋势测度-未分组数据Kim 测验的平均成绩等于测验的平均成绩等于 在此我们可以看到,在汇总在此我们可以看到,在汇总Kim的测验成绩时,均值并不能发挥很的测验成绩时,均值并不能发挥很好的作用。在大多数情况下,好的作用。在大多数情况下,Kim的测验成绩低于的测验成绩低于30分,她只在一分,她只在一次测验中意外地获得了次测验中意外地获得了98的高分,因此她的平均成绩被提高到的高分,因此她的平均成绩被提高到35分
16、。分。集中趋势测度-未分组数据Kim是一名中等学校的学生,她上星期进行了是一名中等学校的学生,她上星期进行了5次测验,成次测验,成绩分别如下绩分别如下 7,98,25,19,和和26均值对极值表现得非常敏感均值对极值表现得非常敏感 如果数据中存在极值(或者说数据分布有所偏斜),那么如果数据中存在极值(或者说数据分布有所偏斜),那么均值就不能很好地测度集中趋势均值就不能很好地测度集中趋势 集中趋势测度-未分组数据 中位数中位数 (Md)-1.将将n个观察值按升序或降序排列个观察值按升序或降序排列 2.如果观察值个数是奇数,则中位数就是位于最中心位置的那个观如果观察值个数是奇数,则中位数就是位于最
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理统计学 管理 统计学 马庆国著 课件

限制150内