《管理统计学》马庆国著-课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《《管理统计学》马庆国著-课件.ppt》由会员分享,可在线阅读,更多相关《《管理统计学》马庆国著-课件.ppt(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、信息在被操纵或处理后并没有超出其原有的格式信息在被操纵或处理后并没有超出其原有的格式 保留了数据的原值保留了数据的原值 ,并按数值的升序或降序显示数据。并按数值的升序或降序显示数据。 易观察到:易观察到: 数据集中包含最大观察值和最小观察值数据集中包含最大观察值和最小观察值 确认在某个数据集中哪些数组具有相同的值确认在某个数据集中哪些数组具有相同的值 很容易发现各个值之间的差异很容易发现各个值之间的差异 3、样本数据结构的基本特征:频次与频率、样本数据结构的基本特征:频次与频率一、一些基本概念一、一些基本概念1、频次(频数)、频次(频数) 在有限的样本数据集合中,同样的数据值(样本值)在有限的
2、样本数据集合中,同样的数据值(样本值)出现的次数出现的次数 称为该样本值出现的频次称为该样本值出现的频次。2、频率、频率 该样本值出现的频次该样本值出现的频次 / 该数据集合的数据总数。该数据集合的数据总数。常用表示方法:常用表示方法: (1)表)表 ; (2)饼图;)饼图; (3)条形图;)条形图;二、样本数据集合的基本特征的延伸:累积频率二、样本数据集合的基本特征的延伸:累积频率 当样本数据的测度在顺次级以上时,把样本值小于等于当样本数据的测度在顺次级以上时,把样本值小于等于某个样本数据某个样本数据xi的频率值累加起来,就得到的频率值累加起来,就得到“小于等于小于等于xi”的累积频率。的累
3、积频率。注:名义级的样本数据集合,不存在累积频率问题。注:名义级的样本数据集合,不存在累积频率问题。表示法同上。表示法同上。将数据值分成几组将数据值分成几组 显示各组中有多少数值显示各组中有多少数值很容易发现数据的图形特点很容易发现数据的图形特点 无法保留原始数据的值无法保留原始数据的值 某个变量所有可能值的集合某个变量所有可能值的集合 显示了变量的图形特点显示了变量的图形特点 分布分布 P当数据集为小型时,数据之间的变化特点很容易观察出当数据集为小型时,数据之间的变化特点很容易观察出来来 P随着数据集变为中型或大型,变量的特性一般表现得越随着数据集变为中型或大型,变量的特性一般表现得越来越不
4、明显来越不明显 频数分布的类别频数分布的类别 频数频数 每一组包含的观察值数目每一组包含的观察值数目 组组 组限组限 每一组的上限和下限每一组的上限和下限 组宽组宽 上限和下限之间的间距上限和下限之间的间距 如何将数据转换成表格如何将数据转换成表格 ?哪些重要或必要的信息应当包括在内哪些重要或必要的信息应当包括在内 ? 确定确定 “组数组数”和和“组宽组宽 ” 频数分布一般包括与每组有关的频数、累积频数、相对频数分布一般包括与每组有关的频数、累积频数、相对频数和相对累积频数频数和相对累积频数显示每组范围内或其下有多少观察值显示每组范围内或其下有多少观察值 相对频数描述每组范围内观察值所占的百分
5、比,相对频数描述每组范围内观察值所占的百分比,即每组的频数除以观察值的总数目即每组的频数除以观察值的总数目 显示每组范围内或其下观察值所占的百分比显示每组范围内或其下观察值所占的百分比 对于定性变量而言对于定性变量而言 -常常根据变量结果的种类来选择组常常根据变量结果的种类来选择组 例如,为了研究本班例如,为了研究本班100名学生的性别名学生的性别 - 频数 累积频数 男性 60 60 女性 40 100 100 对于定量变量而言对于定量变量而言 -选择选择“组数组数” 和和“组宽组宽 ”是主要问题是主要问题应当遵循哪些基本原则来确定组应当遵循哪些基本原则来确定组 -1.各个组之间必须是各个组
6、之间必须是“相互排斥相互排斥”的的 2.各个组必须将各个组必须将“所有数据均包括在内所有数据均包括在内” 3.组数组数K 的经验法则的经验法则 2K n ,此处此处n代表观察值的总数目代表观察值的总数目4. 各组之间的宽度最好相等,但这并不是必要条件。各组之间的宽度最好相等,但这并不是必要条件。当组宽相等时,当组宽相等时, W nW 最小观察值最大观察值 5.应当尽量避免开口组应当尽量避免开口组 6.组宽最好是整数组宽最好是整数 例如例如,为了研究某班为了研究某班100名学生的身高名学生的身高 -我们确定将整个数据分成我们确定将整个数据分成5组,每组宽度相等,组,每组宽度相等,W = 10厘米
7、厘米 身高 (厘米) 频数 累积频数 相对频数 相对累积频数 140 150 6 6 0.06 0.06 150 160 23 29 0.23 0.29 160 170 36 65 0.36 0.65 170 180 28 93 0.28 0.93 180 190 7 100 0.07 1.00 100 1.00 1. 一张整理有序的表格可以使数据中隐藏的信息清楚地表现出一张整理有序的表格可以使数据中隐藏的信息清楚地表现出 来来2. 有助于采用图形方式来汇总数据有助于采用图形方式来汇总数据 3数据集表格不具有唯一性数据集表格不具有唯一性以下数据表示一个当地咖啡馆进行的以下数据表示一个当地咖啡馆
8、进行的30笔交易笔交易 -确定确定“组数组数” 和和“组宽组宽 ”样本大小样本大小 n =3025 = 32 305 组组最小观察值最小观察值 = 14,最大观察值最大观察值 = 83最好采用最好采用“整数整数” W = 15 组数组数 组宽组宽 8 .1351483 组 别 频 数 累 积 频 数 相 对 频 数 相对累积频数 10 25 4 4 133. 0304 0.133 25 40 6 4+6=10 200. 0306 0.333 40 55 8 10+8=18 267. 0308 0.600 55 70 7 25 233. 0307 0.833 70 85 5 30 167. 03
9、05 1.000 30 1.000 数据必须按照升序排列数据必须按照升序排列 为了构造图形,我们将数值的第一个数字作为茎为了构造图形,我们将数值的第一个数字作为茎 茎叶排列使我们可以通过图形来了解数据的分布茎叶排列使我们可以通过图形来了解数据的分布 例如例如,我们想将我们想将12个数据转换成一张茎叶图形个数据转换成一张茎叶图形 : 4.4 3.6 4.4 3.7 7.6 3.9 3.6 3.5 3.0 4.5 3.8 2.22| 23| 0 5 6 6 7 8 94| 4 4 55|6|7| 6 三种最常使用的图形类型三种最常使用的图形类型 - 直方图直方图 频数多边形频数多边形 分布曲线分布
10、曲线 在构造图形之前,需要用频数分布来显示数据在构造图形之前,需要用频数分布来显示数据 应当将数据转换成频数分布表应当将数据转换成频数分布表 水平轴代表变量的数值,核对符号代表每一组的中点水平轴代表变量的数值,核对符号代表每一组的中点 垂直轴代表计数频数或百分比频数垂直轴代表计数频数或百分比频数 每个条形图的高度与每一组的频数或百分比相对应每个条形图的高度与每一组的频数或百分比相对应 每个条形图的宽度与每一组的宽度相对应每个条形图的宽度与每一组的宽度相对应 例如,我们在本单元中想通过绘制直方图来表示例如,我们在本单元中想通过绘制直方图来表示100名学生的身名学生的身高分布高分布 身高身高185
11、.0175.0165.0155.0145.0计数频数计数频数403020100身高身高190.0180.0170.0160.0150.0计数频数计数频数403020100200.0140.0用线段将各组中点和频数(或相对频数)的交叉点连接起来,用线段将各组中点和频数(或相对频数)的交叉点连接起来,就可以得到频数多边形图形就可以得到频数多边形图形 身高身高.190.0180.0170.0160.0150.0累积计数频数累积计数频数806040200140.0100图形显示了每一组的累积频图形显示了每一组的累积频数或相对累积频数数或相对累积频数 它可以用它可以用“小于小于”或或“大于大于”来来表示
12、表示 定性变量常常用非数值刻度来测量定性变量常常用非数值刻度来测量 对这些变量可以进行分类对这些变量可以进行分类 可以采用两种最为常见的图形来描述定性变量的分布可以采用两种最为常见的图形来描述定性变量的分布 饼图饼图 条形图条形图 饼图的圆圈代表了所有观察值的集合饼图的圆圈代表了所有观察值的集合 根据定性变量的类型数目将饼图分成几个部分根据定性变量的类型数目将饼图分成几个部分 饼图每一部分的大小与每一类型的相对频数成正比饼图每一部分的大小与每一类型的相对频数成正比 例如,我们可以用饼图来描述某班例如,我们可以用饼图来描述某班100名学生的性别分布状名学生的性别分布状况况 男性男性60%女性女性
13、40% 对于定性变量而言,条形图表示每一类型的百分比或对于定性变量而言,条形图表示每一类型的百分比或 计数频数计数频数 每个条形图的高度代表每一类型的百分比或比例每个条形图的高度代表每一类型的百分比或比例 条形图的宽度没有意义,所有类型的宽度均相同条形图的宽度没有意义,所有类型的宽度均相同 例如,我们用条形图来显示某班例如,我们用条形图来显示某班100名学生的性别分布状况名学生的性别分布状况020406080男性男性女性女性 饼图饼图 :图形图形 饼图饼图 对各组情形进行总结对各组情形进行总结 条形图条形图 :图形图形 条形图条形图 对各组情形进行总结对各组情形进行总结 直方图直方图 :图形图
14、形 直方图直方图 选择关心的变量选择关心的变量 茎叶图形茎叶图形 :分析分析 描述统计学描述统计学 寻找寻找 选择绘图选项选择绘图选项 所有观察值所有观察值 的平均值的平均值均值均值 所有观察值中位于最中心位置的那个值所有观察值中位于最中心位置的那个值 中位数中位数 出现最频繁的数据值出现最频繁的数据值 众数众数 均值均值 -总体均值总体均值 N总体大小总体中所有观察值之和Nx样本均值样本均值 n样本大小样本中所有观察值之和nxxKim 测验的平均成绩等于测验的平均成绩等于 在此我们可以看到,在汇总在此我们可以看到,在汇总Kim的测验成绩时,均值并不能发挥的测验成绩时,均值并不能发挥很好的作用
15、。在大多数情况下,很好的作用。在大多数情况下,Kim的测验成绩低于的测验成绩低于30分,她只分,她只在一次测验中意外地获得了在一次测验中意外地获得了98的高分,因此她的平均成绩被提高的高分,因此她的平均成绩被提高到到35分。分。 355261925987 Kim是一名中等学校的学生,她上星期进行了是一名中等学校的学生,她上星期进行了5次测验,成次测验,成绩分别如下绩分别如下 7, 98, 25, 19, 和和26均值对极值表现得非常敏感均值对极值表现得非常敏感 如果数据中存在极值(或者说数据分布有所偏斜),那么如果数据中存在极值(或者说数据分布有所偏斜),那么均值就不能很好地测度集中趋势均值就
16、不能很好地测度集中趋势 中位数中位数 (Md) -1.将将n个观察值按升序或降序排列个观察值按升序或降序排列 2.如果观察值个数是奇数,则中位数就是位于最中心位置的那个观如果观察值个数是奇数,则中位数就是位于最中心位置的那个观察值,即数据集中的第察值,即数据集中的第 个观察值个观察值 3.如果观察值个数是偶数,则中位数就是位于正中心两个观察值的如果观察值个数是偶数,则中位数就是位于正中心两个观察值的平均值,即数据集中的第平均值,即数据集中的第 个和第个和第 个观察值的平均值个观察值的平均值 thn)21( thn)2(thn)12( 举例举例: 有有6名工人组成一个样本,请找出他们每周工资的中
17、位名工人组成一个样本,请找出他们每周工资的中位数数 151179163142180195按升序重新排列每周的工资按升序重新排列每周的工资 142151163179180195 最中心位置的最中心位置的两个两个数值数值 求这两个数值的平均数求这两个数值的平均数 中位数中位数 = 1712179163 Kim的5次测验成绩 又如何呢?Kim成绩的中位数为成绩的中位数为25看来中位数能更好地测度看来中位数能更好地测度Kim测验成绩的中心位置测验成绩的中心位置 -中位数不受中位数不受“极值极值”的影响的影响 众数众数 (Mo) -并不经常用众数来测度中心位置并不经常用众数来测度中心位置适用于定性变量适
18、用于定性变量 众数不具有唯一性众数不具有唯一性 举例举例: 有有6名工人组成一个样本,请找出他们每周工资的众数名工人组成一个样本,请找出他们每周工资的众数 151 179 163 142 180 195 不存在不存在 众数众数 151 180 163 142 180 195 180 142 180 163 142 180 195 142 和和180 (双峰双峰 )对对两个旅行团的小孩年龄进行了数据调查,以下是调两个旅行团的小孩年龄进行了数据调查,以下是调查结果:查结果: -年龄年龄 : 14, 17, 11, 10, 11, 14, 9, 12, 8, 10, 9均值均值 36.11119.1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 管理统计学 管理 统计学 马庆国著 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内