第4章数据分布优秀课件.ppt
《第4章数据分布优秀课件.ppt》由会员分享,可在线阅读,更多相关《第4章数据分布优秀课件.ppt(90页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4 章数据分布第1 页,本讲稿共90 页第 4 章 数据分布特征的测度4.1 集中趋势的测度 4.2 离散程度的测度4.3 偏态与峰度的测度第2 页,本讲稿共90 页学习目标1.集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法6.用Excel 计算描述统计量并进行分析第3 页,本讲稿共90 页数据分布的特征集中趋势 集中趋势(位置 位置)偏态和峰态 偏态和峰态(形状)(形状)离中趋势 离中趋势(分散程度 分散程度)第4 页,本讲稿共90 页数据分布特征的测度数据特征的测度分布的形状 集中趋
2、势 离散程度众 众众 数 数数中位数 中位数中位数均 均均 值 值值离散系数 离散系数离散系数方差和标准差 方差和标准差方差和标准差峰 峰峰 态 态态四分位差 四分位差四分位差异众比率 异众比率异众比率偏 偏偏 态 态态第5 页,本讲稿共90 页4.1 集中趋势的测度一.分类数据:众数二.顺序数据:中位数和分位数三.数值型数据:均值四.众数、中位数和均值的比较第6 页,本讲稿共90 页分类数据:众数第7 页,本讲稿共90 页众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和
3、数值型数据第8 页,本讲稿共90 页众数(不惟一性)n 无众数原始数据:10 5 9 12 6 8一个众数原始数据原始数据:6 5 9 8 9 8 5 5多于一个众数原始数据原始数据:25:25 28 2828 28 36 36 42 4242 42第9 页,本讲稿共90 页分类数据的众数(例题分析)不同品牌饮料的频数分布 饮料品牌 频数 比例百分比(%)可口可乐 旭日升冰茶 百事可乐 汇源果汁 露露1511 9 6 90.300.220.180.120.183022181218合计50 1 100解 解:这 这 里 里 的 的 变 变 量 量 为 为“饮 饮 料 料品 品 牌 牌”,这 这
4、是 是 个 个 分 分 类 类 变 变 量 量,不 不 同 同 类 类 型 型 的 的 饮 饮 料 料 就 就 是 是 变 变 量 量值 值 所 所 调 调 查 查 的 的50 50 人 人 中 中,购 购 买 买可 可 口 口 可 可 乐 乐 的 的 人 人 数 数 最 最 多 多,为 为15 15 人 人,占 占 总 总 被 被 调 调 查 查 人 人 数 数 的 的30%30%,因 因 此 此 众 众 数 数 为 为“可 可口可乐 口可乐”这一品牌,即 这一品牌,即 M Mo o可口可乐 可口可乐第10 页,本讲稿共90 页顺序数据的众数(例题分析)解 解:这 这 里 里 的 的 数 数
5、 据 据 为 为 顺 顺序 序 数 数 据 据。变 变 量 量 为 为“回 回答类别 答类别”甲 甲 城 城 市 市 中 中 对 对 住 住 房 房表 表 示 示 不 不 满 满 意 意 的 的 户 户 数 数 最 最多 多,为 为 108 108 户 户,因 因 此 此众 众 数 数 为 为“不 不 满 满 意 意”这 这一类别,即 一类别,即 M Mo o不满意 不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 836311510合计300 100.0第11 页,本讲稿共90 页n 1 一组数
6、据中出现频数最多的变量值称为()n A众数 B 中位数 C 四分位数 D 平均数n 2 下列关于众数的叙述中,不正确的是()n A 一组数据可能存在多个众数 B 众数主要适用于分类数据 n C 一组数据的众数是唯一的 D 众数不受极端值的影响n.链接 数据集中与离散 等距数列众数.shs第12 页,本讲稿共90 页顺序数据:中位数和分位数第13 页,本讲稿共90 页中位数(median)1.排序后处于中间位置上的值M Me e50%50%2.2.不受极端值的影响 不受极端值的影响3.3.主要用于顺序数据,也可用数值型数据,但不能用于分 主要用于顺序数据,也可用数值型数据,但不能用于分类数据 类
7、数据4.4.各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即第14 页,本讲稿共90 页中位数(位置的确定)原始数据:顺序数据:第15 页,本讲稿共90 页顺序数据的中位数(例题分析)解:解:中位数的位置为 中位数的位置为 300/2 300/2150 150 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一一组别中组别中 中位数为 中位数为 MMe=一般一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数 非常不满意 不满意 一般 满意 非常满意 24108 93 45 30 24132225270300合计300 第16 页,本
8、讲稿共90 页数值型数据的中位数(9 个数据的算例)n【例】9 个家庭的人均月收入数据(n 为奇数时)原始数据:1500 750 780 1080 850 960 2000 1250 1630排 序:750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9中位数 1080第17 页,本讲稿共90 页数值型数据的中位数(10个数据的算例)【例】:10 个家庭的人均月收入数据(n 为偶数时)排 序:660 750 780 850 960 1080 1250 1500 1630 2000位 置:1 2 3 4 5 6 7 8 9 10
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 优秀 课件
限制150内