统计学原理第四章幻灯片.ppt
《统计学原理第四章幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学原理第四章幻灯片.ppt(132页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学原理第四章统计学原理第四章第1页,共132页,编辑于2022年,星期二统 计 学 教 程第 4章 数 据 分 布 特 征 的 度 量 n4.1 集中趋势的度量 4.2.5 方差和标准差n 4.1.1 众数 4.2.6 离散系数n 4.1.2 中位数 4.2.7 标准化值n 4.1.3 均值n 4.1.4 调和平均数n 4.1.5 几何平均数 4.3 偏态和峰度的度量n 4.1.6 均值、众数和中位数的比较 4.3.1 偏态系数 n 4.1.7 均值、众数和中位数的比较 4.3.2 峰度系数n4.2 离散程度的度量n 4.2.1 异众比率n 4.2.3 取值范围n 4.2.4 平均差第2页
2、,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 原始数据经过分组整理所形成的频数分布,直观和概略地反映出数据分布的基本特征。频数分布属于对数据分布特征的初步描述,缺乏对数据分布特征的综合度量,若需要深入地表述数据分布特征的具体特征和内在联系,还应对数据分布特征进行综合性的度量。数据分布特征的度量包括三个方面的内容,一是数据分布的集集中中趋趋势势,反映总体中各个单位的数值水平向其聚集,或者集中的中心数值;二是数据分布的离离散散趋趋势势,反映总体中各个单位的数值水平偏离中心数值的综合程度;三是数据分布的偏偏态态和和峰峰度
3、度,反映各个总体单位的数值水平的分布形态是对称或偏倚,平坦或尖耸的具体数值。第3页,共132页,编辑于2022年,星期二4.1 集中趋势的度量集中趋势的度量第4页,共132页,编辑于2022年,星期二n 集中趋势(Central Tendency)是指一组数据所趋向的中心数值。对集中趋势的度量就是采用具体的统计方法和统计测度对这一中心数值的测量和计量,以一综合数值来表述数据所趋向的这一中心数值的一般水平。第5页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 4.1.1众数 众众数数(ModeMode)是是一一组组数数
4、据据中中频频数数最最大大的的变变量量值值,直直观观地地反反映映了了数数据据的的集集中中趋趋势。势。众数是度量定类数据定类数据集中趋势的测度,一般用 表示。例例4.1 4.1 某品牌运动服装专卖店一批新品球衣销售情况如下表 4.1 某专卖店新品球衣销售情况 件第6页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 4.1.1众数 众众数数(ModeMode)是是一一组组数数据据中中频频数数最最大大的的变变量量值值,直直观观地地反反映映了了数数据据的的集集中中趋趋势。势。众数是度量定类数据定类数据集中趋势的测度,一般用 表
5、示。例例4.1 4.1 某品牌运动服装专卖店一批新品球衣销售情况如下表 4.1 某专卖店新品球衣销售情况 件第7页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.2 4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的原始数据。要求要求 试计算计算该班35名学生统计学考试成绩的众数。解解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,8
6、9,90,91,91,92,96,98 第8页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.2 4.2 利用第三章中例3.1中某学期某班35名学生统计学考试成绩的原始数据。要求要求 试计算计算该班35名学生统计学考试成绩的众数。解解 将该原始数据排序之后,得到有序数据如下 52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82,83,84,84,84,84,86,87,87,88,89,89,90,91,91,92,96,98 84分在这35名学生的统计学
7、考试成绩的原始数据中出现了4次,属于出现次数最多的变量值,根据众数定义,可以确定众数为84分,即第9页,共132页,编辑于2022年,星期二2012-03-16(ZhouwuShangwuJDC)第10页,共132页,编辑于2022年,星期二2012-03-16(ZhouwuWanJDC)第11页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 利用已经分组的数值型数据计算众数的场合,需要运用插值公式来计算众数的近似数值。众数的插值公式有下限公式和上限公式。其下限公式从众数所在组的下限出发,有 (4.1)上限公式则从众
8、数所在组的上限出发,有 (4.2)第12页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第13页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第14页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第15页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第16页,共132页,编辑于2
9、022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第17页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 第18页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.3 4.3 表4.2为第三章中表3.7“某学期某班35名学生的统计学考试成绩”中的部分数据。根据表4.2的已经分组的数值型数据,计算该班35名学生的统计学考试成绩众数的近似数值。表4.2 某学期某班35名学生的统计学考试
10、成绩第19页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 通过上限公式或下限公式的计算众数所得到的计算结果是一致的。众数是一个通过数据中频数最大的数据的数值来反映集中趋势的测度,为一位位置置型型的代表数值,所以众数的取值不受极极端端数数值值的影响,也不受组距分组中开口组设置的影响。当数值型数据中含有极小值和极大值时,使用众数来度量数据的集中趋势,可以作为其它集中趋势测度的补充。众数是一个适用于最低层次的定定类类数数据据的测度,因此可以用于各种量表数据的集中趋势分析,有有效效使使用用众众数数的的前前提提是是数数据据的
11、的频频数数分分布布存存在在明明显显的的集集中中态势。态势。第20页,共132页,编辑于2022年,星期二众数n主要适合于作为分类数据的集中趋势测度值。也可运用于定序数据以及数值型数据。n可能不唯一。第21页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 4.1.2 中位数 中中位位数数(MedianMedian)是是位位于于有有序序数数据据正正中中间间位位置置上上的的变变量量值值,中中位位数数用用其其特特殊殊的的位位置置属属性性直直接接地地体体现现了了集集中中趋趋势势的的中中心心数数值值特特征征。中位数是度量定定序序
12、数数据据集中趋势的测度,一般用 表示。中位数也是一种位置型的代表数值,同时中位数还是一种顺序统计量,因此,计算中位数要求数值至少具备定序数据的性质。中位数一旦确定,就可以根据中位数的具体取值,将全部数据分成数量相等的两个部分,一半数据的数值小于或等于中位数;另一半数据的数值大于或等于中位数。由此可得出中位数的计算公式。当数据的个数为奇数时,有 (4.3)当数据的个数为偶数时,有 (4.4)第22页,共132页,编辑于2022年,星期二中位数的性质第23页,共132页,编辑于2022年,星期二n【课后作业】n证明:中位数的性质第24页,共132页,编辑于2022年,星期二n中位数是度量定序数据集
13、中趋势的测度,根据计量尺度的向上兼容性质,中位数也可以用于度量比它量表层次更高的数值型数据的集中趋势。但不能度量定类数据的集中趋势。第25页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.44.4 仍然采用第三章中例3.1 某学期某班35名学生的统计学考试成绩的原始数据。要求要求 试计算该班35名学生的统计学考试成绩的中位数。解解 将原始数据排序之后,得到以下有序数据52,56,62,64,65,69,70,74,75,75,76,78,78,79,79,81,82,82828282,83,84,84,84,
14、84,86,87,87,88,89,89,90,91,91,92,96,98 该组数据的个数为35,因此采用式(4.3)计算,排列在该组有序数据第18位上的变量值为82分,该班35名学生的统计学考试成绩的中位数为82分。即第26页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 利用已经分组的数值型数据计算中位数时,需要运用插值公式计算中位数的近似数值。中位数的插值公式也有下限公式和上限公式。其下限公式从中位数所在组的下限出发,为n n n n 上限公式从中位数所在组的上限出发,为n 4.1 4.1 集中集中趋势趋势的度量的度量 第27页,共132页,编辑于202
15、2年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.54.5 表4.3为第三章“表3.7 某学期某班35名学生的统计学考试成绩”中的部分资料,为已经分组的数值型数据。要求要求 根据表4.3数据,计算该班35名学生的统计学考试成绩的中位数。解解 运用插值公式计算该班学生统计学考试成绩中位数的近似数值。表4.3 某学期某班35名学生的统计学考试成绩第28页,共132页,编辑于2022年,星期二n显然,我们可以任选上限公式或下限公式来计算中位数,得到结果是相同的。n中位数是一个顺顺序序统统计计量量,其取值不受极极端端数数值值的影响,也不受组距分
16、组中开口组设置的影响。当数值型数据中含有极小值和极大值时,可以使用中位数来度量数据的集中趋势。n中位数一般适用于定序数据。不太适用于偏态的数据。第29页,共132页,编辑于2022年,星期二n4.1.3 均值n 均均值值(Mean)为一组数值型数据之和除以该组数据总数的商,即同一组数据的总值与其频数的商。n 在大多数场合,均值采用算术平均方法计算,所 以 人 们 经 常 将 均 值 称 为 算算 术术 平平 均均 数数(Arithmetical Average)。第30页,共132页,编辑于2022年,星期二n计算均值的数据需要具备数数值值型型数数据据的属性,均值是一个数值型的集中趋势测度。通
17、过计算均值的运算过程,首先将各个数据之间的数量差异抽象掉了,以一个抽象性的综合测度概括地反映事物的集中趋势。其次将不同总体的总量规模抽象掉了,表现出来的只是一个一般性的代表水平,有利于不同规模的同类总体在不同空间和时间上的广泛比较。第31页,共132页,编辑于2022年,星期二n均值在各个方面得到广泛应用。均值属于参数统计的内容,只能用做数值型数据集中趋势的测度,不能度量非数值型数据的集中趋势。第32页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 1简单均值 简单均值(Simple Mean)是根据未分组的原始数据
18、计算出来的均值。有 (4.7)例例4.6 4.6 仍采用第三章中例3.1某学期某班35名学生的统计学考试成绩的原始数据 要求要求 试计算该班35名学生的统计学考试成绩的均值。解解 采用式(4.7)计算,有 第33页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 2加权均值加权均值 加权均值(Weighted Mean)是运用各组频数作为权数对各组数值水平进行加权计算出来的均值。根据是单变量值分组还是组距分组,以及组距分组的各组数值水平代表数据是组均值还是组中值,加权均值的计算分为以下三种类型。(1)单变量值分组加权均
19、值 在单变量值分组场合,加权均值的计算公式为 (4.8)第34页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.7 4.7 某机床总装车间10个装配小组日完成产品台数情况,计算单变量值分组加权均值。表4.4 某机床总装车间10个装配小组日完成产品台数情况 要求要求 试计算单变量值分组加权均值。解解 采用式(4.8)计算,可得第35页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 (2)采用组均值计算加权均值采用组均值计算加权均值 在
20、组距分组中,采用组均值计算加权均值时,计算公式为 (4.9)式(4.9)中 表示第j 组的组均值。第36页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.84.8 采用第三章中例3.1 的各组均值数据。要求要求 试计算组距分组的该班35名学生的统计学考试成绩的加权均值。解解 依据各组中的数据数值和数据个数,按照式(4.7)的均值计算公式,计算出各组的组均值,填入表4.5中。表4.5 某学期某班35名学生统计学考试成绩的组均值和频数第37页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度
21、量 n 4.1 4.1 集中集中趋势趋势的度量的度量 (3)采用组中值组中值计算加权均值 在不占有原始数据和组均值数值,只拥有已分组的数据时,只有利用各组组中值采用加权的方式计算均值的近似数值。利用组中值计算均值近似值的公式为 (4.10)式(4.10)中 表示第j组的组中值。第38页,共132页,编辑于2022年,星期二n采用组中值计算加权均值的前提条件前提条件:n各组数据近似地趋于均匀分布或对称分布,各组的组中值近似于各组的组均值。当各组数据显著地不趋于均匀分布或对称分布时,各组的组中值与各组的组均值就会存在较大差异,两者数值水平相差越大,采用组中值替代组均值的误差就越大。第39页,共13
22、2页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 例例4.94.9 根据第三章中表3.7中“某学期某班35名学生的统计学考试成绩”的各组组中值和频数数据。要求要求 试采用组中值计算该班35名学生的统计学考试成绩的加权均值。解解 采用式(4.10)计算。表4.6 某学期某班35名学生统计学考试成绩的组中值和频数第40页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 3权数【权重】与加权结构权数【权重】与加权结构 对于加权均值而言,有两个因素决定着均值数
23、值的大小,一个因素是各组的数值水平,在不同场合,可以是单变量值、组均值或组中值;另一个因素是各组的频数。频数对各组的数值水平数值起着权衡轻重的作用,所以将加权均值的计算公式中频频数数称为“权数”。在均值的计算中又将频频数数分分布布称为“加权结构”,“加权结构”更加清晰地反映了数据在各组中的分布与集中趋势之间的联系,及其对均值数值水平形成的影响。将式(4.8)略加变形,有 (4.11)第41页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 根据第三章中表3.7中“某学期某班35名学生的统计学考试成绩”的各组组中值和频数
24、数据,计算“加权结构”和“组贡献值”。某班35名学生统计学考试平均成绩的“加权结构”和“组贡献值”考分/分组均值/分人 数/人比例【频率】【权重】/%组贡献值/分60 以下5425.714 3.09 607065411.429 7.43 708076925.714 19.54 8090851440.000 34.00 9010093617.143 15.94 合 计35100.000 80.00 第42页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 均值的数学性质均值的数学性质:(1)各个变量值与其均值的离差和为零
25、,即(2)各个变量值与其均值平均数的离差平方和为最小,即 当取均值作为集中趋势的测度时,各个数据的取值与集中趋势测度的离差平方和为最小值。均值的这一数学性质是度量离散程度,进行误差分析和最小二乘估计等统计方法的基础。第43页,共132页,编辑于2022年,星期二第44页,共132页,编辑于2022年,星期二统计学教程第4章 数据分布特征的度量 n 4.1 4.1 集中集中趋势趋势的度量的度量 4.1.4 调和平均数调和平均数 调和平均数(Harmonic Mean)是各个变量数值倒数的算术平均数的倒数。因此又称之为“倒数平均数”。1.简单调和平均数 设有个变量值为,则有简单调和平均数的计算公式
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 第四 幻灯片
限制150内