数据分布特征的描述调整.ppt
《数据分布特征的描述调整.ppt》由会员分享,可在线阅读,更多相关《数据分布特征的描述调整.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据分布特征的描述调整现在学习的是第1页,共79页数据分布特征的测度数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众 数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态现在学习的是第2页,共79页第一第一节集中集中趋势的的测度度 指一组数据向其中心值靠拢的倾指一组数据向其
2、中心值靠拢的倾向和程度。向和程度。集中趋势集中趋势又称平均数,是反又称平均数,是反又称平均数,是反又称平均数,是反映社会经济现象总映社会经济现象总映社会经济现象总映社会经济现象总体各单位某一数量体各单位某一数量体各单位某一数量体各单位某一数量标志在一定时间、标志在一定时间、标志在一定时间、标志在一定时间、地点和条地点和条地点和条地点和条件下所达件下所达件下所达件下所达到的一般水平的综到的一般水平的综到的一般水平的综到的一般水平的综合指标。合指标。合指标。合指标。平平均均数数数值平均数数值平均数位置平均数位置平均数算术平均数调算术平均数调和平均数几何和平均数几何平均数平均数中位数中位数众数众数现
3、在学习的是第3页,共79页某系某系83名女生身高名女生身高资料(按序排列)料(按序排列)位置平均数的概念位置平均数的概念 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83 152 154 154 155 155 156 156 156 156 157 158 158 159 159 160 160 160 1
4、60 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 168 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172 174将将变量量值按按顺序排列起来,序排列起来,当反映分布集中当反映分布集中趋势的
5、度量的度量值仅仅由数列中某个位置的由数列中某个位置的值来确定来确定时,这个个值称称为位置平均数。位置平均数。位置平均数与数位置平均数与数值平均数的平均数的基本区基本区别在于其不需要依据每一在于其不需要依据每一个个变量量值来来计算。算。现在学习的是第4页,共79页指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示表示,它不受极端数值的影响,用来它不受极端数值的影响,用来说明总体中大多数单位所达到的一般说明总体中大多数单位所达到的一般水平。水平。众数众数位置平均数位置平均数现在学习的是第5页,共79页0 1 2 3 4 5 6 7 8 9 10 11 12 13 2009 Mo
6、de=9Not Affected by Extreme Values 不受极端值的影响不受极端值的影响There May Not be a Mode 一组数据可能没有众数一组数据可能没有众数There May be Several Modes 也可能有多个众数也可能有多个众数众数的性众数的性质Mode=90 1 2 3 4 5 6 7 8 9 10 11 12 13 14 现在学习的是第6页,共79页众数(不唯一性)无众数无众数 原始数据:10 5 9 12 6 8一个众数一个众数一个众数一个众数原始数据原始数据:6 :6 5 9 8 9 8 5 5多于一个众数多于一个众数多于一个众数多于一个
7、众数 原始数据原始数据:25 28 2828 28 36 42 4242 42现在学习的是第7页,共79页众数的确定方法众数的确定方法某年某年级83名女生身高名女生身高资料料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计 83 现在学习的是第8页,共79页日产量(件)日产量(件)工人人数(人)工人人数(人)10
8、1112131470100380150100合计合计800【例例A A】已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:众数的确定众数的确定(单值数列)(单值数列)计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。现在学习的是第9页,共79页众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工
9、人月产量的众数。计算该车间工人月产量的众数。现在学习的是第10页,共79页众数的确定众数的确定(组距数列)(组距数列)【例例B B】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的众数。计算该车间工人月产量的众数。现在学习的是第11页,共79页定类数据的众数(例题分析)不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐
10、 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露15119690.300.220.180.120.183022181218合计合计501100解解解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个定定类类变变量量,不不同类型的饮料就是变量值同类型的饮料就是变量值 在在所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可可口口可可乐乐”这这一品牌,即一品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐现在学习的是第12页,共79页定序数据的众数(
11、例题分析)解解解解:这这里里的的数数据据为为定定序序数数据据。变变量量为为“回回答类别答类别”甲甲城城市市中中对对住住房房表表示示不不满满意意的的户户数数最最多多,为为108108户户,因因此此众众数数为为“不不满满意意”这这一一类类别别,即即 MMo o不满意不满意不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0现在学习的是第13页,共79页将总体各单位标志值按
12、大小顺序排列将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,后,指处于数列中间位置的标志值,用用 表示表示中位数中位数不受极端数不受极端数值的影响的影响,在,在总体体标志志值差异很大差异很大时,具有,具有较强的代表性。的代表性。中位数的性质:中位数的性质:位置平均数位置平均数0 1 2 3 4 5 6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 100 Median=5Median=5MMe e50%50%现在学习的是第14页,共79页中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例A A】某售货小组某售货
13、小组5 5个人,某天的销售额按从个人,某天的销售额按从小到大的顺序排列为小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)现在学习的是第15页,共79页中位数的位次为中位数的位次为中位数应为第中位数应为第3和第和第4个单位标志值的算术平均数,个单位标志值的算术平均数,即即【例例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600
14、元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)现在学习的是第16页,共79页【例例C C】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)现在学习的是第17页,共79页中位数的确定中位数的确定(组
15、距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)由底向高累计次数由底向高累计次数(人)(人)200以下以下200400400600600以上以上373283104250合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。现在学习的是第18页,共79页中位数的确定中位数的确定(组距数列)(组距数列)【例例D D】某车间某车间5050名工人月产量的资料如下:名工人月产量的资料如下:月产量(件)月产量(件)工人人数(人)工人人数(人)由高向低累计次数由高向低累计次数(人)(人
16、)200以下以下200400400600600以上以上373285047408合计合计50计算该车间工人月产量的中位数。计算该车间工人月产量的中位数。现在学习的是第19页,共79页中位数的确定中位数的确定(组距数列)(组距数列)共共 个单位个单位共共 个单位个单位共共 个单位个单位共共 个单位个单位LU中位数组中位数组中位数组中位数组组距为组距为d共共 个单位个单位假定该组内的单位假定该组内的单位假定该组内的单位假定该组内的单位呈均匀分布呈均匀分布呈均匀分布呈均匀分布共有单位数共有单位数 中位数下限公式为中位数下限公式为 该段长度应为该段长度应为 现在学习的是第20页,共79页定序数据的中位数
17、(例题分析)解解解解:中中 位位 数数 的的 位位 置置 为为 300/2300/2150150 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一一组组别中。因此别中。因此 Me e=一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2410893453024132225270300合计合计300现在学习的是第21页,共79页数值平均数数值平均数现在学习的是第22页,共79页基本形式:基本形式:例:例:直直接接承承
18、担担者者算术平均数算术平均数现在学习的是第23页,共79页A.简单算术平均数简单算术平均数 适用于适用于总体体资料未料未经分分组整理、尚整理、尚为原始原始资料料的情况的情况式中:式中:为算算术平均数平均数;为总体体单位位总数;数;为第第i 个个单位的位的标志志值。算术平均数的计算方法算术平均数的计算方法现在学习的是第24页,共79页平均每人日平均每人日销售售额为:算术平均数的计算方法算术平均数的计算方法某售某售货小小组5个人,某天的个人,某天的销售售额分分别为520元、元、600元、元、480元、元、750元、元、440元,元,则【例例】现在学习的是第25页,共79页B.加权算术平均数加权算术
19、平均数适用于适用于总体体资料料经过分分组整理形成整理形成变量数列的量数列的情况情况式中:式中:为算算术平均数平均数;为第第组的次数;的次数;为组数;数;为第第 组的的标志志值或或组中中值。算术平均数的计算方法算术平均数的计算方法现在学习的是第26页,共79页【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法现在学习的是第27页,共79页解:解:算术平
20、均数的计算方法算术平均数的计算方法若上述若上述资料料为组距数列,距数列,则应取各取各组的的组中中值作作为该组的代表的代表值用于用于计算;此算;此时求求得的算得的算术平均数只是其真平均数只是其真值的的近似近似值。说说明明现在学习的是第28页,共79页已改至此!已改至此!某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组组中值组中值(Mi)频数频数(fi)Mi fi 14015015016016017017018018019019020020021021022022023023024014515516517518519520521522523549162720171084
21、558013952640472537003315205017209001175合计合计12022200加权均值加权均值(例题分析例题分析)现在学习的是第29页,共79页表表现为次数、次数、频数、数、单位数;即位数;即公式公式中的中的表表现为频率、比重;即公式率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指指变量数列中各量数列中各组标志志值出出现的次的次数,是数,是变量量值的承担者,反映了各的承担者,反映了各组的的标志志值对平均数的影响程度平均数的影响程度权数权数绝对权数绝对权数相对权数相对权数现在学习的是第30页,共79页权数与加数与加权234567819算算术平均数的平均数
22、的计算取决于算取决于变量量值和和权数的共同作用:数的共同作用:变量量值决定平均数的范决定平均数的范围;权数数则决定平均数的位置决定平均数的位置现在学习的是第31页,共79页变量量值与其算与其算术平均数的离差之和平均数的离差之和衡等于零,即:衡等于零,即:变量值与其算术平均数的离差平变量值与其算术平均数的离差平方和为最小,即:方和为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质现在学习的是第32页,共79页离差的概念离差的概念12345678-1-1-213现在学习的是第33页,共79页【例例】设设X=(2,4,6,8),则其调和平均数),则其调和平均数可由定义计算如下:可由定义计算
23、如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值的倒数:,再求倒数:再求倒数:是是总体各体各单位位标志志值倒数的算倒数的算术平均平均数的倒数,又叫数的倒数,又叫倒数平均数倒数平均数调和平均数调和平均数现在学习的是第34页,共79页A.简单调和平均数简单调和平均数适用于适用于总体体资料未料未经分分组整理、尚整理、尚为原始原始资料的情料的情况况式中:式中:为调和平均数和平均数;为变量量值 的的个数;个数;为第第个个变量量值。调和平均数的计算方法调和平均数的计算方法现在学习的是第35页,共79页B.加权调和平均数加权调和平均数适用于适用于总体体资料料经过分分组整理形成整理形成变量数列
24、的情况量数列的情况式中:式中:为第第 组的的变量量值;为第第组的的标志志总量。量。调和平均数的计算方法调和平均数的计算方法现在学习的是第36页,共79页日产量(件)日产量(件)日产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)1010111112121313141470070011001100456045601950195014001400合计合计合计合计97109710【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和
25、平均数的应用现在学习的是第37页,共79页即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解解现在学习的是第38页,共79页x、f 为已知已知若只知若只知 x 和和xf,而,而f 未未知,知,则不能使用加不能使用加权算算术平均方式,只能使用其平均方式,只能使用其变形即加形即加权调和平和平均方式均方式。苹果苹果 单价价 购买量量 总金金额 品种品种 (元)(公斤)(元)(公斤)(元)(元)红富士富士 2 3 6青香蕉青香蕉 1.8 5 9 现在学习的是第39页,共79页是是N项变量值连乘积的开项变量值连乘积的开N次方次方根
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 描述 调整
限制150内