数据分布特征的测度.pptx
《数据分布特征的测度.pptx》由会员分享,可在线阅读,更多相关《数据分布特征的测度.pptx(57页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第1节 集中趋势的量度 集中趋势(Central tendency)是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。分类数据:众数顺序数据:中位数和分位数数值型数据:均值第1页/共57页集中趋势(Central tendency)1.1.一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度2.2.测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值3.3.不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值4.4.低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于
2、高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据第2页/共57页均值(mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据第3页/共57页一、算术平均数(Arithmetic mean)(一)简单算术平均数例:有5名工人生产的零件数分别为:15、16、17、18、19,平均零件数为多少?解:(件)第4页/共57页(二)加权算术平均数基本公式影响加权算术平均数的因素:变量值和权数选择权数的原则:变量值与其乘积是具有实际经济意义的标志总量。加
3、权算术平均数与简单算术平均数的关系:当 时,第5页/共57页 例:计算某车间工人平均工资(单项式)某班组工人平均工资的计算(单项式数列)解:(元)工资(x)工人数(f)工资总额(xf)50021000530421207408592086054300102011020合计2014360第6页/共57页按零件数分组(个)组中值(x)人数(f)xf506055844060706520130070807512900合计402640例:计算某车间工人加工零件平均数(组距式数列)解:(件)第7页/共57页权数对均值的影响 甲乙两组各有10名学生,他们的考试成绩及其分布数据如下 甲组:考试成绩(x):0 2
4、0 100 人数分布(f):1 1 8 乙组:考试成绩(x):0 20 100 人数分布(f):8 1 1第8页/共57页均值的数学性质1.各变量值与均值的离差之和等于零 2.2.各变量值与均值的离差平方和最小各变量值与均值的离差平方和最小第9页/共57页例:某市场某蔬菜销售价格早晨为1.00元,中午为0.5元,晚上为0.2元。在下列两种情况下分别计算平均价格(1)早午晚各买1斤(2)早午晚各买1元。简单调和平均数加权调和平均数二、调和平均数(倒数平均数 Harmonic mean)第10页/共57页 例题分析某日三种蔬菜的批发成交数据某日三种蔬菜的批发成交数据蔬菜蔬菜名称名称批发价格批发价格
5、(元元)x成交额成交额(元元)M成交量成交量(公斤公斤)f甲甲乙乙丙丙1.200.500.801800012500640015000250008000合计合计3690048000【例例】某某蔬蔬菜菜批批发发市市场场三三种种蔬蔬菜菜的的日日成成交交数数据据如如表表,计计算算三三种种蔬蔬菜菜该该日日的平均批发价格的平均批发价格第11页/共57页练习1:某管理局所属的15个企业,2000年按其生产某产品平均单位成本的高低分组资料如下,试计算平均单位成本。按平均单位成本分组(元/件)企业数(个)各组产量在总产量中所占的比重(%)101212141418276224038合计15100第12页/共57页
6、试指出那个厂的总平均成本高,其原因何在?品种单位成本(元)总成本一厂二厂甲乙丙152030210030001500322515001500练习2:有两个工厂生产三种产品的单位成本和总成本资料如下:第13页/共57页练习3:计算某地区工业企业产值平均计划完成程度计划完成%企业数(个)计划产值(万元)90以下7140901002231010011057165011012026710120以上340合计1152850第14页/共57页平均数计算方法的选择设则 (已知m、f)(已知x、f)(已知x、m)原来只是计算原来只是计算时使用了不同时使用了不同的数据!的数据!第15页/共57页三、几何平均数(G
7、eometric mean)例1:一位投资者持有一种股票,1997,1998,1999,2000收益率分别为4.5%、2.0%、3.5%、5.4%。计算该投资者在这四年内的平均收益率。例2:某企业四个车间流水作业生产某产品。一车间产品合格率为99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率。算术平均数、调和平均数、几何平均数之间的关系算术平均数几何平均数调和平均数第16页/共57页练习:求平均年利率 投资银行某笔投资是的年利率是按复利计算的,25年利率分配时(按时间数序):有一年是3%,有4年为4%,有8年为8%,有10年为10%,有2年为15%。求平均年利率
8、。第17页/共57页四、众数(Mode)众数是一组数据中出现次数最多的变量值 无众数或复众数 主要用于分类数据,也可用于顺序数据和数值型数据对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数。对于组距数列,若众数组相邻两组次数相等,则众数组的组中值就是众数;若众数组上一组的次数较多,则众数在众数组内靠近上限;若众数组下一组的次数较多,则众数在众数组内靠近下限。计算公式:第18页/共57页例:分类数据的众数不同品牌饮料的频数分布不同品牌饮料的频数分布 饮料品牌饮料品牌频数频数比例比例百分比百分比(%)可口可乐可口可乐 旭日升冰茶旭日升冰茶 百事可乐百事可乐 汇源果汁汇源果汁 露露露露1
9、5119690.300.220.180.120.183022181218合计合计501100解解:这这里里的的变变量量为为“饮饮料料品品牌牌”,这这是是个个分分类类变变量量,不不同同类类型型的的饮饮料料就就是是变变量量值值 在在所所调调查查的的5050人人中中,购购买买可可口口可可乐乐的的人人数数最最多多,为为1515人人,占占总总被被调调查查人人数数的的30%30%,因因此此众众数数为为“可口可乐可口可乐”这一品牌,即这一品牌,即 MMo o可口可乐可口可乐第19页/共57页例:顺序数据的众数解解:这这里里的的数数据据为为顺顺序序数数据。变量为据。变量为“回答类别回答类别”甲甲城城市市中中对
10、对住住房房表表示示不不 满满 意意 的的 户户 数数 最最 多多,为为108108户户,因因此此众众数数为为“不不满意满意”这一类别,即这一类别,即 MMo o不满意不满意甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)百分比百分比 (%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意24108934530836311510合计合计300100.0第20页/共57页五、中位数(Median)中位数是一组数据按一定顺序排列后,处于中间位置上的变量值。主要用于顺序数据,也可用数值型数据,但不能用于主要用于顺
11、序数据,也可用数值型数据,但不能用于分类数据。分类数据。对于未分组数据,中位数位置=(n+1)/2对于单项式分组数据,中位数位置=对于组距数列,确定中位数组之后,可按以下公式计算中位数:第21页/共57页例:顺序数据的中位数解解:中中 位位 数数 的的 位位 置置 为为 300/2300/2150150 从从累累计计频频数数看看,中中位位数数在在“一一般般”这这一组别中。因此一组别中。因此 Me=一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲城市甲城市户数户数 (户户)累计频数累计频数 非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意
12、非常满意2410893453024132225270300合计合计300第22页/共57页例:数值型数据某地农户收入众数、中位数年收入(元)农户数农户数累计向上累计向下累计5006006007007008008009009001000100011001100120012001300240480105060027021012030240720177023702640285029703000300027602280123063036015030合计3000第23页/共57页解:因第3组次数最多,故其为众数组。=755.9(元)中位数位置=1500,所以第三组为中位数组。=774.3(元)第24页/
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分布 特征 测度
限制150内