统计学数据的描述性分析解析.pptx
《统计学数据的描述性分析解析.pptx》由会员分享,可在线阅读,更多相关《统计学数据的描述性分析解析.pptx(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、集中趋势集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。第1页/共81页第2页/共81页1.1.数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果.2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的.第3页/共81页数值平均数包括算术平均数、调和平均数和几何平均数.1.算术平均数(均值,Arithmetic Mean)总体均值常用 或
2、 表示,样本均值常用 表示,样本均值 的计算公式:简单算术平均数:加权算术平均数:一、数值平均数第4页/共81页权数的意义和作用权数的意义和作用权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用.当各组的次数都相同时,即当 时:加权算术平均数就等于简单算术平均数.第5页/共81页例:计算某车间工人加工零件平均数(组距式数列)解:第6页/共81页 关于计算结果的说明关于计算结果的说明根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果.只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.(1).各变量值与均
3、值的离差之和等于零.(2).各变量值与均值的离差平方和最小.第7页/共81页 算算术平均数的特点平均数的特点算算术平均数适合用代数方法运算,因此运用平均数适合用代数方法运算,因此运用比比较广泛;广泛;易受极端易受极端变量量值的影响,使的影响,使的代表性的代表性变小;小;受极大受极大值的影响大于受极小的影响大于受极小值的影响;的影响;当当组距数列距数列为开口开口组时,由于,由于组中中值不易确不易确定,使定,使的代表性也不很可靠的代表性也不很可靠;同同时要求各要求各单位位标志志值在在组内是均匀分布的,此内是均匀分布的,此时各各组的平均数正好的平均数正好等于它的等于它的组中中值。故用。故用组中中值计
4、算得出来的平均数只算得出来的平均数只能是一个近似能是一个近似值。第8页/共81页 调和平均数是各个和平均数是各个变量量值倒数的算倒数的算术平均数的倒数平均数的倒数。2、调和平均数和平均数(又称又称“倒数平均数倒数平均数”)第9页/共81页其其计算方法如下算方法如下:在加权的情况下:第10页/共81页在社会在社会经济统计学中学中经常用到的常用到的仅是一种特定是一种特定权数的加数的加权调和平均数。和平均数。即有以下数学关系式成立:即有以下数学关系式成立:m是一种特定是一种特定权数,它不是各数,它不是各组变量量值出出现的次的次数,而是各数,而是各组标志志值总量。量。第11页/共81页 调和平均数的特
5、点和平均数的特点如果数列中有一如果数列中有一标志志值等于零,等于零,则无法无法计算算;较之算之算术平均数,平均数,受极端受极端值的影响要小的影响要小。第12页/共81页例例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三种蔬菜该日的平均批发价格.第13页/共81页3.几何平均数(Geometric Mean),又称“对数平均数”是另一种形式的平均数,是n个标志值乘积的 n 次方根.主要用于计算平均比率和平均速度.(1)简单几何平均数式中G表示几何平均数,表示各项标志值.第14页/共81页(2)加权几何平均数第15页/共81页例 某企业四个车间流水作业生产某产品,一车间产品合格率99%,二车间为
6、95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率.第16页/共81页 几几何平均数的特点何平均数的特点如果数列中有一个如果数列中有一个标志志值等于零或等于零或负值,就无法就无法计算算;受极端受极端值的影响的影响较和和小;小;它适用于反映特定它适用于反映特定现象的平均水平,即象的平均水平,即现象的象的总标志志值是各是各单位位标志志值的的连乘乘积。第17页/共81页注注:(1)(2)数值平均数主要适用于定量数据,而不适用于定性数据.(3)简单数值平均数适用于未分组的资料,加权数值平均数适用于分组的资料.第18页/共81页1.众数(Mode)一组数据中出现次数最多的变量值.主要特点
7、:不受极端值的影响.有的数据无众数或有多个众数.位置平均数第19页/共81页第20页/共81页M0M0M0M0M0若有两个次数相等的众数,若有两个次数相等的众数,则称复众数。称复众数。只只有有总体体单位数比位数比较多,而且又有明多,而且又有明显的集中的集中趋势时才存在众数。才存在众数。第21页/共81页下三下三图无众数:无众数:在在单位数很少,或位数很少,或单位数位数虽多但无明多但无明显集中集中趋势时,计算众数是没有意算众数是没有意义的。的。说明说明:如果所有数据出现的次数都一样如果所有数据出现的次数都一样,那么这组数据没那么这组数据没 有众数有众数.第22页/共81页众数主要用于分类数据,也
8、可用于顺序数据和数值型数据,对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数.适用范围第23页/共81页例:分类数据的众数第24页/共81页例:顺序数据的众数第25页/共81页 根根据据单项数列确定众数数列确定众数;价格(元)销售数量(千克)2.00 202.40 603.001404.00 80合计300某种商品的价格情况众数M0=3.00(元)数数值型数据型数据众众数的数的计算方法算方法例例第26页/共81页 根根据据组距数列确定众数距数列确定众数()利利用比例插用比例插值法推算众数的近似法推算众数的近似值。()由由最多次数来确定众数所在最多次数来确定众数所在组;第27页/共8
9、1页按日产量分组(千克)工人人数(人)60以下10 60-7019 70-8050 80-9036 90-10027100-11014110以上 8表中70-80,即众数所在组。例例第28页/共81页计算众数的近似算众数的近似值:下限公式:上限公式:由下限公式,日产量众数由上限公式,日产量众数第29页/共81页 众众数的特点数的特点 众众数是一个位置平均数,它只考数是一个位置平均数,它只考虑总体分布中最体分布中最频繁出繁出现的的变量量值,而不,而不受各受各单位位标志志值的影响,从而增的影响,从而增强了了对变量数列一般水平的代表性。不受量数列一般水平的代表性。不受极端极端值和开口和开口组数列的影
10、响。数列的影响。众众数是一个不容易确定的平均指数是一个不容易确定的平均指标,当分布数,当分布数列没有明列没有明显的集中的集中趋势而而趋均匀分布均匀分布时,则无众无众数可言;当数可言;当变量数列是不等距分量数列是不等距分组时,众数的位,众数的位置也不好确定。置也不好确定。第30页/共81页2.中位数(Median)中位数是一组数据按一定顺序排列后,处于中间位置上的变量第31页/共81页第32页/共81页 由由未分未分组资料确定中位数料确定中位数数数值型数据型数据中中位数的位数的计算方法算方法第33页/共81页 n为奇数奇数时,则居于中居于中间位置的那个位置的那个标志志值就是中位数。就是中位数。例
11、例第34页/共81页 n为偶数偶数时,则中中间位置的两个位置的两个标志志值的算的算术平均数平均数为中位数。中位数。第35页/共81页 由由单项数列确定中位数数列确定中位数某企业按日产零件分组如下:按日产零件分组(件)工人数(人)较小制累计较大制累计26 3 3803110137732142767342754533618722641 880 8合计80-例例第36页/共81页 由由组距数列确定中位数距数列确定中位数 按日产量分组(千克)工人数(人)较小制累计较大制累计 50 60 10 10164 60 70 19 29154 70 80 50 79135 80 90 36115 85 9010
12、0 27142 49 100-110 14156 22 110以上 8164 8合计164-第37页/共81页下限公式下限公式(较小制累计时用):第38页/共81页上限公式上限公式(较大制累计时用):第39页/共81页 中中位数不受极端位数不受极端值及开口及开口组的影响,的影响,具有具有稳健性健性。各各单位位标志志值与中位数离差的与中位数离差的绝对值之和之和是个最小是个最小值。对某些不具有数学特点或不能用数字某些不具有数学特点或不能用数字测定的定的 现象,可用中位数求其一般水平。象,可用中位数求其一般水平。中中位数的特点位数的特点第40页/共81页负偏正偏注:(1)中位数总是介于众数和平均数之
13、间.第41页/共81页(2)皮尔逊经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公式为:第42页/共81页一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:例例根据卡尔皮尔逊经验公式,还可以推算出:第43页/共81页众数、中位数、平均数的特点和应用众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用第44页/共81页数值平均数与位置平均数的适用场合数值平均数与位置
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 描述 分析 解析
限制150内