统计学-数据的描述性分析-PPT.ppt
《统计学-数据的描述性分析-PPT.ppt》由会员分享,可在线阅读,更多相关《统计学-数据的描述性分析-PPT.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本章内容第一节 集中趋势的描述第二节 离散程度的描述第三节 分布的偏态与峰度集中趋势 集中趋势反映的是一组数据向某一中心值靠拢的倾向,在中心附近的数据数目较多,而远离中心的较少。对集中趋势进行描述就是寻找数据一般水平的中心值或代表值。1.1.数值平均数:是以统计数列的所有数据来计算的平均数.其特点是统计数列中任何一项数据的变动,都会在一定程度上影响数值平均数的计算结果.2.位置平均数:它不是对统计数列中所有数据进行计算所得的结果,而是根据数列中处于特殊位置上的个别单位或部分单位的标志值来确定的.数值平均数包括算术平均数、调和平均数和几何平均数.1.算术平均数(均值,Arithmetic Mea
2、n)总体均值常用 或 表示,样本均值常用 表示,样本均值 的计算公式:简单算术平均数:加权算术平均数:一、一、数值平均数数值平均数权数的意义和作用权数的意义和作用权数:各组次数(频数)的大小所对应的标志值对平均数的影响具有权衡轻重的作用.当各组的次数都相同时,即当 时:加权算术平均数就等于简单算术平均数.例:计算某车间工人加工零件平均数(组距式数列)解:关于计算结果的说明关于计算结果的说明根据原始数据和分组资料计算的结果一般不会完全相等,根据分组数据只能得到近似结果.只有各组数据在组内呈对称或均匀分布时,根据分组资料 的计算结果才会与原始数据的计算结果一致.(1).各变量值与均值的离差之和等于
3、零.(2).各变量值与均值的离差平方和最小.算算术平均数的特点平均数的特点算算术平均数适合用代数方法运算,因此运用平均数适合用代数方法运算,因此运用比比较广泛;广泛;易受极端易受极端变量量值的影响,使的影响,使的代表性的代表性变小;小;受极大受极大值的影响大于受极小的影响大于受极小值的影响;的影响;当当组距数列距数列为开口开口组时,由于,由于组中中值不易确不易确定,使定,使的代表性也不很可靠的代表性也不很可靠;同同时要求各要求各单位位标志志值在在组内是均匀分布的,此内是均匀分布的,此时各各组的平均数正好的平均数正好等于它的等于它的组中中值。故用。故用组中中值计算得出来的平均数只算得出来的平均数
4、只能是一个近似能是一个近似值。调和平均数是各个和平均数是各个变量量值倒数的算倒数的算术平均数的倒数平均数的倒数。2、调和平均数和平均数(又称又称“倒数平均数倒数平均数”)其其计算方法如下算方法如下:在加权的情况下:在加权的情况下:在社会在社会经济统计学中学中经常用到的常用到的仅是一种特定是一种特定权数的加数的加权调和平均数。即有以下数学关系式成立:和平均数。即有以下数学关系式成立:m是一种特定是一种特定权数,它不是各数,它不是各组变量量值出出现的次的次数,而是各数,而是各组标志志值总量。量。调和平均数的特点和平均数的特点如果数列中有一如果数列中有一标志志值等于零,等于零,则无法无法计算算;较之
5、算之算术平均数,平均数,受极端受极端值的影响要小的影响要小。例例.某蔬菜批发市场三种蔬菜日成交数据如下表,计算三种蔬菜该日的平均批发价格.3.几何平均数(Geometric Mean),又称“对数平均数”是另一种形式的平均数,是n个标志值乘积的 n 次方根.主要用于计算平均比率和平均速度.(1)简单几何平均数式中G表示几何平均数,表示各项标志值.(2)加权几何平均数例 某企业四个车间流水作业生产某产品,一车间产品合格率99%,二车间为95%,三车间为92%,四车间为90%,计算该企业的平均产品合格率.几何平均数的特点几何平均数的特点如果数列中有一个如果数列中有一个标志志值等于零或等于零或负值,
6、就无法就无法计算算;受极端受极端值的影响的影响较和和小;小;它适用于反映特定它适用于反映特定现象的平均水平,即象的平均水平,即现象的象的总标志志值是各是各单位位标志志值的的连乘乘积。注注:(1)(2)数值平均数主要适用于定量数据,而不适用于定性数据.(3)简单数值平均数适用于未分组的资料,加权数值平均数适用于分组的资料.1.众数(Mode)一组数据中出现次数最多的变量值.主要特点:不受极端值的影响.有的数据无众数或有多个众数.位置平均数M0M0M0M0M0若有两个次数相等的众数,若有两个次数相等的众数,则称复众数。称复众数。只只有有总体体单位数比位数比较多,而且又有明多,而且又有明显的集中的集
7、中趋势时才才存在众数。存在众数。下三下三图无众数:无众数:在在单位数很少,或位数很少,或单位数位数虽多但无明多但无明显集集中中趋势时,计算众数是没有意算众数是没有意义的。的。说明说明:如果所有数据出现的次数都一样如果所有数据出现的次数都一样,那么这组数据没那么这组数据没 有众数有众数.众数主要用于分类数据,也可用于顺序数据和数值型数据,对于未分组数据和单项式分组数据,众数位置确定之后便找到了众数.适用范围例:分类数据的众数例:顺序数据的众数 根据根据单项数列确定众数数列确定众数;某种商品的价格情况众数M0=3.00(元)数数值型数据众数的型数据众数的计算方法算方法例例 根据根据组距数列确定众数
8、距数列确定众数()利用比例插利用比例插值法推算众数的近似法推算众数的近似值。()由最多次数来确定众数所在由最多次数来确定众数所在组;表中70-80,即众数所在组。例例计算众数的近似算众数的近似值:下限公式:上限公式:由下限公式,日产量众数由上限公式,日产量众数 众数的特点众数的特点 众数是一个位置平均数,它只考众数是一个位置平均数,它只考虑总体分布中体分布中最最频繁出繁出现的的变量量值,而不受各,而不受各单位位标志志值的影的影响,从而增响,从而增强了了对变量数列一般水平的代表性。量数列一般水平的代表性。不受极端不受极端值和开口和开口组数列的影响。数列的影响。众数是一个不容易确定的平均指众数是一
9、个不容易确定的平均指标,当分布数,当分布数列没有明列没有明显的集中的集中趋势而而趋均匀分布均匀分布时,则无众无众数可言;当数可言;当变量数列是不等距分量数列是不等距分组时,众数的位,众数的位置也不好确定。置也不好确定。2.中位数(Median)中位数是一组数据按一定顺序排列后,处于中间位置上的变量 由未分由未分组资料确定中位数料确定中位数数数值型数据中位数的型数据中位数的计算方法算方法 n为奇数奇数时,则居于中居于中间位置的那个位置的那个标志志值就是中位数。就是中位数。例例 n为偶数偶数时,则中中间位置的两个位置的两个标志志值的算的算术平均数平均数为中位数。中位数。由由单项数列确定中位数数列确
10、定中位数某企业按日产零件分组如下:例例 由由组距数列确定中位数距数列确定中位数下限公式下限公式(较小制累计时用):上限公式上限公式(较大制累计时用):中位数不受极端中位数不受极端值及开口及开口组的影响,的影响,具有具有稳健性健性。各各单位位标志志值与中位数离差的与中位数离差的绝对值之和之和是个最小是个最小值。对某些不具有数学特点或不能用数字某些不具有数学特点或不能用数字测定的定的 现象,可用中位数求其一般水平。象,可用中位数求其一般水平。中位数的特点中位数的特点负偏正偏注:(1)中位数总是介于众数和平均数之间.(2)皮尔逊经验法则分布在轻微偏斜的情况下,众数、中位数和算术平均数数量关系的经验公
11、式为:一组工人的月收入众数为700元,月收入的算术平均数为1000元,则月收入的中位数近似值是:例例根据卡尔皮尔逊经验公式,还可以推算出:众数、中位数、平均数的特点和应用1.众数不受极端值影响具有不惟一性数据分布偏斜程度较大且有明显峰值时应用2.中位数不受极端值影响数据分布偏斜程度较大时应用3.平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用数值平均数与位置平均数的适用场合?案例案例1:甲班:甲班统计学统计学考试情况如下表:考试情况如下表:案例案例2:乙班:乙班统计学统计学考试情况如下表:考试情况如下表:案例案例3:丙班:丙班统计学统计学考试情况如下表:考试情况如下表:问题问题
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 描述 分析 PPT
限制150内