《数据分布特征》PPT课件.ppt
《《数据分布特征》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《数据分布特征》PPT课件.ppt(42页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 四四 章章 数据分布特征的描述数据分布特征的描述 一、均值一、均值(mean)(一一)概念概念 均值均值是反映数据分布集中趋势十分重要的数据,代表代表总体单位某一标志值的一般水平总体单位某一标志值的一般水平。(二二)特征特征 1.具有抽象性。抽象性。2.具有代表性。代表性。3.反映反映总体分布的集中趋势。集中趋势。(三三)举例举例 1.某市中学生每周平均上网时间为21小时。2.某农贸市场2月份牛肉的平均价格为34元/千克。3.某地区“十五”期间经济平均增长率为9.6%。第第 一一 节节 数据分布集中趋势的测定数据分布集中趋势的测定(四)均值的种类及计算(四)均值的种类及计算 1.1.算术
2、平均数算术平均数*(1)(1)概念概念 算术平均数又称平均值,是用一组数据中所有值之和除以该组数据的个数。(我们最熟悉,用途最广,但我们有时却不一定能计(我们最熟悉,用途最广,但我们有时却不一定能计算出均值,要学好均值的计算。)算出均值,要学好均值的计算。)(2)(2)基本公式基本公式算术平均数的计算算术平均数的计算*简单算术平均数简单算术平均数:总体平均数总体平均数 样本平均数样本平均数算术平均数的计算算术平均数的计算*加权算术平均数加权算术平均数(重点)(重点)概念概念:是对每个数据每个数据都根据其在全组中的重要程度赋赋予一定权重予一定权重后得到的算术平均数。计算公式计算公式:(1 1)未
3、分组数据)未分组数据 其中其中,w表示各组的标志总量,而不是各组变量值出现的次数,总体和样本加权算术平均数的公式是相同。(鸡兔同笼问题,鸡兔同笼问题,1515只鸡,只鸡,2020只兔子,平均每只动物有只兔子,平均每只动物有多少条腿多少条腿)例例4-14-1根据某公司根据某公司四个品牌数码相机的销四个品牌数码相机的销售资料计算平均利润率。售资料计算平均利润率。(P71)表4-1 四个品牌数码相机的利润率和销售额资料四个品牌数码相机的利润率和销售额资料四个品牌数码相机的平均销售利润率为:分组的加权平均数分组的加权平均数:根据分组数据计算均值。样本样本均值的计算公式(难点)(难点)总体总体均值的计算
4、公式:表示各组的变量值变量值(组距式数列的组中值组中值);表示各组变量值出现的频数(即权数权数)。(算术平均数的不足,(算术平均数的不足,P72.)其中,例例4-24-2根据某电脑公司在各市场上销售量的根据某电脑公司在各市场上销售量的分组数据,计算电脑销售量的均值。分组数据,计算电脑销售量的均值。按按销销售量分售量分组组(台)(台)组组中中值值(Mi)市市场场个数个数(fi)Mi fi 140150150160160170170180180190190200200210210220220230230240145155165175185195205215225235 4 91627201710
5、8 4 5 5801395264047253700331520501720 9001175合合计计fi 120Mi fi 222002.2.调和平均数调和平均数(1 1)概念)概念:调和平均数调和平均数又称倒数平均数倒数平均数,是各个变量值倒数的算术平均数的倒数。(调和平均数的特点,(调和平均数的特点,P73)(2 2)计算)计算 简单调和平均数简单调和平均数:针对未分组资料。未分组资料。计算公式为:2.2.调和平均数调和平均数 加权调和平均数加权调和平均数:针对分组资料。分组资料。计算公式计算公式为:其中其中:是一种特殊权数特殊权数,它不是各组变量值出现的次数,表示各组标志总量各组标志总量。
6、即 例例4-34-3根据根据某商场职工月工资资料计算月平某商场职工月工资资料计算月平均工资。均工资。表表4-3某商场职工月工资资料某商场职工月工资资料3.3.几何平均数几何平均数(1)(1)概念概念:几何平均数(geometric mean)又称对称平均数,它是各变量值乘积的n次方根。(2)(2)计算计算 基本公式基本公式:对数公式对数公式:在实际工作中,由于变量个数较多,通常要应用对数来进行计算。即(3)(3)几何平均数的应用及特点几何平均数的应用及特点 应用条件应用条件 a.a.变量值是相对数据,如比率或发展速度。变量值是相对数据,如比率或发展速度。b.b.变量值的连乘积等于总比率或总发展
7、速度。变量值的连乘积等于总比率或总发展速度。特点特点 a.a.如果数列中有一个标志值等于零或负值,则无法计算。如果数列中有一个标志值等于零或负值,则无法计算。b.b.受极端值影响较小,故较稳健。受极端值影响较小,故较稳健。例例4-44-4 某电器销售公司20002005年销售量的环比增长率分别为:7.6%、2.5%、0.6、2.7%和2.2%。求这期间销售量的平均增长速度。表4-4 销售量平均发展速度计算表 几何平均数的计算示例几何平均数的计算示例几何平均数的计算示例几何平均数的计算示例 1.1.采用基本公式采用基本公式计算的销售量平均发展速度为:2.2.采用对数公式采用对数公式计算的销售量平
8、均发展速度为:所以,销售量的平均增长速度所以,销售量的平均增长速度=103.1%-1=3.1%=103.1%-1=3.1%二、位置平均数二、位置平均数(一)中位数(一)中位数(median)1.1.概念概念 中位数是将一组数据项按照数值大小升序或者降序排列后位于中间位置的那个数据中间位置的那个数据,符号为 。2.2.中位数的计算方法中位数的计算方法 (1)(1)未分组数据的中位数未分组数据的中位数 将变量值按升序或降序排列,找中间位置的变量值。(2)(2)单项数列的中位数单项数列的中位数 计算各组的累计频数累计频数(向上累计向上累计或向下累计向下累计);根据中位数位置确定中位数。例例4-54-
9、5 计算某公司销售人员月销售冰箱中位数 表4-5 某公司销售人员月销售冰箱中位数计算按月按月销销售冰箱分售冰箱分组组 (台台)销销售人售人员员数数(人人)向上累向上累计频计频数数向下累向下累计频计频数数25303234363931014271883132754728080776753268合合 计计80中位数的位置中位数的位置 即中位数中位数在累计频数为40的那一组内(向上累计或向下累计均可得出),则 。2.2.中位数的计算方法中位数的计算方法(3 3)组距数列的中位数)组距数列的中位数:由下列公式近似计算 下限公式下限公式其中其中:为总体单位总数;为中位数组的下限;为中位数组以下的累计频数;
10、为中位数组的频数;为中位数组的组距;例例4-6 4-6 求以下组距数列的中位数。求以下组距数列的中位数。按家庭收入分组(元)按家庭收入分组(元)家庭数(户)家庭数(户)向上累计频率向上累计频率5 000以下5 00010 00010 00015 00015 00020 00020 000以上214514662166808692合合 计计9292中位数的近似值为:表4-6 某地区家庭收入分组中位数的位置在第第46(92/2)位)位,应在第二第二组组中位数的特点中位数的特点 是一种位置平均数位置平均数,不受极端值及开口组的影响不受极端值及开口组的影响。对于分配不对称的数据分配不对称的数据,中位数比
11、平均值更适合当集中趋势的代表值。对某些不具有数字特征或不能用数字测定的现象,可对某些不具有数字特征或不能用数字测定的现象,可用中位数表示其一般水平用中位数表示其一般水平。例如,对众多的消费者购买数码相机时,分别对价格、外观、品质的注重程度排序后,可以求出消费者在乎的中位数因素。二、位置平均数二、位置平均数(二)(二)众数众数 1.1.概念概念 众数(mode)是指在一组数中出现次数最多的那个数值,符号为 。2.2.数据数列的众数分布情况数据数列的众数分布情况 无众数无众数 如数据数列:13 7 9 12 6 8 一个众数一个众数 如数据数列:6 5 9 8 6 6 多个众数多个众数 如数据数列
12、:22 35 27 35 27 363.3.众数的计算方法众数的计算方法*品质变量的众数品质变量的众数观察次数,出现次数最多的变量值就是众数。例如:企业的所有制结构分布、人口的城乡分布。*数值变量的众数数值变量的众数 未分组资料未分组资料观察次数,出现次数最多的数据就是众数。分组资料分组资料 (1)单项式数列直接观察,次数最多的组的变量值即为众数。例例4-74-7单项式变量数列确定众数实例单项式变量数列确定众数实例 表4-7 某市居民家庭按家庭人口数分组 由上表可以看出,家庭人口数为3人的家庭数最多,因此本例中家庭人口数的众数为3人人。3.3.众数的计算方法众数的计算方法 组距数列组距数列计算
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据分布特征 数据 分布 特征 PPT 课件
限制150内