统计学基础 第三章 数据分布特征的描述.ppt
《统计学基础 第三章 数据分布特征的描述.ppt》由会员分享,可在线阅读,更多相关《统计学基础 第三章 数据分布特征的描述.ppt(141页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1普通高等教育普通高等教育“十一五十一五”国家级规划教材国家级规划教材统计学导论统计学导论STATISTICS 科学出版社科学出版社第三章第三章 数据分布特征的描述数据分布特征的描述第一节第一节 统计变量集中趋势的测定统计变量集中趋势的测定第二节第二节 统计变量离散程度的测定统计变量离散程度的测定第三节第三节 变量分布的偏度与峰度变量分布的偏度与峰度第四节第四节 利用利用Excel计算描述统计指标计算描述统计指标第一节第一节 统计变量集中趋势的测定统计变量集中趋势的测定平均指标的基本理论平均指标的基本理论数值平均数数值平均数位置平均数位置平均数平均数的应用平均数的应用数据分布的特征数据分布的特
2、征数据分布的位置特征和离散特征。数据分布的位置特征和离散特征。位置特征位置特征离散特征离散特征第一节第一节 平均指标的基本理论平均指标的基本理论 一、平均指标的概念和分类一、平均指标的概念和分类 平均指标也称为统计平均数,它是说明同平均指标也称为统计平均数,它是说明同质总体内某一数量标志在具体时间、地点条质总体内某一数量标志在具体时间、地点条件下达到的一般水平的综合指标。件下达到的一般水平的综合指标。平均指标的种类平均指标的种类(一)(一)算术平均数算术平均数(二)(二)调和平均数调和平均数(三)(三)几何平均数几何平均数(四)(四)中位数中位数(五)(五)众数众数数值平均数数值平均数位置平均
3、数位置平均数二、数值平均数二、数值平均数 (一)算术平均数的基本形式(一)算术平均数的基本形式例:例:直直接接承承担担者者 注意区分算术平均数与强度相对数注意区分算术平均数与强度相对数算术平均数和强度相对数的区别算术平均数和强度相对数的区别 (1)算术平均数是根据同一个总体的标)算术平均数是根据同一个总体的标志总量和总体总量计算的,分子分母来自同志总量和总体总量计算的,分子分母来自同一个总体;而强度相对数是两种有密切联系一个总体;而强度相对数是两种有密切联系现象之比,分子分母分别来自两个总体。现象之比,分子分母分别来自两个总体。(2)算术平均数对比的分子分母存在着)算术平均数对比的分子分母存在
4、着依存汇总关系,分子是根据分母得来的;而依存汇总关系,分子是根据分母得来的;而强度相对数对比的分子分母不存在依存汇总强度相对数对比的分子分母不存在依存汇总关系。关系。算术平均数的计算方法算术平均数的计算方法 1.简单算术平均数简单算术平均数n把每项数据直接加总后除以它们的项数。把每项数据直接加总后除以它们的项数。n通常用于对未分组的数据计算算术平均数。通常用于对未分组的数据计算算术平均数。n计算公式:计算公式:分分组组例题例题1表表 5-25-2年龄年龄人数(人)人数(人)x xf f22224 42525101030305 550501 1合计合计2020表表 5-15-1男性男性女性女性2
5、2222222222222222525252525252525252525252525252525252525303030303030303050503030n解:采用简单算术平均法计算,即全体队解:采用简单算术平均法计算,即全体队员的平均年龄为(单位:周岁):员的平均年龄为(单位:周岁):若采用简单平均:若采用简单平均:分组数据不能简单分组数据不能简单平均平均!因为各组变!因为各组变量值的次数不等!量值的次数不等!2.加权算术平均数加权算术平均数适用于总体资料经过分组适用于总体资料经过分组整理形成变量数列的情况整理形成变量数列的情况 加权算术平均数的加权算术平均数的计算公式计算公式:加权是为
6、了体现各变量值轻重不同的影响作用,加权是为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的对各个变量值赋予不尽相同的权数(权数(fi).上例分组后的正确计算方法是:上例分组后的正确计算方法是:表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式公式公式 中的中的中的中的 表现为频率、比重;即公式表现为频率、比重;即公式表现为频率、比重;即公式表现为频率、比重;即公式中的中的中的中的指指变量数列中各组标志值出现的次数,变量数列中各组标志值出现的次数,是变量值的承担者,反映了各组的标志是变量值的承担者,反映了各组的标志值对平均数的影响程度。值对平均数的影响程度。权数权数权数
7、权数绝对权数绝对权数绝对权数绝对权数相对权数相对权数相对权数相对权数3.算术平均数的数学性质算术平均数的数学性质(1)变量值与其算术平均数的离差之和衡等变量值与其算术平均数的离差之和衡等于零,即:于零,即:(2 2)变量值与其算术平均数的离差平方和变量值与其算术平均数的离差平方和为最小,即:为最小,即:(二)调和平均数(二)调和平均数 调和平均数是总体各单位标志值倒数的算调和平均数是总体各单位标志值倒数的算术平均数的倒数,又叫术平均数的倒数,又叫倒数平均数。倒数平均数。调和平均数的计算形式也分为简单调和调和平均数的计算形式也分为简单调和平均数和加权调和平均数两种。平均数和加权调和平均数两种。一
8、、简单调和平均数一、简单调和平均数 适用于总体资料未经分组整理、尚为原适用于总体资料未经分组整理、尚为原始资料的情况。始资料的情况。其计算公式为:其计算公式为:【例例2】设市场上某种蔬菜早市每斤设市场上某种蔬菜早市每斤1元,中午元,中午每斤每斤2元,晚市每斤元,晚市每斤2.5元,若早、中、晚各买元,若早、中、晚各买1元,问每斤的平均价格。元,问每斤的平均价格。分析:分析:(1)早、中、晚各买)早、中、晚各买1元,共买了元,共买了3元;元;(2)早上用)早上用1元买了元买了1斤,中午用斤,中午用1元买了元买了0.5斤,晚上用斤,晚上用1元买了元买了0.4斤,一共买了斤,一共买了1+0.5+0.4
9、=1.9斤;斤;(3)平均每斤的价格为)平均每斤的价格为 把以上过程综合起来,平均价格的计算把以上过程综合起来,平均价格的计算过程如下:过程如下:二、加权调和平均数二、加权调和平均数 适用于总体资料经过分组整理形成变量适用于总体资料经过分组整理形成变量数列的情况。数列的情况。其计算公式为:其计算公式为:【例例3】设市场中某种蔬菜早、中、晚的所购设市场中某种蔬菜早、中、晚的所购金额不同,求平均采购价格。金额不同,求平均采购价格。价格(元价格(元/斤)斤)采采购金金额/元元采采购量量/斤斤xmm/x早市早市中午中午晚市晚市1.002.002.5045642.52.4合合计158.9 【解解】平均每
10、斤价格:平均每斤价格:当己知各组变量值和标志总量时,调和平当己知各组变量值和标志总量时,调和平均数可以作为算术平均数变形使用。均数可以作为算术平均数变形使用。因为:因为:加权算术平均数和加权调和平均数的联加权算术平均数和加权调和平均数的联系:系:二者的应用条件不同:如果资料中给出二者的应用条件不同:如果资料中给出每组变量值每组变量值x和对应的次数和对应的次数f,而没有给出各,而没有给出各组的标志总量组的标志总量xf,这时要用加权算术平均数,这时要用加权算术平均数计算平均数;如果资料中给出每组变量值计算平均数;如果资料中给出每组变量值x和和各组的标志总量各组的标志总量xf,而没有给出各组的次数,
11、而没有给出各组的次数f,这是要用调和平均数计算平均数。,这是要用调和平均数计算平均数。(三)由相对数或平均数计算平均数(三)由相对数或平均数计算平均数由于比值(由于比值(平均数或相对数平均数或相对数)不能直接相加,求)不能直接相加,求解比值的平均数时,需将其还原为构成比值的分解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比。子、分母原值总计进行对比。设相对数设相对数 分子变量分子变量分子变量分子变量分母变量分母变量分母变量分母变量则有:则有:己知己知己知己知,采用基本,采用基本,采用基本,采用基本平均数公式平均数公式平均数公式平均数公式己知己知己知己知 ,采用加权算术采用加权
12、算术采用加权算术采用加权算术平均数公式平均数公式平均数公式平均数公式己知己知己知己知 ,采用加权调和采用加权调和采用加权调和采用加权调和平均数公式平均数公式平均数公式平均数公式比值比值比值比值1.由相对数计算平均数由相对数计算平均数【例例4】根据下表资料计算该地区全部商店的根据下表资料计算该地区全部商店的平均流通费用率。平均流通费用率。商店按年商品商店按年商品流转额分组流转额分组/万元万元各组商店平各组商店平均流通费用均流通费用率率X/%流转额流转额f/万元万元流通费用流通费用m=Xf/万元万元100以下以下100-200200-300300-400400-500500以上以上 11.5 11
13、.09.4 7.86.65.7 1001050325024501800110011.5 115.5 305.5 191.1 118.862.7合计合计9750805.1 【解解】:如果只有第:如果只有第1、2栏资料,没有第栏资料,没有第3栏栏资料,这时需要用加权算数平均法进行计算,资料,这时需要用加权算数平均法进行计算,即六个组的平均费用率为:即六个组的平均费用率为:现在假定如果掌握的资料中没有第现在假定如果掌握的资料中没有第2栏,栏,只有第只有第1栏和第栏和第3栏,那么需要用调和平均法栏,那么需要用调和平均法进行计算,即平均流通费用率为:进行计算,即平均流通费用率为:2.由平均数计算平均数由
14、平均数计算平均数 【例例5】已知某商品在市场上的平均价格以及已知某商品在市场上的平均价格以及销售量资料如下表所示,现依据表中资料计销售量资料如下表所示,现依据表中资料计算总平均价格。算总平均价格。市场市场平均价格平均价格X(元(元/千克)千克)销售量销售量f/千克千克销售额销售额M=Xf/元元甲甲乙乙丙丙 1.80 2.20 1.80 30000 20000 25000 54000 44000 45000 合计合计 75000 143000 解:解:若已知销售量,需要加权算数平均若已知销售量,需要加权算数平均法。法。若未知销售量,直接掌握销售额,则若未知销售量,直接掌握销售额,则应用加权调和平
15、均数。应用加权调和平均数。(四)几何平均数(四)几何平均数几何平均数是几何平均数是N N项变量值连乘积的开项变量值连乘积的开N N次方根。次方根。用于计算现象的平均比率或平均速度。用于计算现象的平均比率或平均速度。应用:应用:qq各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;各个比率或速度的连乘积等于总比率或总速度;qq相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条件:1.简单几何平均数简单几何平均
16、数 适用于总体资料未经分组整理尚为适用于总体资料未经分组整理尚为原始资料的情况。原始资料的情况。其计算公式为:其计算公式为:【例例6】某流水生产线有前后衔接的五道工序。某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为某日各工序产品的合格率分别为95、92、90、85、80,求整个流水生产线产品的平,求整个流水生产线产品的平均合格率。均合格率。因该流水线的最终合格品即为第五道工序因该流水线的最终合格品即为第五道工序的合格品,的合格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格
17、率为:即该流水线总的合格率等于各工序合格率即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故的连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。需采用几何平均法计算。若上题中不是由五道连续作业的工序组若上题中不是由五道连续作业的工序组成的流水生产线,而是成的流水生产线,而是五个独立作业五个独立作业的车间,的车间,且各车间的合格率同前,又假定各车间的产且各车间的合格率同前,又假定各车间的产量相等均为量相等均为100件,求该企业的平均合格率。件,求该企业的平均合格率。不再符合几何平均数的适用条件,需按照求解相不再符合几何平均数的适用条件,需按照求解相对数的平均数的方
18、法计算。又因为对数的平均数的方法计算。又因为应采用加权算术平均数公式计算,即应采用加权算术平均数公式计算,即2.加权几何平均数加权几何平均数 适用于总体资料经过分组整理形成适用于总体资料经过分组整理形成变量数列的情况。变量数列的情况。其计算公式为:其计算公式为:【例例7】某某金融机构以复利计息。近金融机构以复利计息。近12年来的年来的年利率有年利率有4年为年为 3,2年为年为5,2年为年为8,3年年为为10,1年为年为15。求平均年利率。求平均年利率。设本金为设本金为V,则至各年末的本利和应为:则至各年末的本利和应为:第第1年末本利和为:年末本利和为:第第2年末本利和为:年末本利和为:第第12
19、年末本利和为:年末本利和为:第第2年的计年的计息基础息基础第第12年的计年的计息基础息基础则该笔本金则该笔本金12年总的本利率为:年总的本利率为:即即12年总本利率等于各年本利率的连乘积年总本利率等于各年本利率的连乘积,符合几何平均数的适用条件,故计算平均年符合几何平均数的适用条件,故计算平均年本利率应采用几何平均法。本利率应采用几何平均法。解解:若上题中不是按复利而是按若上题中不是按复利而是按单利计息单利计息,且各年的利率与上相同,求平均年利率。且各年的利率与上相同,求平均年利率。分分析析第第1年末的应得利息为年末的应得利息为:第第2年末的应得利息为年末的应得利息为:第第12年末的应得利息为
20、:年末的应得利息为:设本金为设本金为V,则各年末应得利息为:则各年末应得利息为:则该则该笔本金笔本金12年应得的利息总和为:年应得的利息总和为:=V(0.034+0.052+0.151)这里的利息率或本利率不再符合几何这里的利息率或本利率不再符合几何平均数的适用条件,需按照求解比值的平平均数的适用条件,需按照求解比值的平均数的方法计算。因为均数的方法计算。因为假定本假定本金为金为V 所以,应采用加权算术平均数公式计算平所以,应采用加权算术平均数公式计算平均年利息率,即均年利息率,即:解:解:(五)(五)数值平均数计算公式的选用顺序数值平均数计算公式的选用顺序是否为比率是否为比率或速度或速度各个
21、比率或速各个比率或速度的连乘积是否等于总比度的连乘积是否等于总比率或总速度率或总速度是否为是否为其他比值其他比值是是是是否否否否否否否否是是是是否否否否是是是是 几何平均法几何平均法算术平均法算术平均法求解比值的平均数的方法求解比值的平均数的方法指标指标三、位置平均数三、位置平均数 (一)众数(一)众数 指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示,它不受极端数值的影响,用来说表示,它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。明总体中大多数单位所达到的一般水平。众数的确定:众数的确定:1.单项数列单项数列确定众数的方法:出现次数最多的标志确定众数的
22、方法:出现次数最多的标志值就是众数。值就是众数。例如,已知例如,已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800800计算该企业该日全部工人日产量的众数。计算该企业该日全部工人日产量的众数。2.组距数列组距数列确定众数的方法确定众数的方法由由最多次数来确定众数所在组最多次数来确定众数所在组按按公式计算众数公式计算众数【例例8 8】某厂工人生产某种零件数量的资料如某厂工人生产某种零件数量的资料如下,计算众数:下,计算众数:月生产零件数量月生产零件数量/个个工人人数工
23、人人数/人人200以下以下200400400600600以上以上 3 732 8合计合计50月产量(件)工人人数(人)向上累计次数(人)200以下200400400600600以上 3 732 8 3104250合计50出生1981.01980.01979.01978.01977.01976.01975.0160140120100806040200没有突出地集中在没有突出地集中在某个年份某个年份413名学生出生时间分布直方图名学生出生时间分布直方图众数的原理及应用众数的原理及应用(无众数)(无众数)众数的原理及应用众数的原理及应用192.5190.5188.5186.5184.5182.518
24、0.5178.5176.5174.5172.5170.5168.5166.5164.5162.5160.5158.5156.5154.5152.5150.5148.56050403020100413413名学生的身高分布直方图名学生的身高分布直方图名学生的身高分布直方图名学生的身高分布直方图(双众数)(双众数)当数据分布呈现出双众数或多众数时,可以当数据分布呈现出双众数或多众数时,可以断定这些数据来源于不同的总体。断定这些数据来源于不同的总体。出现了两个明显出现了两个明显的分布中心的分布中心(二)中位数(二)中位数 1.概念:概念:将总体各单位标志值按大小顺序排列后,将总体各单位标志值按大小顺
25、序排列后,指处于数列中间位置的标志值,用指处于数列中间位置的标志值,用 表示。表示。不受不受极端数值的影响,在总体标志值差异很大极端数值的影响,在总体标志值差异很大时,具有较强的代表性。时,具有较强的代表性。2.中位数的作用:中位数的作用:中位数的确定中位数的确定1.由由未分组未分组资料确定中位数资料确定中位数(1)对某个标志值按大小顺序资料加以排列;)对某个标志值按大小顺序资料加以排列;(2)然后用下列公式确定中位数的位置。)然后用下列公式确定中位数的位置。n为偶数为偶数n为奇数为奇数中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例9 9】某售
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学基础 第三章 数据分布特征的描述 统计学 基础 第三 数据 分布 特征 描述
限制150内