第三章 数据分布特征描述.ppt
《第三章 数据分布特征描述.ppt》由会员分享,可在线阅读,更多相关《第三章 数据分布特征描述.ppt(123页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第三章第三章 数据分布特征数据分布特征描述描述STAT原始原始数据数据静态静态分布分布动态动态趋势趋势总量指标总量指标(绝对规模)(绝对规模)相对指标相对指标(相对关系)(相对关系)平均指标平均指标(集中趋势)(集中趋势)变异指标变异指标(离散趋势)(离散趋势)水平指标水平指标(绝对规模)(绝对规模)速度指标速度指标(相对变化)(相对变化)因素分析因素分析(趋势预测)(趋势预测)统计统计指标指标加工加工整理整理第一节第一节 总量指标与相对指标总量指标与相对指标STAT原始原始数据数据统计统计指标指标静态静态分布分布动态动态趋势趋势总量指标总量指标相对指标相对指标平均指标平均指标变异指标变异指标
2、水平指标水平指标速度指标速度指标因素分析因素分析加工加工整理整理人口总数人口总数人口性别比例人口性别比例平均年龄平均年龄年龄标准差年龄标准差不同年份人口数不同年份人口数人口自然增长率人口自然增长率人口数量模型人口数量模型STAT无名数无名数有名数有名数用倍数、系数、成数、用倍数、系数、成数、等表示等表示用双重计量单位表示的复名数用双重计量单位表示的复名数相对指标的表现形式相对指标的表现形式成数应当用整数的形式来表述成数应当用整数的形式来表述3成、近成、近7成成8.6成成 分母分母为为1分母为分母为1.00分母分母为为10分母分母为为100分母为分母为1000STAT 第三章第三章 数据分布特征
3、描述数据分布特征描述第一节第一节 总量指标与相对指标总量指标与相对指标第二节第二节 集中趋势的测定集中趋势的测定第三节第三节 离中趋势的测定离中趋势的测定STAT问题?问题?(1)在概率论中,为什么要研究随机变量的数字特征?(2)随机变量的数字特征有哪些?一一名名统统计计学学家家遇遇到到一一位位数数学学家家,统统计计学学家家调调侃侃数数学学家家说说道道:“你你们们不不是是说说若若且且,则则吗吗!那那么么想想必必你你若若是是喜喜欢欢一一个个女女孩孩,那那么么那那个个女女孩孩喜喜欢欢的的男男孩孩你你也也会会喜喜欢欢喽喽!?”数数学学家家想想了了一一下下反反问问道道:“那那么么你你把把左左手手放放到
4、到一一锅锅一一百百度度的的开开水水中中,右右手手放放到到一一锅锅零零度度的的冰冰水水里里想想来来也也没没事事吧吧!因因为为它它们们平平均均的的温温度度不过是五十度而已!不过是五十度而已!”统计学家与数学家统计学家与数学家 如果你的脚已经踩在炉子上,如果你的脚已经踩在炉子上,而头却在冰箱里,统计学家会告而头却在冰箱里,统计学家会告诉你诉你,平均而言平均而言,你相当舒服。你相当舒服。调侃统计学家调侃统计学家 STAT第二节第二节 集中趋势的测定集中趋势的测定一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法STAT频数表频数表(用(用SPSS制作)制作)
5、有效有效数据数据频数频数频率频率有效有效频率频率累计累计频率频率约约2/3的人身高不超过的人身高不超过165cm83名女生的身高名女生的身高分布的集中趋势、分布的集中趋势、中心数值中心数值算术平均数算术平均数指总体中各单位的次数分布从两边向指总体中各单位的次数分布从两边向中间集中的趋势,中间集中的趋势,用用平均指标平均指标来反映。来反映。集中趋势集中趋势可以反映现象总体的客观规定性;可以反映现象总体的客观规定性;可以对比同类现象在不同的时间、地可以对比同类现象在不同的时间、地点和条件下的一般水平;点和条件下的一般水平;可以分析现象之间的依存关系。可以分析现象之间的依存关系。测定集中趋势的意义:
6、测定集中趋势的意义:指同质总体中各单位某一数指同质总体中各单位某一数量标志的一般水平,是对总量标志的一般水平,是对总体单位间数量差异的抽象化体单位间数量差异的抽象化STAT一、集中趋势的涵义一、集中趋势的涵义 二、平均指标的种类及计算方法二、平均指标的种类及计算方法第二节第二节 集中趋势的测定集中趋势的测定STAT二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数基本形式:基本形式:例:例:直直接接承承担担者者算术平均数算术平均数A.简单算术平均数简单算术平均
7、数 适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为算术平均数为算术平均数;为总体单位总数;为总体单位总数;为第为第 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法平均每人日销售额为:平均每人日销售额为:某售货小组某售货小组5 5个人,某天的销售额个人,某天的销售额分别为分别为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则元,则【例【例1】算术平均数的计算方法算术平均数的计算方法【例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)
8、日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。算术平均数的计算方法算术平均数的计算方法解:解:算术平均数的计算方法算术平均数的计算方法若上述资料为组距数列,则应取各组的组若上述资料为组距数列,则应取各组的组中值作为该组的代表值用于计算;此时求中值作为该组的代表值用于计算;此时求得的算术平均数只是其真值的近似值。得的算术平均数只是其真值的近似值。说说明明B.加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过分组整理形成变量数列的分组整理形成变量数列的情况情
9、况式中:式中:为算术平均数为算术平均数;为第为第 组的次数;组的次数;为组数;为组数;为第为第 组的标志值或组中值。组的标志值或组中值。算术平均数的计算方法算术平均数的计算方法分析:分析:成绩(分)成绩(分)人数(人)人数(人)甲班甲班乙班乙班丙班丙班603915010013950平均成绩(分)平均成绩(分)619980起到权衡轻起到权衡轻起到权衡轻起到权衡轻重的作用重的作用重的作用重的作用算术平均数的计算方法算术平均数的计算方法决定平均数决定平均数决定平均数决定平均数的变动范围的变动范围的变动范围的变动范围表现为次数、频数、单位数;即表现为次数、频数、单位数;即公式公式 中的中的表现为频率、
10、比重;即公式表现为频率、比重;即公式中的中的算术平均数的计算方法算术平均数的计算方法指变量数列中各组标志值出现的次指变量数列中各组标志值出现的次数,是变量值的承担者,反映了各数,是变量值的承担者,反映了各组的标志值对平均数的影响程度组的标志值对平均数的影响程度权数权数绝对权数绝对权数相对权数相对权数权数在概率论中的含义是什么?平均数又是什么?随机变量的数字特征随机变量的数字特征 离散随机变量的离散随机变量的CDF 曾宪报在其博士学位论文统计权数论曾宪报在其博士学位论文统计权数论中提出了他认为中提出了他认为“简洁性好、概括性简洁性好、概括性强强”、“关于权数的最新认识关于权数的最新认识”的定义:
11、的定义:权数是衡量系统内诸要素相对重要程度权数是衡量系统内诸要素相对重要程度的一组数值。的一组数值。权数与加权权数与加权234567819权数与加权权数与加权234567819权数与加权权数与加权234567819权数与加权权数与加权234567819算术平均数的计算取决于变算术平均数的计算取决于变量值和权数的共同作用:量值和权数的共同作用:变量值决定平均数的范围;变量值决定平均数的范围;权数则决定平均数的位置权数则决定平均数的位置变量值与其算术平均数的离差之变量值与其算术平均数的离差之和衡等于零,即:和衡等于零,即:变量值与其算术平均数的离差平变量值与其算术平均数的离差平方和为最小,即:方和
12、为最小,即:算术平均数的主要数学性质算术平均数的主要数学性质离差的概念离差的概念12345678-1-1-213思考题思考题 比特啤酒公司雇用了比特啤酒公司雇用了468468名员工,其中有名员工,其中有5656名管理人员,名管理人员,130130名行政和技术人员,名行政和技术人员,其余其余282282人是工人。这三组人的周平均工人是工人。这三组人的周平均工资分别是资分别是500500英镑、英镑、300300英镑和英镑和200200英镑。英镑。财务主管希望计算全体员工的平均工资。财务主管希望计算全体员工的平均工资。正确的计算方法正确的计算方法STAT二、平均指标的种类及计算方法二、平均指标的种类
13、及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数STAT日产量(件)日产量(件)日产量(件)日产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)各组工人日总产量(件)1010111112121313141470070011001100456045601950195014001400合计合计合计合计97109710【例【例2】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。调和平均数的应用调和
14、平均数的应用STAT即该企业该日全部工人的平均日产量为即该企业该日全部工人的平均日产量为12.1375件。件。调和平均数的应用调和平均数的应用解:解:【例】【例】设设X=(2,4,6,8),则其调和平),则其调和平均数可由定义计算如下:均数可由定义计算如下:再求算术平均数:再求算术平均数:求各标志值的倒数求各标志值的倒数:,再求倒数:再求倒数:是总体各单位标志值倒数的算术平是总体各单位标志值倒数的算术平均数的倒数,又叫均数的倒数,又叫倒数平均数。倒数平均数。调和平均数调和平均数harmean(harmonic mean)A.简单调和平均数简单调和平均数 适用于总体资料未经适用于总体资料未经分组
15、整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为调和平均数为调和平均数;为变量值为变量值 的个数;的个数;为第为第 个变量值。个变量值。调和平均数的计算方法调和平均数的计算方法B.加权调和平均数加权调和平均数适用于总体资料经过分适用于总体资料经过分组整理形成变量数列的情组整理形成变量数列的情况况式中:式中:为第为第 组的变量值;组的变量值;为第为第 组的标志总量。组的标志总量。调和平均数的计算方法调和平均数的计算方法当已知各组变量值和标志总量时,当已知各组变量值和标志总量时,作为算术平均数的变形使用。作为算术平均数的变形使用。因为:因为:调和平均数的应用调和平均数的应用调和平
16、均数的用途:调和平均数的用途:作为独立意义上的平均数使用作为独立意义上的平均数使用基本上没有用途。基本上没有用途。作为算术平均数的变形使用是作为算术平均数的变形使用是其常见的用法。但此时已经不能称其常见的用法。但此时已经不能称为调和平均数,只能称其为为调和平均数,只能称其为调和平调和平均方法均方法。求解比值的平均数的方法求解比值的平均数的方法由于比值(由于比值(平均数或相对数平均数或相对数)不能直接相)不能直接相加,求解比值的平均数时,需将其还原为加,求解比值的平均数时,需将其还原为构成比值的分子、分母原值总计进行对比构成比值的分子、分母原值总计进行对比设比值设比值 分子变量分子变量分母变量分
17、母变量则有:则有:求解比值的平均数的方法求解比值的平均数的方法己知己知 ,采用基本平采用基本平均数公式均数公式己知己知 ,采用加权算术采用加权算术平均数公式平均数公式己知己知 ,采用加权调和采用加权调和平均数公式平均数公式比值比值【例【例3】某季度某工业公司某季度某工业公司18个工业企业产个工业企业产值计划完成情况如下:值计划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)9090以下以下以下以下909010010010010011011
18、0110110以上以上以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计合计合计18182490024900计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法【例【例3】某季度某工业公司某季度某工业公司18个工业企业产个工业企业产值计划完成情况如下:值计划完成情况如下:计划完成程度计划完成程度计划完成程度计划完成程度()组中值组中值组中值组中值()企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)
19、(万元)(万元)(万元)9090以下以下以下以下9090100100100100110110110110以上以上以上以上858595951051051151152 23 310103 380080025002500172001720044004400合计合计合计合计18182490024900计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法分析:分析:应采用加权算术平均数公式计算应采用加权算术平均数公式计算【例【例4】某季度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下(按计划完成程度分组):划完
20、成情况如下(按计划完成程度分组):组别组别组别组别企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)实际产值实际产值实际产值实际产值(万元)(万元)(万元)(万元)1 12 23 34 42 23 310103 38008002500250017200172004400440068068023752375180601806050605060合计合计合计合计181824900249002617526175计算该公司该季度的平均计划完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法【例【例4】某季
21、度某工业公司某季度某工业公司18个工业企业产值计个工业企业产值计划完成情况如下(按计划完成程度分组):划完成情况如下(按计划完成程度分组):组别组别组别组别企业数企业数企业数企业数(个)(个)(个)(个)计划产值计划产值计划产值计划产值(万元)(万元)(万元)(万元)实际产值实际产值实际产值实际产值(万元)(万元)(万元)(万元)1 12 23 34 42 23 310103 38008002500250017200172004400440068068023752375180601806050605060合计合计合计合计181824900249002617526175计算该公司该季度的平均计划
22、完成程度。计算该公司该季度的平均计划完成程度。求解比值的平均数的方法求解比值的平均数的方法分析:分析:应采用平均数的基本公式计算应采用平均数的基本公式计算STAT二、平均指标的种类及计算方法二、平均指标的种类及计算方法 算术平均数算术平均数 调和平均数调和平均数 几何平均数几何平均数 中位数中位数 众数众数数值平均数数值平均数位置平均数位置平均数是是N N项变量值连乘积的开项变量值连乘积的开N N次方根次方根几何平均数几何平均数Geomean(geomatric mean)用于计算现象的平均比率或平均速度用于计算现象的平均比率或平均速度应用:应用:各个比率或速度的连乘积等于总比率或总各个比率或
23、速度的连乘积等于总比率或总速度;速度;相乘的各个比率或速度不为零或负值。相乘的各个比率或速度不为零或负值。应用的前提条件:应用的前提条件:A.简单几何平均数简单几何平均数适用于总体资料未经分组整适用于总体资料未经分组整理尚为原始资料的情况理尚为原始资料的情况式中:式中:为几何平均数为几何平均数;为变量值的为变量值的个数;个数;为第为第 个变量值。个变量值。几何平均数的计算方法几何平均数的计算方法【例【例5 5】某流水生产线有前后衔接的五道工序。某流水生产线有前后衔接的五道工序。某日各工序产品的合格率分别为某日各工序产品的合格率分别为9595、9292、9090、8585、8080,求整个流水生
24、产线产品,求整个流水生产线产品的平均合格率。的平均合格率。分析:分析:设最初投产设最初投产100A个单位个单位,则,则第一道工序的合格品为第一道工序的合格品为100A0.95;第二道工序的合格品为第二道工序的合格品为(100A0.95)0.92;第五道工序的合格品为第五道工序的合格品为(100A0.950.920.900.85)0.80;因该流水线的最终合格品即为第五道工序因该流水线的最终合格品即为第五道工序的合格品,的合格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即即该流水线
25、总的合格率等于各工序合格率的该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。采用几何平均法计算。因该流水线的最终合格品即为第五道工序因该流水线的最终合格品即为第五道工序的合格品,的合格品,故该流水线总的合格品应为故该流水线总的合格品应为 100A0.950.920.900.850.80;则该流水线产品总的合格率为:则该流水线产品总的合格率为:即该流水线总的合格率等于各工序合格率的即该流水线总的合格率等于各工序合格率的连乘积,符合几何平均数的适用条件,故需连乘积,符合几何平均数的适用条件,故需采用几何平均法计算。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三章 数据分布特征描述 第三 数据 分布 特征 描述
限制150内