《第四节标志变异指标优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四节标志变异指标优秀PPT.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四节标志变异指标第一页,本课件共有52页一、标志变动度的意义和作用标志变异指标标志变异指标也称为标志变动度,是与平均指标也称为标志变动度,是与平均指标相联系的一种综合指标。用于综合相联系的一种综合指标。用于综合反映总体各个单位标志值的差异的反映总体各个单位标志值的差异的程度。程度。总体指标和平均指标都是对总体的规模和一般水平的认识,总体指标和平均指标都是对总体的规模和一般水平的认识,但这些指标不能反映各单位的差异情况,相反地却掩盖了但这些指标不能反映各单位的差异情况,相反地却掩盖了这些差异。如:这些差异。如:变异指标值越大,平均指标的代表性变异指标值越大,平均指标的代表性越小;反之,平均指标
2、的代表性越大越小;反之,平均指标的代表性越大第二页,本课件共有52页例某车间两个生产小组各人日产量如下:甲组:20,40,60,70,80,100,120乙组:67,68,69,70,71,72,73从下图可以看出甲组离散程度大,乙组离散程度小。上一页下一页返回本节首页第三页,本课件共有52页70707070上一页下一页返回本节首页第四页,本课件共有52页上一页下一页返回本节首页标志变动度的作用标志变动度的作用q用来反映总体各单位标志值分布的离中用来反映总体各单位标志值分布的离中趋势;趋势;q可以说明平均指标的代表性程度;可以说明平均指标的代表性程度;q说明现象变动的均匀性或稳定性。说明现象变
3、动的均匀性或稳定性。第五页,本课件共有52页指所研究的数据中,最大值与指所研究的数据中,最大值与最小值之差,又称最小值之差,又称极差极差。二、全距二、全距最大变量值或最最大变量值或最高组上限或开口高组上限或开口组假定上限组假定上限最小变量值或最最小变量值或最低组下限或开口低组下限或开口组假定下限组假定下限【例例A A】某售货小组某售货小组5 5人某天的销售额分别为人某天的销售额分别为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则统计学统计学第五章第五章 变量数列分析变量数列分析第六页,本课件共有52页【例例B B】某季度某工业公司某季度
4、某工业公司1818个工业个工业企业产值计划完成情况如下:企业产值计划完成情况如下:计划完成程度计划完成程度()组中值组中值()企业数企业数(个)(个)计划产值计划产值(万元)(万元)90以下以下90100100110110以上以上8595105115231038002500172004400合计合计1824900计算该公司该季度计划完成程度的全距。计算该公司该季度计划完成程度的全距。统计学统计学第五章第五章 变量数列分析变量数列分析第七页,本课件共有52页q优点优点:计算方法简单、易懂;计算方法简单、易懂;q缺点缺点:易受极端数值的影响,不能易受极端数值的影响,不能全面反映所有标志值差异大小及
5、分全面反映所有标志值差异大小及分布状况,准确程度差布状况,准确程度差往往应用于生产过程的质量控制中往往应用于生产过程的质量控制中全距的特点全距的特点统计学统计学第五章第五章 变量数列分析变量数列分析第八页,本课件共有52页第第 个单位个单位的变量值的变量值 简单平均差简单平均差适用于未分组资料适用于未分组资料是各个数据与其算术平均数的离差是各个数据与其算术平均数的离差绝对值的算术平均数,用绝对值的算术平均数,用 表示表示三、平均差三、平均差计算公式:计算公式:总体算术总体算术平均数平均数总体单总体单位总数位总数统计学统计学第五章第五章 变量数列分析变量数列分析第九页,本课件共有52页【例例A】
6、某售货小组某售货小组5个人,某天的销售额分个人,某天的销售额分别为别为440元、元、480元、元、520元、元、600元、元、750元,元,求该售货小组销售额的平均差。求该售货小组销售额的平均差。解:解:即该售货小组即该售货小组5个人销售额的平均差为个人销售额的平均差为93.6元。元。统计学统计学第五章第五章 变量数列分析变量数列分析第十页,本课件共有52页 加权平均差加权平均差适用于分组资料适用于分组资料平均差的计算公式平均差的计算公式总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值统计学统计学第五章第五章 变量数列分析变量数列
7、分析第十一页,本课件共有52页【例例B】计算下表中某公司职工月工资的平均差。计算下表中某公司职工月工资的平均差。月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000统计学统计学第五章第五章 变量数列分析变量数列分析第十二页,本课件共有52页解:解:即该公司职工月工资的平均差为即该公司职工月工资的平均差为138.95元。元。统计学统计学第五章第五章 变量数列分析变量数
8、列分析第十三页,本课件共有52页q优点优点:不易受极端数值的影响,能综合反不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;映全部单位标志值的实际差异程度;q缺点缺点:用绝对值的形式消除各标志值与算用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作术平均数离差的正负值问题,不便于作数学处理和参与统计分析运算。数学处理和参与统计分析运算。平均差的特点平均差的特点一般情况下都是通过计算另一种标志一般情况下都是通过计算另一种标志变异指标变异指标标准差,来反映总体内标准差,来反映总体内部各单位标志值的差异状况部各单位标志值的差异状况统计学统计学第五章第五章 变量数列分析变量数
9、列分析第十四页,本课件共有52页 简单标准差简单标准差适用于未分组资料适用于未分组资料是各个数据与其算术平均数的是各个数据与其算术平均数的离差平方的算术平均数的开平离差平方的算术平均数的开平方根,用方根,用 来表示;标准差的来表示;标准差的平方又叫作方差,用平方又叫作方差,用 来表示。来表示。标准差标准差计算公式:计算公式:总体单总体单位总数位总数第第 个单位个单位的变量值的变量值总体算术平总体算术平均数均数统计学统计学第五章第五章 变量数列分析变量数列分析第十五页,本课件共有52页【例例A】某售货小组某售货小组5个人,某天的销售额分别个人,某天的销售额分别为为440元、元、480元、元、52
10、0元、元、600元、元、750元,求该元,求该售货小组销售额的标准差。售货小组销售额的标准差。解:解:(比较:其销售额的平均差为(比较:其销售额的平均差为93.6元)元)即该售货小组销售额的标准差为即该售货小组销售额的标准差为109.62元。元。统计学统计学第五章第五章 变量数列分析变量数列分析第十六页,本课件共有52页 加权标准差加权标准差适用于分组资料适用于分组资料标准差的计算公式标准差的计算公式总体算术总体算术平均数平均数第第 组变量值组变量值出现的次数出现的次数第第 组的变量组的变量值或组中值值或组中值统计学统计学第五章第五章 变量数列分析变量数列分析第十七页,本课件共有52页【例例B
11、】计算下表中某公司职工月工资的标准差。计算下表中某公司职工月工资的标准差。月工资(元)月工资(元)组中值(元)组中值(元)职工人数(人)职工人数(人)300以下以下300400400500500600600700700800800900900以上以上2503504505506507508509502083143824563052377820合计合计2000统计学统计学第五章第五章 变量数列分析变量数列分析第十八页,本课件共有52页解:解:(比较:其工资的平均差为(比较:其工资的平均差为138.95元)元)即该公司职工月工资的标准差为即该公司职工月工资的标准差为167.9元。元。统计学统计学第五
12、章第五章 变量数列分析变量数列分析第十九页,本课件共有52页由同一资料计算的标准差的结果一般要略大于平均差。由同一资料计算的标准差的结果一般要略大于平均差。证明:当证明:当a,b,c0时,有时,有 标准差的特点标准差的特点q不易受极端数值的影响,能综合反映全部不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;单位标志值的实际差异程度;q用平方的方法消除各标志值与算术平均数用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处离差的正负值问题,可方便地用于数学处理和统计分析运算理和统计分析运算.统计学统计学第五章第五章 变量数列分析变量数列分析第二十页,本课件共有5
13、2页简单标准差简单标准差加权标准差加权标准差标准差的简捷计算标准差的简捷计算避免离差平方和计算过程的出现避免离差平方和计算过程的出现目的目的:变量值平方变量值平方的平均数的平均数变量值平均变量值平均数的平方数的平方统计学统计学第五章第五章 变量数列分析变量数列分析第二十一页,本课件共有52页可比可比变异系数指标变异系数指标统计学统计学第五章第五章 变量数列分析变量数列分析第二十二页,本课件共有52页身高的差异水平:身高的差异水平:cmcm体重的差异水平:体重的差异水平:kgkg用用变异系数变异系数可以相互比较可以相互比较可可比比统计学统计学第五章第五章 变量数列分析变量数列分析第二十三页,本课
14、件共有52页平均差系数平均差系数标准差系数标准差系数变异系数指标变异系数指标用来对比不同水平的同类现象,特别是用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小不同类现象总体平均数代表性的大小:标准差系数小的总体,其平均数的标准差系数小的总体,其平均数的代表性大;反之,亦然。代表性大;反之,亦然。应用应用:统计学统计学第五章第五章 变量数列分析变量数列分析第二十四页,本课件共有52页【例例】某年级一、二两班某门课的平均成绩分某年级一、二两班某门课的平均成绩分别为别为82分和分和76分,其成绩的标准差分别为分,其成绩的标准差分别为15.6分和分和14.8分,比较两班平均成绩代表性
15、的大小。分,比较两班平均成绩代表性的大小。解:解:一班成绩的标准差系数为:一班成绩的标准差系数为:二班成绩的标准差系数为:二班成绩的标准差系数为:因为因为 ,所以一班平均成绩的代,所以一班平均成绩的代表性比二班大。表性比二班大。统计学统计学第五章第五章 变量数列分析变量数列分析第二十五页,本课件共有52页是非标志总体是非标志总体分组分组单位数单位数变量值变量值具有某一属性具有某一属性不具有某一属性不具有某一属性10合计合计为研究是非标志总体的数量特征,令为研究是非标志总体的数量特征,令指总体中全部单位只具有指总体中全部单位只具有“是是”或或“否否”、“有有”或或“无无”两种两种表现形式的标志,
16、又叫表现形式的标志,又叫交替标志交替标志是非标志是非标志统计学统计学第五章第五章 变量数列分析变量数列分析第二十六页,本课件共有52页是非标志总体的指标是非标志总体的指标具有某种标志表现的具有某种标志表现的单位数所占的成数单位数所占的成数不具有某种标志表现不具有某种标志表现的单位数所占的成数的单位数所占的成数指是非标志总体中具有某种表现或指是非标志总体中具有某种表现或不具有某种表现的单位数占全部总不具有某种表现的单位数占全部总体单位总数的比重体单位总数的比重成数成数统计学统计学第五章第五章 变量数列分析变量数列分析第二十七页,本课件共有52页是非标志总体的指标是非标志总体的指标均均值值标标准准
17、差差统计学统计学第五章第五章 变量数列分析变量数列分析第二十八页,本课件共有52页是非标志总体的指标是非标志总体的指标方差方差标准差系数标准差系数统计学统计学第五章第五章 变量数列分析变量数列分析第二十九页,本课件共有52页【例例】某厂某月份生产了某厂某月份生产了400400件产品,其中合格件产品,其中合格品品380380件,不合格品件,不合格品2020件。求产品质量分布的件。求产品质量分布的集中趋势与离中趋势。集中趋势与离中趋势。是非标志总体的指标是非标志总体的指标解:解:统计学统计学第五章第五章 变量数列分析变量数列分析第三十页,本课件共有52页三、平均差n平均差的概念与计算 平均差是各单
18、位标志值对平均数离差绝对值的平均数。计算公式上一页下一页返回本节首页第三十一页,本课件共有52页n平均差的特点:n计算方便、易于理解n指标粗糙上一页下一页返回本节首页第三十二页,本课件共有52页n例:书上P131表4-23n用加权平均数公式计算加权算术平均数2ndF,ON,7.5,30,M+,12.5,70,M+,17.5,100,M+,22.5,50,M+,27.5,10,M+,xM,结果为16.35n计算离差绝对值,分别为8.85、3.85、1.15、6.15、11.15n对离差绝对值计算加权平均数2ndF,ON,8.85,30,M+,3.85,70,M+,1.15,100,M+,6.15
19、,50,M+,11.15,10,M+,xM,结果为4.11上一页下一页返回本节首页第三十三页,本课件共有52页四、标准差n标准差的概念与计算 平均差是各单位标志值与其算术平均数离差平方的算术平均数的平方根。计算公式上一页下一页返回本节首页第三十四页,本课件共有52页n例:书上P133表4-242ndF,ON,55,10,M+,65,19,M+,75,50,M+,85,36,M+,95,27,M+,105,14,M+,115,8,M+,2ndF,RM,结果为14.85 称为方差。上一页下一页返回本节首页第三十五页,本课件共有52页五、离散系数n标志变动度的数值大小,不仅受离散程度影响,而且还受平
20、均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。n例:有两组工人日产量n甲组:60、65、70、75、80n乙组:2、5、7、9、12不能简单断言甲组离散程度大于乙组离散程度上一页下一页返回本节首页第三十六页,本课件共有52页n可以计算离散系数本例中即乙组的离散程度大于甲组。由此可见,当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。上一页下一页返回本节首页第三十七页,本课件共有52页六、用EXCEL计算描述统计量n用EXCEL计算平均数、标准差等描述性统计量有两种方法,一是用函数,二是用“数
21、据分析”工具。n第一次使用“数据分析”时,需在EXCEL工具菜单中选“加载宏”,选“分析工具库”。这样在“工具”菜单中就会出现“数据分析”。上一页下一页返回本节首页第三十八页,本课件共有52页打开“4数据描述.xls”工作簿,选择“网上冲浪”工作表。打开“工具”菜单,选择“数据分析”选项,打开数据分析对话框如图所示。上一页下一页返回本节首页第三十九页,本课件共有52页双击“描述统计”项或先单击此项再选择“确定”按钮,描述统计对话框打开如图所示。在“输入区域”中输入A1:A21。上一页下一页返回本节首页第四十页,本课件共有52页由于所选数据范围包括一个标志名称,单击“标志位于第一行”选项边上的复
22、选框。单击“输出区域”项,旁边出现了一个输入框,单击此框出现插入符,单击C1,在输入框中出现输出地址“$B$1”,这是输出结果的左上角起始位置。单击“汇总统计”,如不选此项,则Excel省略部分输出结果。上一页下一页返回本节首页第四十一页,本课件共有52页单击“确定”按钮,将产生输出结果,如下图所示。上一页下一页返回本节首页第四十二页,本课件共有52页在上表中:平均算术平均数标准误差估计标准误差,在抽样调查一章会讲到中值中位数模式众数标准偏差样本标准差s,分母除以n-1样本方差s平方峰值反映钟形分布峰高的一个指标偏斜度反映偏斜程度的一个指标区域全距,等于最大值减最小值计数单位数上一页下一页返回
23、本节首页第四十三页,本课件共有52页第五节 案例研究:“Old Faithful”间歇喷泉的喷发间歇喷泉是一种向空中喷出热水和热气的温泉,其名字的由来是因为这种喷泉要经过一段相对稳定的状态后才能喷发。有时它喷射的时间间隔不太稳定。Ohio(俄亥俄)州黄石国家公园中的“Old Faithful”间歇喷泉是世界上最著名的间歇喷泉之一。参观者们都希望到公园后不用等多久就能看到喷泉的喷发。国家公园的服务部门就在喷泉处安装了一个指示牌预报下次喷泉喷发的时间如下表所示。上一页下一页返回本章首页第四十四页,本课件共有52页开始时间持续时间预测区间预测下一次喷发时间6:351分55秒58分7:33am7:32
24、接近4秒82分8:54am8:591分51秒58分9:57am10:124分33秒89分11:41am11:461分42秒58分12:44am中午吃饭 2:061分41秒55分3:01am注:数据来源:应用线性回归第二版,作者:SWeisberg。“Old Faithful”间歇喷泉喷发时间表上一页下一页返回本节首页第四十五页,本课件共有52页那么,公园是如何得到这个结果的呢?为了了解喷泉喷发间隔时间的规律,以1978年8月至1979年8月间喷泉222次喷发)的间隔时间记录为样本(见上表)进行分析。打开”4数据描述.xls”工作簿,“喷泉“工作表。单击“工具”菜单,选择“数据分析”选项,打开“
25、直方图”对话框。在输入区域输入单元格C1:C223,选择“标志”,在输出区域中输入单元格“D1”,选择“图表输出”,单击“确定”按钮。上一页下一页返回本节首页第四十六页,本课件共有52页将所得的直方图进行修饰,便得到下图:从图中可以看出,喷泉喷发的间隔时间一般在40100分钟内变动。但是,在数据中明显地存在两个子群,它们的中心大约分别在喷发间隔55分钟和80分钟,这样在图形中间形成一个缺口。然而我们利用描述统计分析工具所得的结果与此便大不一样。上一页下一页返回本节首页第四十七页,本课件共有52页利用描述统计分析工具分析该喷泉的间隔时间,方法如下:打开“4数据描述.xls”工作簿,选择“喷泉”工
26、作表。从“工具”菜单中选择“数据分析”选项,打开“描述统计”对话框。在输入区域中输入“C1:C223”,选择标志位于第一行。“输出区域”选择D19。选择“汇总统计”和“平均数置信度”,单击“确定”按钮,结果如下表所示。上一页下一页返回本节首页第四十八页,本课件共有52页 “Old Faithfaul”喷泉间隔时间描述统计表 (表一)(表二)统计指标数值 平均数71.00901标准误差0.859024中位数75众数75标准差12.799018样本方差163.8189峰度-0.48552统计指标数值 偏度-0.48552全距53最小值42最大值95合计15764单位数222置信度1.692928上
27、一页下一页返回本节首页第四十九页,本课件共有52页由于描述统计指标的概括性与抽象性,容易使人对事物的真实情况产生误解。例如:从上表中可以看出平均间隔时间大约为71分钟。事实上,间歇时间大致呈现双峰分布,因而这一平均数并不能确切描述上述两个子群中任何一个子群的特征。按喷发持续的时间将观察值分成两组,可以对两种喷 发的不同特性在更多细节上作出检测。下表是以喷发 持续的时间是少于还是大于3分钟为依据分组,分别列 出喷发间歇时间的主要统计指标。上一页下一页返回本节首页第五十页,本课件共有52页喷泉喷发间歇时间的主要描述统计指标 间歇时间统计指标喷发时间3分钟样本数67155平均数54.46378.161标准差6.29896.8911最小值42.00053.000中位数53.00078.000最大值78.00095.000上一页下一页返回本节首页第五十一页,本课件共有52页根据上述统计指标和图表,可以得出一个简单的预测规律:一个持续时间少于3分钟的喷发将必然伴随着一个大约55分钟的间歇;一个持续时间大于3分钟的喷发将必然伴随着一个大约80分钟的间歇。并且,后者这种较长的间歇发生的可能性为67%。这样,通过一个非常简单的规则,国家公园的工作人员能够保证来黄石公园的游客不用等很长时间就会观看到“旧费尔斯福”间歇喷泉的喷发。上一页下一页返回本节首页第五十二页,本课件共有52页
限制150内