描述性统计量.ppt
《描述性统计量.ppt》由会员分享,可在线阅读,更多相关《描述性统计量.ppt(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、描述性统计量现在学习的是第1页,共52页11.1 11.1 集中趋势的测度集中趋势的测度指总体中各单位的次数分布从两边向指总体中各单位的次数分布从两边向中间集中的趋势,中间集中的趋势,用用平均指标平均指标来反映。来反映。集中趋势集中趋势又称平均数,是反又称平均数,是反映社会经济现象总映社会经济现象总体各单位某一数量体各单位某一数量标志在一定时间、标志在一定时间、地点和条地点和条件下所达件下所达到的一般水平的综到的一般水平的综合指标。合指标。数值平均数数值平均数位置平均数位置平均数算术平均数算术平均数调和平均数调和平均数几何平均数几何平均数中位数中位数众数众数平平均均数数现在学习的是第2页,共5
2、2页基本形式:基本形式:例:例:算术平均数算术平均数现在学习的是第3页,共52页算术平均数的计算算术平均数的计算算术平均数算术平均数=总体标志总量总体标志总量总体单位总数总体单位总数数据集数据集数据个数数据个数 N简单算术平均数简单算术平均数现在学习的是第4页,共52页A.简单算术平均数简单算术平均数 适用于总体资料未经适用于总体资料未经分组整理、尚为原始资料分组整理、尚为原始资料的情况的情况式中:式中:为算术平均数为算术平均数;为总体单位总数;为总体单位总数;为第为第i i 个单位的标志值。个单位的标志值。算术平均数的计算方法算术平均数的计算方法现在学习的是第5页,共52页平均每人日销售额为
3、:平均每人日销售额为:算术平均数的计算方法算术平均数的计算方法某售货小组某售货小组5 5个人,某天的销售额个人,某天的销售额分别为分别为520520元、元、600600元、元、480480元、元、750750元、元、440440元,则元,则【例例】未分组数据未分组数据现在学习的是第6页,共52页算术平均数的计算方法算术平均数的计算方法分组数据分组数据 按考试成绩分组(分)按考试成绩分组(分)组中值组中值学生人数(人)学生人数(人)组中值组中值人数人数60以下以下60707080809090以上以上556575859538897165520600765665合计合计352715平均成绩为:平均成
4、绩为:平均成绩为:平均成绩为:77.57352715X现在学习的是第7页,共52页B.加权算术平均数加权算术平均数适用于总体资料经过适用于总体资料经过分组整理形成变量数列的分组整理形成变量数列的情况情况式中:式中:为算术平均数为算术平均数;为第为第 组的次数;组的次数;为为组数;组数;为第为第 组的标志值或组中值。组的标志值或组中值。算术平均数的计算方法算术平均数的计算方法现在学习的是第8页,共52页【例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)101112131470100380150100合计合计800计算该企业
5、该日全部工人的平均日产量。计算该企业该日全部工人的平均日产量。现在学习的是第9页,共52页解:解:若上述资料为组距数列,则应取各组的若上述资料为组距数列,则应取各组的组组中值中值作为该组的代表值用于计算;此时求作为该组的代表值用于计算;此时求得的算术平均数只是其真值的得的算术平均数只是其真值的近似值近似值。说说明明现在学习的是第10页,共52页将总体各单位标志值按大小顺序排列后,将总体各单位标志值按大小顺序排列后,指处于数列中间位置的标志值,用指处于数列中间位置的标志值,用 表表示示中位数中位数(Median)不受极端数值的影响不受极端数值的影响,在总体标志值差异很大时,在总体标志值差异很大时
6、,具有较强的代表性。具有较强的代表性。中位数的作用:中位数的作用:中位数把标志值数列分为两个部分中位数把标志值数列分为两个部分,一部分标一部分标志值小于或等于它志值小于或等于它,另一部分标志值大于或等于另一部分标志值大于或等于它它.位置平均数位置平均数现在学习的是第11页,共52页中位数的位次为:中位数的位次为:即第即第3个单位的标志值就是中位数个单位的标志值就是中位数【例例A A】某售货小组某售货小组5 5个人,某天的销售额按从个人,某天的销售额按从小到大的顺序排列为小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元,则元,则中位
7、数的确定中位数的确定(未分组资料)(未分组资料)现在学习的是第12页,共52页中位数的位次为中位数的位次为中位数应为第中位数应为第3和第和第4个单位标志值的算术平均数,个单位标志值的算术平均数,即即【例例B B】若上述售货小组为若上述售货小组为6 6个人,某天的销个人,某天的销售额按从小到大的顺序排列为售额按从小到大的顺序排列为440440元、元、480480元、元、520520元、元、600600元、元、750750元、元、760760元,则元,则中位数的确定中位数的确定(未分组资料)(未分组资料)现在学习的是第13页,共52页【例例C C】某企业某日工人的日产量资料如下:某企业某日工人的日
8、产量资料如下:日产量(件)日产量(件)工人人数(人)工人人数(人)向上累计次数向上累计次数(人)(人)10111213147010038015010070170550700800合计合计800计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。中位数的位次:中位数的位次:中位数的确定中位数的确定(单值数列)(单值数列)现在学习的是第14页,共52页指总体中出现次数最多的变量值,用指总体中出现次数最多的变量值,用 表示表示,它不受极端数值的影响,用来说明它不受极端数值的影响,用来说明总体中大多数单位所达到的一般水平。总体中大多数单位所达到的一般水平。众数众数位置平均数位置
9、平均数现在学习的是第15页,共52页众数(众数(mode):出现次数最多即):出现次数最多即出现频率最高的变量值。出现频率最高的变量值。身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 152 154 154 155 155 156 156 156 156 157 158 158 159 159 160
10、160 160 160 160 160 160 160 160 160 160 160 161 161 161 161 161 161 161 162 162 162 162 162 162 162 162 163 163 163 163 164 164 164 165 165 165 165 165 165 165 165 166 166 166 166 166 167 167 167 168 168 168 168 168 168 168 169 170 170 170 170 170 171 171 172 172 172 174现在学习的是第16页,共52页众数的确定方法众数的确定方法
11、某年级某年级83名女生身高资料名女生身高资料 身高身高 人数人数(CM)(人)(人)152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高身高 人数人数(CM)(人)(人)164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1总计总计 83 现在学习的是第17页,共52页 众数、中位数和均值都是对数据集中趋势的测度,众数、中位数和均值都是对数据集中趋势的测度,1、均值均值由全部数据计算,包含了全部数据的信息,具有良好的数学性质,当数据接近对称分布时
12、,具有较好的代表性;但对于偏态分布,其代表性较差。2、中位数中位数是一组数据中间位置上的代表值,不受数据极端值的影响,对于偏态分布的数据,其代表性要比均值好。3、众数众数是一组数据分布的峰值,是一种位置的代表,当数据的分布具有明显的集中趋势时,尤其对于偏态分布,众数的代表性比均值好。4、对接近正态的分布数据,常用均值均值描述数据的集中趋势;对偏态分布,常用众数众数或中位数中位数描述数据的集中趋势。5、均值、均值只适用于定距或定比尺度的数据;定序尺度数据可用中位数中位数或众数众数进行描述,而对定类尺度数据,只能用众数众数进行描述。众数、中位数和均值的应用场合众数、中位数和均值的应用场合现在学习的
13、是第18页,共52页数据分布形状数据分布形状 Shape表明数据是如何表明数据是如何分布分布的的偏态偏态Skew Skew 与与 对称对称SymmetrySymmetry左偏左偏:均值均值 中位数中位数对称对称(零偏度零偏度):均值:均值 =中位数中位数右偏的右偏的左偏的左偏的对称的对称的均值均值=中位数中位数=众数众数均值均值 中位数中位数 众数众数众数众数 中位数中位数 均值均值现在学习的是第19页,共52页 位置测度的一种常用方法:位置测度的一种常用方法:百分位数百分位数(Percentile)p144概念:概念:第第p p个百分位数是这样的数值:至少有个百分位数是这样的数值:至少有p%
14、p%个数个数值跟它一样大或比它小;至少有值跟它一样大或比它小;至少有(100(100p)%p)%个数值个数值跟它一样大或比它大。跟它一样大或比它大。例如,一个考生入学考试的口语成绩是例如,一个考生入学考试的口语成绩是5454分,对分,对应第应第7070个百分位数,我们就可以知道大约有个百分位数,我们就可以知道大约有70%70%的考的考生成绩比他低,或者说大约有生成绩比他低,或者说大约有30%30%的考生成绩比他的考生成绩比他高。高。现在学习的是第20页,共52页 通常将数据分成四个部分是合乎需要的,通常将数据分成四个部分是合乎需要的,每一部分大约包括每一部分大约包括1/41/4或或25%25%
15、的数据,分位点的数据,分位点称为四分位数。称为四分位数。现在学习的是第21页,共52页第二节第二节 离散趋势的测度离散趋势的测度 标志变异指标标志变异指标统计上用来反映总体各单位标志值之统计上用来反映总体各单位标志值之间差异程度大小的综合指标,也称做间差异程度大小的综合指标,也称做标志变动度标志变动度。平均指标是一个代表性数值,它反映总体各单位某一数量平均指标是一个代表性数值,它反映总体各单位某一数量标志的一般水平,而把总体各单位之间的差异抽象化了。但标志的一般水平,而把总体各单位之间的差异抽象化了。但总体各单位之间的差异是客观存在的,这种差异也是统计总总体各单位之间的差异是客观存在的,这种差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 描述 统计
限制150内