用统计量描述数据.ppt
《用统计量描述数据.ppt》由会员分享,可在线阅读,更多相关《用统计量描述数据.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 3 章章 用统计数据描述数据用统计数据描述数据统计学第第 3章章 用统计数据描述数据用统计数据描述数据3.1 水平水平(集中趋势集中趋势)的测度的测度 3.2 差异差异(离散程度离散程度)的测度的测度3.3 分布形状分布形状(偏态与峰态偏态与峰态)的测度的测度学习目标学习目标1.集中趋势各测度值的计算方法集中趋势各测度值的计算方法2.集中趋势各测度值的特点及应用场合集中趋势各测度值的特点及应用场合3.离散程度各测度值的计算方法离散程度各测度值的计算方法4.离散程度各测度值的特点及应用场合离散程度各测度值的特点及应用场合5.偏态与峰态的测度方法偏态与峰态的测度方法用用Excel计算描述统计
2、量并进行分析计算描述统计量并进行分析数据分布的特征数据分布的特征集中趋势集中趋势集中趋势集中趋势 (位置位置位置位置)偏态和峰态偏态和峰态偏态和峰态偏态和峰态(分布形状)(分布形状)(分布形状)(分布形状)离中趋势离中趋势离中趋势离中趋势 (分散程度分散程度分散程度分散程度)数据分布特征的测度数据分布特征的测度数据特征的测度数据特征的测度分布的形状分布的形状集中趋势集中趋势离散程度离散程度众众众众众众 数数数数数数中位数中位数中位数中位数中位数中位数均均均均均均 值值值值值值离散系数离散系数离散系数离散系数离散系数离散系数方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差方差和标准差
3、峰峰峰峰峰峰 态态态态态态四分位差四分位差四分位差四分位差四分位差四分位差异众比率异众比率异众比率异众比率异众比率异众比率偏偏偏偏偏偏 态态态态态态3.1 集中趋势的测度集中趋势的测度3.1.1 众数众数3.1.2 中位数和分位数中位数和分位数3.1.3 均值均值3.1.4 众数、中位数和均值的比较众数、中位数和均值的比较集中趋势集中趋势(Central tendency)一一一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度 测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心
4、值测度集中趋势就是寻找数据水平的代表值或中心值测度集中趋势就是寻找数据水平的代表值或中心值 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值 低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据众数众数众
5、数(mode)出现次数最多的变量值出现次数最多的变量值不受极端值的影响不受极端值的影响一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和主要用于分类数据,也可用于顺序数据和数值型数据数值型数据众数众数(不唯一性不唯一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 42分类数据的众数分类数据的众数(例题分析例题分析)解解解解:这这这这里里里里的的的的变变变变量量量量为为为为“饮饮饮饮料料料料品品品品牌牌牌牌”,这这这这是是是是个个个
6、个分分分分类类类类变变变变量量量量,不不不不同同同同类类类类型型型型的的的的饮饮饮饮料料料料就就就就是是是是变变变变量量量量值值值值 在在在在所所所所调调调调查查查查的的的的5050人人人人中中中中,购购购购买买买买可可可可口口口口可可可可乐乐乐乐的的的的人人人人数数数数最最最最多多多多,为为为为1515人人人人,占占占占总总总总被被被被调调调调查查查查人人人人数数数数的的的的30%30%,因因因因此此此此众众众众数数数数为为为为“可口可乐可口可乐可口可乐可口可乐”这一品牌,即这一品牌,即这一品牌,即这一品牌,即 MMo o可口可乐可口可乐可口可乐可口可乐中位数和分位数中位数和分位数中位数(m
7、edian)排序后处于中间位置上的值排序后处于中间位置上的值MMe e50%50%不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据用于分类数据用于分类数据各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即中位数的计算n为奇数为奇数n为偶数为偶数数值型数据的中位数数值型数据的中位数(
8、9个数据的算例个数据的算例)【例【例2】:】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9中位数中位数 1080数值型数据的中位数数值型数据的中位数(10个数据的算例个数据的算例)【例【例3】:】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 四分位
9、数四分位数(quartile)排序后处于25%和75%位置上的值不受极端值的影响不受极端值的影响主主要要用用于于顺顺序序数数据据,也也可可用用于于数数值值型型数数据据,但不能用于分类数据但不能用于分类数据QQL LQQMMQQU U25%25%25%25%四分位数四分位数(位置的确定位置的确定)数值型数据的四分位数数值型数据的四分位数(9个数据的算例个数据的算例)【例【例4】:】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位
10、位 置置:1 2 3 4 5 6 7 8 9数值型数据的四分位数数值型数据的四分位数(10个数据的算例个数据的算例)【例【例5】:】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 数值型数据:平均数数值型数据:平均数(均值均值)均值均值(mean)集中趋势的最常用测度值集中趋势的最常用测度值一组数据的均衡点所在一组数据的均衡点所在体现了数据的必然性特征体现了数据的必然性特征易受极端值的影响易受极端值的影响用于数值型数据,不能用于分类数据和顺用于数值型数据,不能用
11、于分类数据和顺序数据序数据简单均值与加权均值简单均值与加权均值(simple mean/weighted mean)设一组数据为:设一组数据为:设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n各组的组中值为:各组的组中值为:各组的组中值为:各组的组中值为:MM1 1,MM2 2,MMk k 相应的频数为:相应的频数为:相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k简单均值简单均值简单均值简单均值加权均值加权均值加权均值加权均值已改至此!已改至此!加权平均数加权平均数 (例题分析例题分析)几何平均数几何平均数(geometric mean)n 个变量值乘
12、积的个变量值乘积的 n 次方根次方根适用于对比率数据的平均适用于对比率数据的平均主要用于计算平均增长率主要用于计算平均增长率计算公式为计算公式为5.5.可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形可看作是均值的一种变形几何平均数几何平均数(例题分析例题分析)【例例】某某水水泥泥生生产产企企业业1999年年的的水水泥泥产产量量为为100万万吨吨,2000年年与与1999年年相相比比增增长长率率为为9%,2001年年与与2000年年相相比比增增长长率率为为16%,2002年年与与2001年年相相比比增增长长率率为为20%。求求各各年年的的年年平平均均增增长率。长率。年平均增长
13、率年平均增长率年平均增长率年平均增长率114.91%-1=14.91%114.91%-1=14.91%几何平均数(例题分析)【例例】一位投资者购持有一种股票,在2000、2001、2002和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率 算术平均:算术平均:算术平均:算术平均:几何平均:几何平均:几何平均:几何平均:众数、中位数和均值的比较众数、中位数和均值的比较众数、中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分
14、布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值众数、中位数和均值的特点和应用众数、中位数和均值的特点和应用众数众数不受极端值影响不受极端值影响具有不唯一性具有不唯一性数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用中位数中位数不受极端值影响不受极端值影响数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用均值均值易受极端值影响易受极端值影响数学性质优良数学性质优良数据对称分布或接近对称分布
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 描述 数据
限制150内