统计学第二章描述.ppt
《统计学第二章描述.ppt》由会员分享,可在线阅读,更多相关《统计学第二章描述.ppt(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学第二章描述本章重点本章重点尺度尺度尺度尺度形态形态形态形态分位数分位数分位数分位数箱线图箱线图箱线图箱线图位置位置位置位置詹姆斯詹姆斯312527381913211923332829363222312538262522493725612436182718352829152030322428352522384331343230352525223424331830252226731172142271517212532303219222926241317263213233630262130222717173734332139杜兰特杜兰特31322543422930371828252538272
2、82654333038313327513731363436242536273528263729292015262335422633243333281538302833301727333930282938414832323727362842433221302523403331273636482824333642293441462431191342 詹姆斯詹姆斯杜兰特杜兰特詹姆斯詹姆斯分布形态分布形态钟型分布钟型分布(bell shaped)钟型分布中间观测值分布多,越往两侧分布钟型分布中间观测值分布多,越往两侧分布越少。因其形状像钟而得名。越少。因其形状像钟而得名。根据分布的对称性,钟型分布又可
3、分为对称根据分布的对称性,钟型分布又可分为对称分布、左偏分布和右偏分布分布、左偏分布和右偏分布对称分布对称分布(symmetry)对称分布对称分布对称分布对称分布左偏左偏(left skewed)左偏左偏左偏左偏右偏右偏(right skewed)右偏右偏右偏右偏正态分布正态分布(normal distribution)也叫高斯分布(也叫高斯分布(gaussian distribution)是一)是一种完美的、对称的钟型分布,可以用函数精确种完美的、对称的钟型分布,可以用函数精确地表达出来地表达出来实践中大量的变量逼近正态分布,换而言之,实践中大量的变量逼近正态分布,换而言之,一个变量大约成正
4、态分布才是正常一个变量大约成正态分布才是正常(normal)的)的杜兰特杜兰特对对比比双直方图双直方图(bi-histogram)对对比比描述描述 位置(位置(location):中心():中心(center)尺度(尺度(scale):差异():差异(variability)或离散)或离散(spread)形态(形态(shape)第一节第一节 位置位置均值(均值(mean)众数众数(mode)中位数中位数(median)分位数分位数(quantile)均值均值 观测值之和除以观测值数目观测值之和除以观测值数目中位数 中间位置上的数中间位置上的数观测值从小到大排列观测值从小到大排列中间位置:(中间
5、位置:(n-1)/2+1中位数 排序:排序:中间位置:(中间位置:(n-1)/2+1=(101-1)/2+1=51中位数:中位数:31众数 分布次数(频数)最多的观测值分布次数(频数)最多的观测值次数分布次数分布找到分布最多的观测值找到分布最多的观测值众数不一定存在,也不一定唯一众数不一定存在,也不一定唯一事实上,连续型变量很难精确地找到众数事实上,连续型变量很难精确地找到众数众数位置 分布分布众数 位置:最多分布为位置:最多分布为9众数:众数:33分位数 q分分位位数数:观观测测值值从从小小到到大大排排序序后后,q等等分分,处处于于分界点上的数分界点上的数二分位数(中位数)二分位数(中位数)
6、三分位数(三分位数(tertiles)四分位数(四分位数(quartiles)五分位数(五分位数(quintiles)六分位数(六分位数(sextiles)十分位数(十分位数(deciles)十二分位数(十二分位数(duo-deciles)二十分位数(二十分位数(vigintiles)百分位数(百分位数(percentiles)千分位数(千分位数(permilles)四分位数四分位数 观测值按大小顺序排列后,均分为四部分,观测值按大小顺序排列后,均分为四部分,处于分界点上的数处于分界点上的数2/4位置位置:中位数中位数1/4位置位置:下四分位数下四分位数3/4位置位置:上四分位数上四分位数 四
7、分位数 詹姆斯詹姆斯:杜兰特杜兰特:月薪月薪 从某公司随机抽取从某公司随机抽取13位职工,调查他们的月薪如下:位职工,调查他们的月薪如下:2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600 4000四分位数位置四分位数位置176543213121110984710十分位数位置十分位数位置176543213121110982.23.44.65.878.29.410.611.8分位数位置 第第k个个q分位数的位置分位数的位置:位置汇总位置汇总 均值均值:27.13中位数中位数:26众数众数:25下四分位数下四分位数:22上四分位数
8、上四分位数:32均值均值:31.62中位数中位数:31众数众数:33下四分位数下四分位数:27上四分位数上四分位数:36练习练习求求30家经销商销量均值、中位数、众数、四家经销商销量均值、中位数、众数、四分位数、十分位数分位数、十分位数525248485454616147473636515158584343393969694747494968684343474759595454686846465353343428282020383841417373474751517878第二节第二节 尺度尺度绝对平均差(绝对平均差(average absolute deviation)方差(方差(varian
9、ce)标准差(标准差(standard deviation)全距(全距(range)四分位距(四分位距(inter-quartile range)绝对中位差(绝对中位差(median absolute deviation)散点图散点图均值差异差异(离散离散)中心化中心化(centering)中心化中心化 合计合计不为0绝对值绝对值 绝对平均差绝对平均差 平方平方方差方差 自由度自由度计算样本方差时应除以计算样本方差时应除以n-1,而不是,而不是n这里这里n-1叫自由度(叫自由度(degree of freedom),表示样本可自由取值的数目表示样本可自由取值的数目自由度?自由度?如果某班只有1
10、位学生,身高为172如果从某班抽取1位学生调查其身高为172总体无差异无法获知总体差异标准差标准差 变异系数变异系数(coefficient of variation)标准差只能度量绝对差异,而不能度量相对差异标准差只能度量绝对差异,而不能度量相对差异变异系数变异系数全距全距 四分位距 绝对中位差绝对中位差 尺度汇总尺度汇总 绝对平均差绝对平均差:6.31方差方差:67.3标准差标准差:8.20变异系数:变异系数:0.302全距全距:54四分位距四分位距:10绝对中位差:绝对中位差:5绝对平均差绝对平均差:5.96方差方差:59.0标准差标准差:7.68变异系数:变异系数:0.243全距全距:
11、41四分位距四分位距:9绝对中位差:绝对中位差:5总体均值和方差总体均值和方差 假设知道总体的数据,则可计算总体均值和方差假设知道总体的数据,则可计算总体均值和方差因为总体是唯一的,总体均值和方差也是唯一的,因为总体是唯一的,总体均值和方差也是唯一的,故也称总体参数(故也称总体参数(parameter)实际中只能用样本均值和方差去估计总体实际中只能用样本均值和方差去估计总体练习练习求求10家经销商销量的绝对平均差、方差、标准家经销商销量的绝对平均差、方差、标准差、变异系数、全距、四分位距、绝对中位差差、变异系数、全距、四分位距、绝对中位差5252484854546161484836365151
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 第二 描述
限制150内