欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学第二章描述.ppt

    • 资源ID:77543784       资源大小:3.65MB        全文页数:108页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学第二章描述.ppt

    统计学第二章描述本章重点本章重点尺度尺度尺度尺度形态形态形态形态分位数分位数分位数分位数箱线图箱线图箱线图箱线图位置位置位置位置詹姆斯詹姆斯312527381913211923332829363222312538262522493725612436182718352829152030322428352522384331343230352525223424331830252226731172142271517212532303219222926241317263213233630262130222717173734332139杜兰特杜兰特3132254342293037182825253827282654333038313327513731363436242536273528263729292015262335422633243333281538302833301727333930282938414832323727362842433221302523403331273636482824333642293441462431191342 詹姆斯詹姆斯杜兰特杜兰特詹姆斯詹姆斯分布形态分布形态钟型分布钟型分布(bell shaped)钟型分布中间观测值分布多,越往两侧分布钟型分布中间观测值分布多,越往两侧分布越少。因其形状像钟而得名。越少。因其形状像钟而得名。根据分布的对称性,钟型分布又可分为对称根据分布的对称性,钟型分布又可分为对称分布、左偏分布和右偏分布分布、左偏分布和右偏分布对称分布对称分布(symmetry)对称分布对称分布对称分布对称分布左偏左偏(left skewed)左偏左偏左偏左偏右偏右偏(right skewed)右偏右偏右偏右偏正态分布正态分布(normal distribution)也叫高斯分布(也叫高斯分布(gaussian distribution)是一)是一种完美的、对称的钟型分布,可以用函数精确种完美的、对称的钟型分布,可以用函数精确地表达出来地表达出来实践中大量的变量逼近正态分布,换而言之,实践中大量的变量逼近正态分布,换而言之,一个变量大约成正态分布才是正常一个变量大约成正态分布才是正常(normal)的)的杜兰特杜兰特对对比比双直方图双直方图(bi-histogram)对对比比描述描述 位置(位置(location):中心():中心(center)尺度(尺度(scale):差异():差异(variability)或离散)或离散(spread)形态(形态(shape)第一节第一节 位置位置均值(均值(mean)众数众数(mode)中位数中位数(median)分位数分位数(quantile)均值均值 观测值之和除以观测值数目观测值之和除以观测值数目中位数 中间位置上的数中间位置上的数观测值从小到大排列观测值从小到大排列中间位置:(中间位置:(n-1)/2+1中位数 排序:排序:中间位置:(中间位置:(n-1)/2+1=(101-1)/2+1=51中位数:中位数:31众数 分布次数(频数)最多的观测值分布次数(频数)最多的观测值次数分布次数分布找到分布最多的观测值找到分布最多的观测值众数不一定存在,也不一定唯一众数不一定存在,也不一定唯一事实上,连续型变量很难精确地找到众数事实上,连续型变量很难精确地找到众数众数位置 分布分布众数 位置:最多分布为位置:最多分布为9众数:众数:33分位数 q分分位位数数:观观测测值值从从小小到到大大排排序序后后,q等等分分,处处于于分界点上的数分界点上的数二分位数(中位数)二分位数(中位数)三分位数(三分位数(tertiles)四分位数(四分位数(quartiles)五分位数(五分位数(quintiles)六分位数(六分位数(sextiles)十分位数(十分位数(deciles)十二分位数(十二分位数(duo-deciles)二十分位数(二十分位数(vigintiles)百分位数(百分位数(percentiles)千分位数(千分位数(permilles)四分位数四分位数 观测值按大小顺序排列后,均分为四部分,观测值按大小顺序排列后,均分为四部分,处于分界点上的数处于分界点上的数2/4位置位置:中位数中位数1/4位置位置:下四分位数下四分位数3/4位置位置:上四分位数上四分位数 四分位数 詹姆斯詹姆斯:杜兰特杜兰特:月薪月薪 从某公司随机抽取从某公司随机抽取13位职工,调查他们的月薪如下:位职工,调查他们的月薪如下:2000 2600 3500 1800 2500 4800 2800 3000 2200 3300 5200 4600 4000四分位数位置四分位数位置176543213121110984710十分位数位置十分位数位置176543213121110982.23.44.65.878.29.410.611.8分位数位置 第第k个个q分位数的位置分位数的位置:位置汇总位置汇总 均值均值:27.13中位数中位数:26众数众数:25下四分位数下四分位数:22上四分位数上四分位数:32均值均值:31.62中位数中位数:31众数众数:33下四分位数下四分位数:27上四分位数上四分位数:36练习练习求求30家经销商销量均值、中位数、众数、四家经销商销量均值、中位数、众数、四分位数、十分位数分位数、十分位数525248485454616147473636515158584343393969694747494968684343474759595454686846465353343428282020383841417373474751517878第二节第二节 尺度尺度绝对平均差(绝对平均差(average absolute deviation)方差(方差(variance)标准差(标准差(standard deviation)全距(全距(range)四分位距(四分位距(inter-quartile range)绝对中位差(绝对中位差(median absolute deviation)散点图散点图均值差异差异(离散离散)中心化中心化(centering)中心化中心化 合计合计不为0绝对值绝对值 绝对平均差绝对平均差 平方平方方差方差 自由度自由度计算样本方差时应除以计算样本方差时应除以n-1,而不是,而不是n这里这里n-1叫自由度(叫自由度(degree of freedom),表示样本可自由取值的数目表示样本可自由取值的数目自由度?自由度?如果某班只有1位学生,身高为172如果从某班抽取1位学生调查其身高为172总体无差异无法获知总体差异标准差标准差 变异系数变异系数(coefficient of variation)标准差只能度量绝对差异,而不能度量相对差异标准差只能度量绝对差异,而不能度量相对差异变异系数变异系数全距全距 四分位距 绝对中位差绝对中位差 尺度汇总尺度汇总 绝对平均差绝对平均差:6.31方差方差:67.3标准差标准差:8.20变异系数:变异系数:0.302全距全距:54四分位距四分位距:10绝对中位差:绝对中位差:5绝对平均差绝对平均差:5.96方差方差:59.0标准差标准差:7.68变异系数:变异系数:0.243全距全距:41四分位距四分位距:9绝对中位差:绝对中位差:5总体均值和方差总体均值和方差 假设知道总体的数据,则可计算总体均值和方差假设知道总体的数据,则可计算总体均值和方差因为总体是唯一的,总体均值和方差也是唯一的,因为总体是唯一的,总体均值和方差也是唯一的,故也称总体参数(故也称总体参数(parameter)实际中只能用样本均值和方差去估计总体实际中只能用样本均值和方差去估计总体练习练习求求10家经销商销量的绝对平均差、方差、标准家经销商销量的绝对平均差、方差、标准差、变异系数、全距、四分位距、绝对中位差差、变异系数、全距、四分位距、绝对中位差5252484854546161484836365151585843433939极端值(极端值(extremes)也叫离群值(也叫离群值(outliers),指明显偏离主体数据),指明显偏离主体数据的值。极端值应给予特别关注:的值。极端值应给予特别关注:观测错误观测错误特殊情况特殊情况判定判定3倍标准差倍标准差1.5倍四分位距倍四分位距准则准则极小值极大值标准化(无尺度化)标准化(无尺度化)极小值极大值准则准则极小值极大值讨论讨论判断判断30家经销商销量的极端值家经销商销量的极端值5252484854546161474736365151585843433939696947474949686843434747595954546868160160535334342828101038384141737347475151278278月薪月薪正常数据正常数据有极大值数据有极大值数据右偏右偏正常正常右偏右偏月薪月薪正常数据正常数据有极小值数据有极小值数据左偏左偏正常正常左偏左偏月薪月薪正常数据正常数据既有极大值,又有极小值数据既有极大值,又有极小值数据尖峰(厚尾)尖峰(厚尾)正常正常尖峰(厚尾)尖峰(厚尾)销量销量正常数据正常数据有极大值数据有极大值数据位置描述位置描述 均值均值:50.1中位数中位数:48.5众数众数:47均值均值:63.9中位数中位数:50众数众数:47正常极大值尺度描述尺度描述 正常极大值绝对平均差绝对平均差:9.87方差方差:171.4标准差标准差:13.1变异系数:变异系数:0.26全距全距:58四分位距四分位距:10绝对中位差:绝对中位差:6.5绝对平均差绝对平均差:28.85方差方差:5768.5标准差标准差:76.0变异系数:变异系数:1.19全距全距:440四分位距四分位距:10绝对中位差:绝对中位差:8.5稳健稳健(robust)诸如中位数、四分位距、绝对中位差的只受主体诸如中位数、四分位距、绝对中位差的只受主体数据影响不受极端值影响的统计量成为稳健统计数据影响不受极端值影响的统计量成为稳健统计量量稳健统计量意味着缺乏敏感性稳健统计量意味着缺乏敏感性 调整均值调整均值中间均值(中间均值(mid-mean):用):用25%75%分位分位数之间的数据计算均值数之间的数据计算均值切尾均值(切尾均值(trimmed mean):用):用5%95%分位数之间的数据计算均值分位数之间的数据计算均值缩尾均值(缩尾均值(winsorized mean):将):将5%分位数分位数之前的数据替为之前的数据替为5%分位数,分位数,95%之后的数据替之后的数据替为为95%分位数,再计算均值分位数,再计算均值 讨论讨论求求30家经销商销量均值、中间均值、切尾均家经销商销量均值、中间均值、切尾均值、缩尾均值值、缩尾均值52524848545461614747363651515858434339396969474749496868434347475959545468684604605353343428282020383841417373474751517878第三节第三节 形态形态偏度(偏度(skewness)峰度(峰度(kurtosis)中心化数据(一次方)中心化数据(一次方)二次方二次方三次方三次方四次方四次方汇总图汇总图中心矩(中心矩(central moment)二阶中心矩即为方差二阶中心矩即为方差三阶中心矩可度量偏度三阶中心矩可度量偏度四阶中心矩可度量峰度四阶中心矩可度量峰度偏度偏度标准化(无尺度化)三阶中心矩标准化(无尺度化)三阶中心矩偏度大于偏度大于0为右偏,小于为右偏,小于0为左偏为左偏峰度峰度标准化(无尺度化)四阶中心矩标准化(无尺度化)四阶中心矩正态分布的峰度为正态分布的峰度为3,因此峰度大于,因此峰度大于3为尖为尖峰(厚尾),小于峰(厚尾),小于3为平峰(薄尾)。超为平峰(薄尾)。超额峰度(额峰度(excess kurtosis):):形态形态 偏度偏度:0.705峰度峰度:4.99超额峰度超额峰度:1.99偏度偏度:0.249峰度峰度:3.29超额峰度超额峰度:0.29讨论讨论求求10家经销商销量的偏度和峰度家经销商销量的偏度和峰度5252484854548181484836365151585843431919箱线图(箱线图(box plotbox plot)5点:点:P1:P2:P3:P4:P5:绘图绘图P1P2P3P4P5箱线图可以看出箱线图可以看出位置(中心)位置(中心)尺度(差异或离散)尺度(差异或离散)偏态和峰态偏态和峰态极端值极端值 对比对比练习练习 相对湿度(相对湿度(%)月份月份北京北京长春长春南京南京郑州郑州武汉武汉广州广州成都成都昆明昆明兰州兰州西安西安123456789101112494147505557697468476656706850395654707966595957767177726873828271758282575768676357747167537765777581757174817371727882728080848387868481807275798381797582847875787882656558615872847477767171514149464143585755455352676774705842625565657372湿度湿度第四节第四节 其它其它 分组数据(分组数据(grouped data)质量变量的描述质量变量的描述分组数据分组数据销量销量组中值组中值频数频数 302029303940495059606970792410842分组数据分组数据销售售额组中中值频数数20以下以下203030404050506060以上以上1525354555651 15 5111110106 63 33636加权平均加权平均均值均值方差方差其中,其中,x为组中值,为组中值,f为权数为权数加权平均加权平均销售额销售额x xf f2020以下以下15151 11515-26.67-26.67 711.11 711.11 711.11 711.11 2030203025255 5125125-16.67-16.67 277.78 277.78 1388.89 1388.89 3040304035351111385385-6.67-6.67 44.44 44.44 488.89 488.89 40504050454510104504503.33 3.33 11.11 11.11 111.11 111.11 5060506055556 633033013.33 13.33 177.78 177.78 1066.67 1066.67 6060以上以上65653 319519523.33 23.33 544.44 544.44 1633.33 1633.33 36361500150054005400 计算计算加权的意义加权的意义较较 之之 简简 单单(simple)平平 均均,加加 权权(weighted)平平均均意意味味着着观观测测值值在在均均值值中的重要性会随着权数调整中的重要性会随着权数调整简单平均可看作加权平均的特例简单平均可看作加权平均的特例众数众数 销售售额频数数20以下以下203030404050506060以上以上1 15 5111110106 63 33636 3061d10-d中位数中位数 销售售额频数数累累计20以下以下203030404050506060以上以上1 15 5111110106 63 3161727333636364050练习练习求工资的平均数、标准差、众数、中位数、求工资的平均数、标准差、众数、中位数、求工资的平均数、标准差、众数、中位数、求工资的平均数、标准差、众数、中位数、四分位数四分位数四分位数四分位数月工资(元)月工资(元)人数(人)人数(人)2000以下以下200025002500300030003500350040004000以上以上2018253084合计合计105质量变量的描述质量变量的描述位置:众数。定序变量还可以计算中位数。位置:众数。定序变量还可以计算中位数。尺度:异众比率(尺度:异众比率(variation ratio)讨论讨论受教育程度受教育程度人口数(万)人口数(万)大学(指大专以上)大学(指大专以上)11964 11964 高中(含中专)教育高中(含中专)教育18799 18799 初中教育初中教育51966 51966 小学教育小学教育35876 35876 未接受教育未接受教育15367 15367 合计合计133972133972计算我国人口受教育程度的众数、中位数、异众比率计算我国人口受教育程度的众数、中位数、异众比率回顾回顾均值、众数、中位数均值、众数、中位数分位数分位数方差、标准差方差、标准差四分位距四分位距偏度、峰度偏度、峰度箱线图箱线图加权平均加权平均谢谢

    注意事项

    本文(统计学第二章描述.ppt)为本站会员(美****子)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开