欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计基础三统计描述.pptx

    • 资源ID:74016059       资源大小:261.25KB        全文页数:37页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计基础三统计描述.pptx

    统计描述与统计推断统计描述 -对数据进行收集和描述的一些方法,以得出有意义的信息统计推断 -对部分样本数据进行分析的方法,以得出对总体的预测或推断第1页/共37页统计描述-概要第2页/共37页数字量度描述数据的特性主要的数字量度:1、位置量度(中心)-分布集中趋势的测度2、离散量度(变化)-分布离散程度的测度3、形状量度(分布)-分布偏态与峰度的测度第3页/共37页1、位置量度(Measures of Location)平均值算术平均(Mean或Xbar)几何平均(G)调和平均(H)取舍平均(TrMean)中位数(Median)众数(Mode)四分位数(Quartiles)第4页/共37页平均值设有n个观察样本 x1,x2,.,xn,则样本均值为平均值是最常用的衡量位置或数据中心的量.第5页/共37页平均值设观察的总体中有N 个个体,现从中抽取n个个体进行观察,则 样本均值(sample mean)为而总体均值(population mean)(记为)则为通常总体均值是未知的,可用样本均值来估计总体均值.第6页/共37页例在1991年海湾战争的“沙漠风暴”行动中,美国空军(USAF)的 F-117A战机共出动了1270次战斗,持续时间共6905小时.因此,在这次行动中一次F-117A 任务的平均持续时间为第7页/共37页中位数(Median)把样本x1,x2,.,xn 从小到大重新排列得 x(1),x(2),.,x(n),则样本中位数(sample median)定义为中位数的一个优点是具有稳健性,受极值的影响不大.如果如果n是奇数是奇数如果如果n是偶数是偶数第8页/共37页例设样本观察值为 1 3 4 2 7 8 6 则样本均值和样本中位数分别为4.4和 4.它们都 可以合理地反映这些数据的中心位置.如果最后一个观察值改为 1 3 4 2 7 8 2450 则样本均值为 353.6 而样本中位数保持不变.第9页/共37页众数(Mode)众数是指样本中出现次数最多的观察值.众数可以是唯一的,也可以有多个,也可以不存在.第10页/共37页例设观察值为3 6 9 3 5 8 3 4 6 3 1 10 则样本众数是 3.(出现了4次)设观察值为3 6 9 3 5 8 3 4 6 3 1 10 6 2 5 6 则样本众数有两个:3和6.(各出现了4次)设观察值为1 3 4 2 7 6 8 则样本众数不存在.第11页/共37页区分区分特征特征优点优点缺点缺点均值均值Xbar1、全部数据的算术平均;、全部数据的算术平均;2、各变量值与其均值的离差之和等于各变量值与其均值的离差之和等于0;3、各变量值与其均值的离差平方和最小;、各变量值与其均值的离差平方和最小;4、调和平均(、调和平均(HM)主要用于不能直接计算均值主要用于不能直接计算均值的数据;的数据;5、几何平均(、几何平均(GM)则主要用于计算比率数据的则主要用于计算比率数据的平均数平均数6、只适用于定距(、只适用于定距(G和和H外)或定比尺度的数据外)或定比尺度的数据1、反映事物的必然性特征;、反映事物的必然性特征;2、是统计分析与统计推断的、是统计分析与统计推断的基础;基础;3、应用最广泛;、应用最广泛;4、当数据呈对称分布或接近、当数据呈对称分布或接近对称分布时,三个代表值相对称分布时,三个代表值相等或接近相等,应首选均值等或接近相等,应首选均值1、易受数据极端值的影响;、易受数据极端值的影响;2、对于偏态分布的数据,其、对于偏态分布的数据,其代表性较差代表性较差众数众数Mo1、是一组数据分布的峰值;、是一组数据分布的峰值;2、可适用于、可适用于4种度量尺度的数据种度量尺度的数据1、易于理解、易于理解2、不受极端值的影响;、不受极端值的影响;3、当数据的分布具有明显的、当数据的分布具有明显的集中趋势时,尤其是对于偏集中趋势时,尤其是对于偏态分布,其代表性比均值要态分布,其代表性比均值要好好1、不具有唯一性、不具有唯一性中位数中位数Me1、是处于一组数据中间位置上的代表值;、是处于一组数据中间位置上的代表值;2、可适用于、可适用于4种度量尺度的数据种度量尺度的数据1、不受极端值的影响;、不受极端值的影响;众数、中位数和均值的特点及应用场合第12页/共37页条件特征表达式示意图若数据具有单一众数若数据具有单一众数,且分布是且分布是对称对称的的Mo=Me=Xbar若数据是若数据是左左偏分布偏分布说明数据存在极小值说明数据存在极小值,必然拉必然拉动均值向极小值一方靠动均值向极小值一方靠,而而Mo和和Me不受极值的影响不受极值的影响XbarMeMo若数据是若数据是右右偏分布偏分布说明数据存在极大值说明数据存在极大值,必然拉必然拉动均值向极大值一方靠动均值向极大值一方靠MoMe Xbar众数、中位数和均值的关系频数频数频数第13页/共37页四分位数(Quartiles)当一个有序数据集被划分为四个相等的部分,则划分点就称为四分位点(quartiles).第一分位点(或下分位点)q1 指小于它的观察值约占25%的点.第二分位点(或中位数)q2 指小于它的观察值约占50%的点.第三分位点(或上分位点)q3 指小于它的观察值约占75%的点.第14页/共37页例把20个绝缘材料的失效时间(单位:小时)的观察值由小到大排列如下 204 228 252 300 324 444 624 720 816 9121176 1296 1392 1488 1512 2520 2856 3192 3528 3710 则第15页/共37页2、离散量度(Measures of Dispersion)极差(Range)方差(Variance)标准差(Standard Deviation)内分位极差(Inter-Quartile Range)离散系数第16页/共37页极差(Range)样本极差是指最大样本与最小样本之差.r =x(max)x(min)样本极差是反映数据离散或变化的最简单的统计量,但它忽视了中间样本的所有信息.第17页/共37页例考虑两组样本:1,3,5,8,9 和 1,5,5,5,9.它们有相同的极差(r=8).但很明显第二组样本只有头尾两个样本有变化,其余不变.因此用极差来反映离散的大小会损失许多信息.第18页/共37页方差(Variance)和 标准差(Standard Deviation)设 x1,x2,.,xn 是 n 个样本观察值,则样本方差(sample variance)定义为而样本标准差(sample standard deviation)则定义为样本方差的开方根,即第19页/共37页例设有两组样本Sample A:1,3,5,8,9 Sample B:1,5,5,5,9Sample A Sample B Range88Inter-Quartile Range50Variance11.208.00Standard Deviation3.352.83第20页/共37页方差的计算方法 1:方法 2:设有观察值:90 128 205 140 165 160 (psi)第21页/共37页例(方法1)i xi 1 90 -58 33642128 -20 4003205 57 32494140 -8 645165 17 2896160 12 144 =888=0=7510 =888 6=148 =7510 (6-1)=1502 psi第22页/共37页例(方法2)i xi xi1 90 8,100212816,384320542,025414019,600516527,225616025,600 xi=888 xi=138,934第23页/共37页总体方差和总体标准差类似于样本方差 s,我们可定义总体方差(population variance)来衡量总体的变化的大小.而总体标准差(population standard deviation)亦类似定义为总体方差的开方根.对于有限总体,设有N个个体,则第24页/共37页标准化值有了均值和标准差之后,就可以计算一组数据中各个数值的标准化值,设标准化值为Z,则有Zi=(Xi-Xbar)/在对多个具有不同量纲的指标进行处理时,常常需要对各指标进行标准化处理.此外,标准化值也给出了一组数据中各数值的相对位置.第25页/共37页内四分位点极差(Inter-Quartile Range)内四分位点极差是另外一个用于衡量离散程度的一个统计量,其定义为 IQR =q3-q1显然,内四分位点极差对极值的敏感性要比极差弱.例如对样本(1,3,5,8,9 和 1,5,5,5,9),它们的内四分位点极差分别为 5 和 0.第26页/共37页离散系数为了消除变量值水平高低和计量单位不同对离散程度测量值的影响,需要计算离散系数.它是一组数据的标准差与其相应的均值之比,是测度数据离散程度的相对指标,起计算公式为:V=/Xbar (表示总体离散系数)或 Vs =S/Xbar (表示样本离散系数)离散系数要是用于对不同组别数据的离散程度进行比较,离散系数大的说明该组数据的离散程度也就大,反之第27页/共37页离散系数例题某集团抽查了所属的8家企业,其产品销售数据如下,试比较产品销售额 与销售利润的离散程度.企业编号:1 2 3 4 5 6 7 8 产品销售额(万元)X1:170 220 390 430 480 650 950 1000 销售润(万元)X2:8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0通过计算得到通过计算得到:V1=0.577V2=0.710,故故说明产品销售额的离散程度小于销售利润的离散程度说明产品销售额的离散程度小于销售利润的离散程度请大家自己算一遍请大家自己算一遍第28页/共37页3、形状的度量(Measures of Shape)偏度(Skewness)峰度(Kurtosis)第29页/共37页偏度(Skewness)一个分布的偏斜程度称为偏度偏度为正表示分布的一边向大的方向(右)延伸.也称右偏(right-handed skew).偏度为负表示分布的一边向小的方向(左)延伸.也称左偏(left-handed skew).第30页/共37页偏度对称分布对称分布左偏(负偏左偏(负偏)分布)分布右偏(正偏)分布右偏(正偏)分布相关相关频数频数相关相关频数频数相关相关频数频数第31页/共37页偏度如果分布是对称的,则均值与中位数重合。如果还是单峰的,则均值、中位数与众数均重合如果分布是偏斜的,则均值、中位数与众数均不重合。右偏:众数 中位数 中位数 平均值第32页/共37页峰度(Kurtosis)峰度是刻画一个分布相对于正态分布而言是尖峰的还是平坦的一个度量指标。.峰度为正表示该分布的峰度高于正态分布,称为高峰态(mesokurtic)。峰度为负表示该分布的峰度低于正态分布,称为低峰态(platykurtic)。峰度仅对对称分布而言。第33页/共37页Kurtosis常峰态分布常峰态分布高峰态分布高峰态分布低峰态分布低峰态分布第34页/共37页峰度和偏度的计算第35页/共37页Excel 的描述统计量Numerical Measure Excel 的内置函数Mean =AVERAGE(data set)Median =MEDIAN(data set)Mode =MODE(data set)Quartile =QUARTILE(data set,quartile)Range =MAX(data set)MIN(data set)Variance =VAR(data set)Standard Deviation =STDEV(data set)Inter-Quartile Range =QUARTILE(data set,3)QUARTILE(data set,1)Skewness =SKEW(data set)Kurtosis =KURT(data set)第36页/共37页感谢您的观看!第37页/共37页

    注意事项

    本文(统计基础三统计描述.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开