欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    (03)第3章-用统计量描述数据1资料.ppt

    • 资源ID:75830821       资源大小:409.50KB        全文页数:67页
    • 资源格式: PPT        下载积分:30金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要30金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    (03)第3章-用统计量描述数据1资料.ppt

    第第 3 章章 数据的概括性度量数据的概括性度量3.1 集中趋势的度量集中趋势的度量 3.2 离散程度的度量离散程度的度量3.3 偏态与峰态的度量偏态与峰态的度量3.1 集中趋势的度量集中趋势的度量 3.1.1 平均数平均数 3.1.2 中位数和分位数中位数和分位数 3.1.3 各度量值的比较各度量值的比较第第 3 章章 数据的概括性度量数据的概括性度量1.集中趋势集中趋势集中趋势集中趋势2.包括均值、中位数和分位数、众数包括均值、中位数和分位数、众数包括均值、中位数和分位数、众数包括均值、中位数和分位数、众数3.1 3.1 集中趋势的度量集中趋势的度量平均数平均数均值均值总体平均数总体平均数;样本平均数样本平均数 x简单平均数简单平均数(Simple mean)设设一组数据为:一组数据为:x1,x2,xn某公司的某公司的某公司的某公司的8 8名职工的月工资如下:(单位:元)名职工的月工资如下:(单位:元)名职工的月工资如下:(单位:元)名职工的月工资如下:(单位:元)职务职务工资工资经理经理1500015000副经理副经理1000010000职员甲职员甲25002500职员乙职员乙21002100职员丙职员丙21002100职员丁职员丁21002100杂工甲杂工甲20002000杂工乙杂工乙15001500加权均值加权均值设设设设一组数据为:一组数据为:一组数据为:一组数据为:x x1 1,x x2 2,x xk k相应的频数为:相应的频数为:相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k分组平均数分组平均数(Weighted mean)设设各组的组中值为:各组的组中值为:M1,M2,Mk 相应的频数为:相应的频数为:f1,f2,fk分组分组分组分组平均数平均数某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组频数频数(fi)140150150160160170170180180190190200200210210220220230230240 4 91627201710 8 4 5合计合计120组组中值中值(Mi)1451551651751851952052152252353.1.2 中位数和四分位数中位数和四分位数3.1 集中趋势的度量集中趋势的度量中位数中位数(median)1.排序后处于中间位置上的值。不受极端值影响排序后处于中间位置上的值。不受极端值影响2.2.位置确定位置确定位置确定位置确定【例例】:9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9Me=1080【例例例例】:1010个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 某公司的某公司的某公司的某公司的8 8职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职务职务工资工资经理经理1500015000副经理副经理1000010000职员甲职员甲25002500职员乙职员乙21002100职员丙职员丙21002100职员丁职员丁21002100杂工甲杂工甲20002000杂工乙杂工乙15001500四分位数四分位数排序后处于排序后处于25%和和75%位置上的值位置上的值不受极端值的影响不受极端值的影响QQL LMeMeQQU U25%25%25%25%四分位数的计算四分位数的计算(位置的确定位置的确定)方法方法2:spss算法算法方法方法1:定义算法:定义算法【例例】:9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 16301500 750 780 1080 850 960 2000 1250 1630排排排排 序序序序:750 750 780 850780 850 960 1080 960 1080 1250 1500 1250 1500 1630 20001630 2000位位位位 置置置置:1 2 3 4 5 6 7 8 9 1 2 3 4 5 6 7 8 9 众数众数(mode)1.一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值一组数据中出现次数最多的变量值2.适合于数据量较多时使用适合于数据量较多时使用适合于数据量较多时使用适合于数据量较多时使用3.不受极端值的影响不受极端值的影响不受极端值的影响不受极端值的影响4.一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数一组数据可能没有众数或有几个众数众数、中位数和平均数的关系众数、中位数和平均数的关系对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数众数、中位数和平均数的关系众数、中位数和平均数的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数众数、中位数和平均数的关系众数、中位数和平均数的关系右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值一家汽车零售店的一家汽车零售店的1010名销售人员名销售人员5 5月份销售汽车月份销售汽车的数量(单位:辆)排序后如下:的数量(单位:辆)排序后如下:2 2、4 4、7 7、1010、1010、1010、1212、1212、1414、15153.2 离散程度的度量离散程度的度量 3.2.1 极差和四分位差极差和四分位差 3.2.2 平均差平均差 3.2.3 方差和标准差方差和标准差 3.2.4 离散系数:比较几组数据的离散系数:比较几组数据的 离散程度离散程度第第 3 章章 数据的概括性度量数据的概括性度量离中趋势离中趋势1.反映各变量值远离其中心值的程度反映各变量值远离其中心值的程度(离散程度离散程度)极差极差(range)1.一组数据的最大值与最小值之差一组数据的最大值与最小值之差四分位差四分位差(quartile deviation)1.也称为内距或四分间距2.上四分位数与下四分位数之差:Qd=QU QL25%25%75%75%平均差平均差1.各变量值与其平均数离差绝对值的平均数各变量值与其平均数离差绝对值的平均数2.能全面反映一组数据的离散程度能全面反映一组数据的离散程度3.计算公式为计算公式为未分组数据未分组数据组距分组数据组距分组数据某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组频数频数(fi)140150150160160170170180180190190200200210210220220230230240 4 91627201710 8 4 5合计合计120组组中值中值(Mi)145155165175185195205215225235平均差平均差(例题分析例题分析)含义:含义:每一天的销售量平均数相比,每一天的销售量平均数相比,平均相差平均相差17台台3.2.3 方差和标准差方差和标准差3.2 离散程度的度量离散程度的度量方差和标准差方差和标准差(variance and standard deviation)1.数据离散程度的最常用测度值数据离散程度的最常用测度值2.反映各变量值与均值的平均差异反映各变量值与均值的平均差异样本方差和标准差样本方差和标准差(sample(sample variancevariance and and standard deviationstandard deviation)未分组数据未分组数据未分组数据未分组数据方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式样本方差和标准差样本方差和标准差组距分组数据组距分组数据组距分组数据组距分组数据方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式某公司的某公司的某公司的某公司的8 8职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职工的月工资如下:(单位:元)职务职务工资工资经理经理1500015000副经理副经理1000010000职员甲职员甲25002500职员乙职员乙21002100职员丙职员丙21002100职员丁职员丁21002100杂工甲杂工甲20002000杂工乙杂工乙15001500某电脑公司销售量数据分组表某电脑公司销售量数据分组表按销售量分组按销售量分组频数频数(fi)140150150160160170170180180190190200200210210220220230230240 4 91627201710 8 4 5合计合计120组组中值中值(Mi)145155165175185195205215225235含义:含义:每一天的销售量与平均数相比,平均相差21.58台解:解:标准分数标准分数1.1.计算公式计算公式计算公式计算公式2.2.对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量对某一个值在一组数据中相对位置的度量3.3.可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点可用于判断一组数据是否有离群点4.4.4.4.4.4.可使一组数据变为均值为可使一组数据变为均值为可使一组数据变为均值为可使一组数据变为均值为0 0 0 0,方差为,方差为,方差为,方差为1 1 1 1的值的值的值的值标准分数标准分数25 28 31 34 37 40 43-1.5 -1 -0.5 0 0.5 1 1.5 例如:某中学高(例如:某中学高(1)班期末考试,已知语文期)班期末考试,已知语文期末考试的全班平均分为末考试的全班平均分为73分,标准差为分,标准差为7分,甲得分,甲得了了78分;数学期末考试的全班平均分为分;数学期末考试的全班平均分为80分,标分,标准差为准差为6.5分,甲得了分,甲得了83分。甲哪一门考试成绩比分。甲哪一门考试成绩比较好?较好?经验法则经验法则经验法则表明:当一组数据对称分布时经验法则表明:当一组数据对称分布时l约有约有68%的数据在平均数加减的数据在平均数加减1个标准差的范围个标准差的范围之内之内l约有约有95%的数据在平均数加减的数据在平均数加减2个标准差的范围个标准差的范围之内之内l约有约有99%的数据在平均数加减的数据在平均数加减3个标准差的范围个标准差的范围之内之内 l离群点:在平均数加减离群点:在平均数加减离群点:在平均数加减离群点:在平均数加减3 3 3 3个标准差之外的数。个标准差之外的数。个标准差之外的数。个标准差之外的数。例例:一一项项关关于于大大学学生生体体重重状状况况的的研研究究发发现现,男男生生的的平平均均体体重重为为60kg,标标准准差差为为5kg;女女生生的的平平均均体体重为重为50kg,标准差为标准差为5kg。(1)粗粗略略地地估估计计一一下下,男男生生中中有有百百分分之之几几的的人人体重在体重在5565kg之间。之间。(2)粗粗略略地地估估计计一一下下,女女生生中中有有百百分分之之几几的的人人体重在体重在4060kg之间。之间。例例:一条生产线平均每天的产量为:一条生产线平均每天的产量为3700件,标准件,标准差差50件。如果某一天的产量低于或高于平均产量,件。如果某一天的产量低于或高于平均产量,并落入正负两个标准差的范围之外,就认为该生并落入正负两个标准差的范围之外,就认为该生产线失去了控制。下面是一周各天的产量,该生产线失去了控制。下面是一周各天的产量,该生产线哪几天失去了控制?产线哪几天失去了控制?切比雪夫不等式切比雪夫不等式 对于任意分布形态的数据,根据切比雪夫不等对于任意分布形态的数据,根据切比雪夫不等式,至少有式,至少有(1-1/k(1-1/k2 2)的数据落在均值加减的数据落在均值加减k k个标个标准差之内。其中准差之内。其中k k是大于是大于1 1的任意值,但不一定的任意值,但不一定是整数是整数切比雪夫不等式切比雪夫不等式对于对于k=2,3,4,该不等式的含义是该不等式的含义是l至少有至少有75%的数据落在平均数加减的数据落在平均数加减2个标准个标准差的范围之内差的范围之内l至少有至少有89%的数据落在平均数加减的数据落在平均数加减3个标准个标准差的范围之内差的范围之内l至少有至少有94%的数据落在平均数加减的数据落在平均数加减4个标准个标准差的范围之内差的范围之内离散系数离散系数(coefficient of variation)1.标准差与其相应的均值之比标准差与其相应的均值之比2.比较几组数据的离散程度比较几组数据的离散程度3.消除了数据水平高低和计量单位的影响消除了数据水平高低和计量单位的影响【例例3.9】评价哪名运动员的发挥更稳定评价哪名运动员的发挥更稳定【例例例例 】一一一一项项项项关关关关于于于于大大大大学学学学生生生生体体体体重重重重状状状状况况况况的的的的研研研研究究究究发发发发现现现现,男男男男生生生生的的的的平平平平均均均均体体体体重重重重为为为为60kg,60kg,标标标标准准准准差差差差为为为为5kg;5kg;女女女女生生生生的的的的平平平平均均均均体体体体重重重重为为为为50kg,50kg,标准差为标准差为标准差为标准差为5kg5kg。(1 1)是是是是男男男男生生生生体体体体重重重重差差差差异异异异大大大大还还还还是是是是女女女女生生生生体体体体重重重重差差差差异异异异大大大大?为为为为什什什什么?么?么?么?3.3 偏态与峰态的度量偏态与峰态的度量 3.3.1 偏态及其测度偏态及其测度 3.3.2 峰态及其测度峰态及其测度第第 3 章章 数据的概括性度量数据的概括性度量数据分布的形状数据分布的形状偏态与峰态偏态与峰态扁平分布扁平分布扁平分布扁平分布扁平分布扁平分布尖峰分布尖峰分布尖峰分布尖峰分布偏态偏态偏态偏态峰态峰态峰态峰态左偏分布左偏分布左偏分布左偏分布右偏分布右偏分布右偏分布右偏分布与标准正态与标准正态与标准正态与标准正态分布比较!分布比较!分布比较!分布比较!3.3.1 偏态及其测度偏态及其测度3.3 偏态与峰态的度量偏态与峰态的度量偏态偏态(skewness)统计学家统计学家Pearson于于1895年首次提出年首次提出 数据分布偏斜程度的测度数据分布偏斜程度的测度计算公式计算公式偏态偏态(skewness)1.偏态系数偏态系数=0为为对称分布对称分布2.偏态系数偏态系数 0为为右偏分布右偏分布3.偏态系数偏态系数 0为为左偏分布左偏分布偏态系数大于偏态系数大于1或小于或小于-1,被称为高度偏态分布;偏,被称为高度偏态分布;偏态系数在态系数在0.51或或-1-0.5之间,被认为是中等偏态之间,被认为是中等偏态分布;偏态系数越接近分布;偏态系数越接近0,偏斜程度就越低,偏斜程度就越低 图形描述:图形描述:25252020151510105 53030220220 230230240240频频数数(天天)某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图180180200200 210210190190170170160160140140 150150偏态系数偏态系数(coefficient of skewness)1.根据原始数据计算2.根据分组数据计算偏态系数偏态系数(例题分析例题分析)某电脑公司销售量偏态及峰度计算表某电脑公司销售量偏态及峰度计算表某电脑公司销售量偏态及峰度计算表某电脑公司销售量偏态及峰度计算表 按销售量份组按销售量份组(台台)组中值组中值(Mi)频数频数 fi140 150150 160160 170170 180180 190190 200200 210210 220220 230230 240145155165175185195205215225235 4 91627201710 8 4 5-256000-243000-128000 -27000 0 17000 80000 216000 256000 62500010240000 7290000 2560000 270000 0 170000 1600000 64800001024000031250000合计合计120540000 70100000 偏态系数偏态系数(例题分析例题分析)结论:结论:结论:结论:偏态系数为正值,但与偏态系数为正值,但与0 0的差异不大,说明的差异不大,说明电脑销售量为轻微右偏分布,即销售量较少的天电脑销售量为轻微右偏分布,即销售量较少的天数占据多数,而销售量较多的天数则占少数数占据多数,而销售量较多的天数则占少数3.3.2 峰态及其测度峰态及其测度3.3 偏态与峰态的度量偏态与峰态的度量峰态峰态(kurtosis)1.统计学家Pearson于1905年首次提出2.数据分布扁平程度的测度3.峰态系数=0扁平峰度适中4.峰态系数0为尖峰分布峰态系数峰态系数(coefficient of kurtosis)1.根据原始数据计算2.根据分组数据计算统计函数统计函数统计函数统计函数KURTKURT峰态系数峰态系数(例题分析例题分析)结论:结论:结论:结论:偏态系数为负值,但与偏态系数为负值,但与0 0的差异不大,说明的差异不大,说明电脑销售量为轻微扁平分布电脑销售量为轻微扁平分布Excel中的统计函数中的统计函数lMODE计算众数lMEDIAN计算中位数lQUARTILE计算四分位数lAVERAGE计算平均数lHARMEAN计算简单调和平均数lGEOMEAN计算几何平均数lAVEDEV计算平均差lSTDEV计算样本标准差lSTDEVP计算总体标准差lSKEW计算偏态系数lKURT计算峰态系数lTRIMMEAN计算切尾均值用用Excel计算描述统计量计算描述统计量 Excel【工具工具】【数据分析数据分析】【描述描述 统计统计】【确定确定】【输入区域输入区域】【输出选项输出选项】【汇总统计汇总统计】【确定确定】Excel用用Excel计算描述统计量计算描述统计量ExcelExcel输出输出的描的描述统述统计量计量数据的描述统计量数据的描述统计量本章小结本章小结l度量集中趋势的统计量度量集中趋势的统计量l度量离散程度的统计量度量离散程度的统计量l度量偏态与峰态的统计量度量偏态与峰态的统计量l各统计量的的特点及应用场合各统计量的的特点及应用场合l用用Excel计算描述统计量计算描述统计量结结 束束

    注意事项

    本文((03)第3章-用统计量描述数据1资料.ppt)为本站会员(得****1)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开