欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    教学课件(04)第4章 数据的描述统计量(E3).pptx

    • 资源ID:25427438       资源大小:3.92MB        全文页数:28页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    教学课件(04)第4章 数据的描述统计量(E3).pptx

    教材配套资源页完整PPT课件教学课件(04)第4章 数据的描述统计量(E3)14 - 2统计学基于 Excel贾俊平2022-7-112022-7-11基于基于 ExcelExcel4 - 3统计学基于 Excel贾俊平2022-7-112022-7-114 - 4统计学基于 Excel贾俊平2022-7-112022-7-11思维一下思维一下l如果用一个值代表一个地区的收入水平,你是用平均数还是用中位数?如果用一个值代表一个地区的收入水平,你是用平均数还是用中位数?l“双十一双十一”每个人网购金额的标准差是每个人网购金额的标准差是500500元,平时是元,平时是400400元,你认为是元,你认为是“双十一双十一”网购金额的差异大,还是平时网购金额的差异大?网购金额的差异大,还是平时网购金额的差异大?l假定你们班的统计学平均考试分数是假定你们班的统计学平均考试分数是8080分,标准差是分,标准差是5 5分,而你的考试分数是分,而你的考试分数是9090分,分,你的考试分数距离平均数有几个标准差的距离?你的考试分数距离平均数有几个标准差的距离?l你可以手工计算你可以手工计算3030个人的平均上网时间,个人的平均上网时间, 但你能手工计算但你能手工计算300300万个人的平均上网时间吗?万个人的平均上网时间吗?4 - 5统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量平均数平均数 描述水平的统计量4 - 6统计学基于 Excel贾俊平2022-7-112022-7-11随机抽取20个年龄在1825周岁之间的成年人,得到的身高数据如表41所示。计算20个人的平均身高 描述水平的统计量描述水平的统计量平均数平均数 描述水平的统计量1761761651651821821741741771771701701781781741741761761691691761761651651851851751751701701801801641641791791621621731734 - 7统计学基于 Excel贾俊平2022-7-112022-7-11沿用第2章例22。根据表29的分组数据,计算营业额的平均数 描述水平的统计量描述水平的统计量平均数平均数 描述水平的统计量营业额分组营业额分组2002502002502252257 71575157525030025030027527511113025302530035030035032532522227150715035040035040037537538381425014250400450400450425425292912325123254505004505004754752020950095005005505005505255251212630063005506005506005755756 6345034506006506006506256253 3187518756507006507006756752 213501350合计合计15015060800608004 - 8统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数中位数中位数 描述水平的统计量4 - 9统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数中位数中位数 描述水平的统计量1621621641641651651651651691691701701701701731731741741741741751751761761761761761761771771781781791791801801821821851854 - 10统计学基于 Excel贾俊平2022-7-112022-7-11( quartile )一组数据排序后处于25%和75%位置上的数值。它是用3个点将全部数据等分为4部分,其中每部分包含25%的数据。很显然,中间的四分位数就是中位数,因此通常所说的四分位数是指处在25%位置上和处在75%位置上的两个位置有多种算法如果位置是整数,四分位数就是该位置对应的数值;如果是在整数加0.5的位置上,则取该位置两侧数值的平均数;如果是在整数加0.25或0.75的位置上,则四分位数等于该位置前面的数值加上按比例分摊的位置两侧数值的差值 描述水平的统计量描述水平的统计量分位数分位数四分位数四分位数 描述水平的统计量4 - 11统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数四分位数四分位数 描述水平的统计量4 - 12统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数百分位数百分位数 描述水平的统计量4 - 13统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数百分位数百分位数 描述水平的统计量4 - 14统计学基于 Excel贾俊平2022-7-112022-7-11 描述水平的统计量描述水平的统计量分位数分位数众数众数 描述水平的统计量4 - 15统计学基于 Excel贾俊平2022-7-112022-7-11 平均数、分位数和众数是描述数据水平的几个主要统计量,实际应用中,用哪个统计量来代表一组数据的水平,取决于数据的分布特征 平均数易被多数人理解和接受,实际中用得也较多,但其缺点是易受极端值的影响。当数据的分布对称或偏斜程度不是很大时,应选择使用平均数 对于严重偏度分布的数据,平均数的代表性较差。由于中位数和众数不受极端值的影响,因此,当数据分布的偏斜程度较大时,可以考虑选择中位数或众数,这时它们的代表性要比平均数好 描述水平的统计量描述水平的统计量适用场合适用场合 描述水平的统计量4 - 16统计学基于 Excel贾俊平2022-7-112022-7-11(range) 一组数据的最大值与最小值之差,也称极差,用R表示 计算公式为 描述差异的统计量描述差异的统计量全距和四分位距全距和四分位距 描述差异的统计量4 - 17统计学基于 Excel贾俊平2022-7-112022-7-11( variance ) 离差平方后再求平均数(standard deviation) 方差开方后的结果称为标标准差准差(standard deviation) 方差(或标准差)是实际中应用最广泛的测度数据离散程度的统计量 描述差异的统计量描述差异的统计量方差和标准差方差和标准差 描述差异的统计量4 - 18统计学基于 Excel贾俊平2022-7-112022-7-11 计算20个人身高的方差和标准差简单方差和标准差 描述差异的统计量描述差异的统计量方差和标准差方差和标准差 描述差异的统计量4 - 19统计学基于 Excel贾俊平2022-7-112022-7-11 根据表29的分组数据,计算营业额的标准差加权标准差 描述差异的统计量描述差异的统计量方差和标准差方差和标准差 描述差异的统计量营业额分组营业额分组2002502002502252257 7-180.3333-180.3333227640.7778227640.77782503002503002752751111-130.3333-130.3333186854.5556186854.55563003503003503253252222-80.3333-80.3333141975.7778141975.77783504003504003753753838-30.3333-30.333334964.222234964.2222400450400450425425292919.666719.666711216.555611216.5556450500450500475475202069.666769.666797068.888997068.88895005505005505255251212119.6667119.6667171841.3333171841.33335506005506005755756 6169.6667169.6667172720.6667172720.66676006506006506256253 3219.6667219.6667144760.3333144760.33336507006507006756752 2269.6667269.6667145440.2222145440.2222合计合计1501501334483.33331334483.33334 - 20统计学基于 Excel贾俊平2022-7-112022-7-11( coefficient of variation,CV )也称变异系数,它是一组数据的标准差与其相应的平均数之比由于离散系数消除了数据取值大小和计量单位对标准差的影响,因而可以反映一组数据的相对离散程度 计算公式为 描述差异的统计量描述差异的统计量离散系数离散系数 描述差异的统计量 为分析不同行业上市公司每股收益的差异,在互联网服务行业和机械制造行业各随机抽取10家上市公司,得到某年度的每股收益数据如表44所示。比较两类上市公司每股收益的离散程度互联网公司互联网公司机械制造公司机械制造公司0.320.320.680.680.470.470.430.430.890.890.280.280.970.970.030.030.870.870.420.421.091.090.240.240.730.730.660.660.960.960.290.290.960.960.020.020.630.630.590.59统计量统计量互联网公司互联网公司机械制造公司机械制造公司平均数平均数0.7890.7890.3640.364标准差标准差0.2470020.2470020.2366060.236606离散系数离散系数0.3130570.3130570.6500150.6500154 - 21统计学基于 Excel贾俊平2022-7-112022-7-11( standard score ) 某个数据与其平均数的离差除以标准差后的值 设样本数据的标准分数为z,计算公式为 描述差异的统计量描述差异的统计量标准分数标准分数 描述差异的统计量l将一组数据化为标准化得分的过程称为数据的标准化。式(4.13)也就是统计上常用的标准化公式,在对多个具有不同量纲的变量进行处理时,常常需要对各变量的数据进行标准化处理,也就是把一组数据转化成具有平均数为0、标准差为1的新的数据l标准分数只是将原始数据进行了线性变换,它并没有改变某个数值在该组数据中的位置,也没有改变该组数据分布的形状4 - 22统计学基于 Excel贾俊平2022-7-112022-7-11 沿用例41。计算20个人身高的标准分数 描述差异的统计量描述差异的统计量标准分数标准分数 描述差异的统计量身高身高标准分数标准分数身高身高标准分数标准分数1761760.39980.39981851851.83901.8390170170-0.5597-0.55971791790.87950.87951761760.39980.39981741740.08000.08001801801.03941.03941761760.39980.3998165165-1.3593-1.35931751750.23990.23991781780.71960.7196162162-1.8390-1.8390165165-1.3593-1.35931771770.55970.5597164164-1.5192-1.5192169169-0.7196-0.71961821821.35931.3593170170-0.5597-0.55971741740.08000.0800173173-0.0800-0.08004 - 23统计学基于 Excel贾俊平2022-7-112022-7-11l根据标准分数,可以判断一组数据中是否存在离群点离群点(outlier)l经验表明:当一组数据对称分布时,约有68%的数据在平均数加减1个标准差的范围之内;约有95%的数据在平均数加减2个标准差的范围之内;约有99%的数据在平均数加减3个标准差的范围之内。可以想象,一组数据中低于或高于平均数3倍标准差之外的数值是很少的,也就是说,在平均数加减3个标准差的范围内几乎包含了全部数据,而在3个标准差之外的数据在统计上也称为离群点 描述差异的统计量描述差异的统计量标准分数标准分数 描述差异的统计量4 - 24统计学基于 Excel贾俊平2022-7-112022-7-11 描述分布形状的统计量描述分布形状的统计量偏度系数偏度系数 描述分布形状的统计量4 - 25统计学基于 Excel贾俊平2022-7-112022-7-11 描述分布形状的统计量描述分布形状的统计量峰度系数峰度系数 描述分布形状的统计量4 - 26统计学基于 Excel贾俊平2022-7-112022-7-11l用【数据分析】工具计算描述统计量用【数据分析】工具计算描述统计量第1步:将光标放在任意空白单元格。然后点击【数据】【数据分析】。在分析工具中选择【描述统计】。单击【确定】。第2步:在【输入区域】输入原始数据所在的区域;在【输出选项】中选择结果的输出位置;选择【汇总统计】(其他选项可根据需要选择) 综合输出多个描述统计量综合输出多个描述统计量 Excel【数据分析】工具的应用互联网公司互联网公司统计量统计量机械制造公司机械制造公司统计量统计量平均平均0.7890.789 平均平均0.3640.364标准误差标准误差0.0781090.078109 标准误差标准误差0.0748210.074821中位数中位数0.880.88 中位数中位数0.3550.355众数众数0.960.96 众数众数#N/A#N/A标准差标准差0.2470020.247002 标准差标准差0.2366060.236606方差方差0.061010.06101 方差方差0.0559820.055982峰度峰度-0.20382-0.20382 峰度峰度-1.06272-1.06272偏度偏度-0.87636-0.87636 偏度偏度-0.11929-0.11929区域区域0.770.77 区域区域0.660.66最小值最小值0.320.32 最小值最小值0.020.02最大值最大值1.091.09 最大值最大值0.680.68求和求和7.897.89 求和求和3.643.64观测数观测数1010 观测数观测数10104 - 27统计学基于 Excel贾俊平2022-7-112022-7-11 THANKS THE END2022-7-11 THE END THANKS概括数据特征度量274 - 28统计学基于 Excel贾俊平2022-7-112022-7-11本课件制作整理者:郭迎春 仅可用于教学、学习、交流使用 如内容、图片、字体等有侵权,请联系删除。 28

    注意事项

    本文(教学课件(04)第4章 数据的描述统计量(E3).pptx)为本站会员(春哥&#****71;)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开