欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计数据的描述专题培训ppt课件.ppt

    • 资源ID:91845826       资源大小:781.50KB        全文页数:89页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计数据的描述专题培训ppt课件.ppt

    2.1 统计数据的来源统计数据的来源数据来源数据来源直接来源直接来源间接来源间接来源试验试验出版物出版物(或者网上等或者网上等)问卷调查问卷调查观察观察11、统计部门和政府部门公布的有关资料,如各类统计年鉴2、各类经济信息中心、信息咨询机构、专业调查机构等提供的数据3、各类专业期刊、报纸、书籍所提供的资料4、各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料5、从互联网或图书馆查阅到的相关资料 一、统计数据的间接来源一、统计数据的间接来源2在收集二手资料时要注意的几个问题:o数据是谁搜集的?o为什么目的而搜集的?o数据是怎样搜集的?o什么时候搜集的?o在引用间接资料的时候要注明资料来源。3二、统计数据的直接来源二、统计数据的直接来源o 统计调查(主要用来取得社会经济数据)统计调查(主要用来取得社会经济数据)o 科学试验(主要用来取得自然科学数据科学试验(主要用来取得自然科学数据)统计调查是整个统计认识活动的基础,统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败决定着统计认识过程及其结果的成败 41 1、统计调查定义、统计调查定义 根据统计研究的目的和要求,运用科学的调查方法,有组织、有计划地向客观实际搜集各种原始资料的工作过程。简单地说就是得到个别事物原始资料的过程。、资料的质量要求、资料的质量要求 准确性及时性 全面性经济性5(1)按调查对象所包括范围分:全面调查 非全面调查(2)按调查登记时间连续性分:经常性调查 一次性调查(3)按调查组织形式分:统计报表 专门调查(4)按搜集资料方式不同:直接观察法 采访法 报告法 问卷法3 33 3、统计调查的种类、统计调查的种类、统计调查的种类、统计调查的种类6总体单位总体单位调查单位调查单位7总体单位总体单位调查单位调查单位普普 查查对全部单位对全部单位进行调查进行调查8报表制度报表制度可以全面调查,但可以全面调查,但通常是调查限定规通常是调查限定规模以上的总体单位模以上的总体单位总体单位总体单位调查单位调查单位9总体单位总体单位调查单位调查单位抽样调查抽样调查按随机原则选择调按随机原则选择调查单位,各单位被查单位,各单位被选中的机会相同。选中的机会相同。10总体单位总体单位调查单位调查单位重点调查重点调查只调查重点单位(单位数只调查重点单位(单位数不多但其标志量占标志总不多但其标志量占标志总量比重较大的单位)量比重较大的单位)11总体单位总体单位调查单位调查单位典型调查典型调查对典型单位进行调对典型单位进行调查,典型单位的选查,典型单位的选择并不一定按规模择并不一定按规模12o普查:普查:为某一特定目的而专门组织的非经常性全面调查。通常是一次性或周期性的 一般需要规定统一的标准调查时间 数据的规范化程度较高 应用范围比较狭窄 我国普查规范化,制度化:年份末尾逢“0”人口普查、逢“3”第三产业普查、逢“5”工业普查、逢“7”农业普查。13o统计报表:统计报表:按照国家有关规定,自上而下统一布置,自下而上逐级提供基本统计资料的一种统计调查形式。按调查范围分:全面报表 非全面报表 按报送周期分:日报 月报 季报 年报14o 抽样调查:抽样调查:严格按照随机原则,从现象总体中抽选一部分单位作为样本进行调查,然后依据所取得的样本数据,对调查总体的数量特征作出具有一定可靠程度的推算和估计。随机原则抽选样本 部分单位的资料推断总体数量特征 肯定存在一定的抽样误差15三、统计调查方案三、统计调查方案三、统计调查方案三、统计调查方案基本内容:基本内容:确定调查的任务和目的;确定调查的任务和目的;(为什么调查)(为什么调查)调查对象调查对象与与调查单位调查单位;(向谁调查)(向谁调查)调查项目与调查项目与调查表调查表;(调查什么)(调查什么)调查的时间和期限;调查的时间和期限;制定调查工作的组织实施计划。制定调查工作的组织实施计划。16三、统计调查方案三、统计调查方案三、统计调查方案三、统计调查方案 确定调查的任务和目的确定调查的任务和目的要求:()从研究工作需要出发,抓住实际生活中最重要的问题()从调查对象实际出发,把需要和可能结合起来 确定调查对象和调查单位确定调查对象和调查单位17三、统计调查方案三、统计调查方案三、统计调查方案三、统计调查方案 调查项目和调查表调查项目和调查表满足:()拟定的项目应满足调查目的()按照需要与可能的原则,只列出能得到确切答案的项目,且对项目的提法要具体明确()确定的调查项目之间要尽可能做到互相联系,以便于核对答案的准确性()明确规定调查项目的答案形式18调查表:调查表:表头表头表体表体表脚表脚说明词:调查表名称、调查说明词:调查表名称、调查单位、解释调查意义、表达单位、解释调查意义、表达感激之情等感激之情等主题问句:被调查者基本情主题问句:被调查者基本情况、调查项目况、调查项目作业记录:填报时间、填报作业记录:填报时间、填报人等人等19示例示例旅游及生活方式调查问卷旅游及生活方式调查问卷旅游1、您是否喜欢旅游?是 否 如果是,在3年内计划去哪?中国 亚洲 欧洲 美国 澳洲 其他 如:2、当您旅游度假时选择哪种住宿?别墅 公寓 酒店客房 其他 如:3、您通常与谁一同旅游度假?夫妻小孩 亲友 朋友 其他 如:4、他们有护照吗?有 没有5、您是否希望我们帮助您办护照呢?是 否6、您旅游度假时通常使用:信用卡 支票 现金生活方式1、您是否已成为以下俱乐部的会员?高尔夫俱乐部 健身俱乐部 网球俱乐部 美容院 其他 如:202、您现在的住房是:自购别墅 自购公寓 公司房 租住别墅 租房 与家人亲戚同住3、您的交通工具是:私家车 公司车 打的 摩托车 其他 如:4、婚姻状况:已婚 单身 同居5、您的职业:您的职务:老板 总裁 经理 职员 其他如:您的年龄:低于26岁 2639岁 4059岁 60岁以上 6、您配偶的职业:您配偶的职务:老板 总裁 经理 职员 其他如:您配偶的年龄:低于26岁 2639岁 4059岁 60岁以上 217、你们夫妻双方的月收入合计(人民币/月)1000元4000元 4000元8000元 8000元15000元 15000元以上 您的姓名 您的地址您的得奖联系电话为:家庭手机幸运号码幸运号码:0012083-感谢您的宝贵时间感谢您的宝贵时间 :0012083 为了感谢您的帮助,主办人将把所有填写完整的调查问卷存入电脑抽奖系统,该系统将赠一批高质量礼品给幸运中奖者,请保存您的回执单。祝您好运!公司地址:联系电话:22课外练习1、大学生消费结构调查2、大学生创业意向调查3、大学学习时间分配调查4、大学生图书馆使用调查5、大学生人际关系调查6、大学生电脑使用调查7、大学生就业调查8、大学生心理健康调查9、大学生困惑/困难问题调查23三、统计调查方案三、统计调查方案三、统计调查方案三、统计调查方案 调查时间和调查期限调查时间和调查期限 制定调查工作的组织实施计划制定调查工作的组织实施计划 内容:()调查工作组织领导机构与人员组成()调查的方式方法()调查的工作规则和流程()调查前准备工作()其他工作24是统计调查的继续,统计分析的前是统计调查的继续,统计分析的前提和基础提和基础地位地位统计整理统计整理将统计调查得到的原始资料进行将统计调查得到的原始资料进行科学的分组和汇总形成综合统计科学的分组和汇总形成综合统计资料的工作过程资料的工作过程2.2 统计数据的整理统计数据的整理251、概念、概念 根据统计研究的目的和客观现象的内在根据统计研究的目的和客观现象的内在特点,按某个分组标志(或几个分组标志)特点,按某个分组标志(或几个分组标志)把统计总体分为若干组成部分。把统计总体分为若干组成部分。2、目的、目的一、统计数据的分组一、统计数据的分组一、统计数据的分组一、统计数据的分组 把同质总体内具有不同性质的单位分开,把同质总体内具有不同性质的单位分开,把相同性质的单位合并在一起,保持各组内把相同性质的单位合并在一起,保持各组内统计资料的一致性和组与组之间资料的差异统计资料的一致性和组与组之间资料的差异性。性。263、原则、原则穷尽原则穷尽原则 互斥原则互斥原则例例1:从业人员按文化程度分组:从业人员按文化程度分组 小学毕业小学毕业 中学毕业(含中专)中学毕业(含中专)大学毕业大学毕业 文盲或识字不多文盲或识字不多小学毕业小学毕业中学毕业(含中专)中学毕业(含中专)大专毕业大专毕业大学及大学以上大学及大学以上 ()()例例2:某商场把服装分为:某商场把服装分为 男装、女装、童装。男装、女装、童装。()成年装(男女装)成年装(男女装)儿童装(男女装)儿童装(男女装)()274、种类、种类按分组标志的多少不同简单分组复合分组按分组标志的性质不同品质标志分组数量标志分组28例例 1 为了了解某地区银行存款的构成,可以选用为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:存款性质、期限两个标志分别进行分组:按存款性质分组按存款性质分组 企业存款企业存款 储蓄存款储蓄存款 财政性存款财政性存款按存款期限分组按存款期限分组 活期存款活期存款 定期存款定期存款简单简单分组分组复合分组存款同时按其性质及期限分组存款同时按其性质及期限分组 企业存款企业存款 活期活期 定期定期 储蓄存款储蓄存款 活期活期 定期定期 财政性存款财政性存款 活期活期 定期定期例例2 企业职工按工龄分组:企业职工按工龄分组:5年以下年以下 510年年 1015年年 1520年年 20年以上年以上品质标志分组数量标志分组291 1、分配数列:、分配数列:统计分组后,将总体的所有单位按组归类排序,列出各组的总体单位数,形成一个数列。次数(频数):各组的总体单位数,用f表示;频率:各组单位在总体单位中所占比重,用f/f表示。2 2、品质分组的方法:、品质分组的方法:按品质标志分组形成的数列 二、统计分组的方法二、统计分组的方法性别人数男30女28303 3、数量分组的方法:按数量标志分组形成的分配数列。、数量分组的方法:按数量标志分组形成的分配数列。(1)单项式分组:每一组变量值只有一个。(2)组距式分组:每一组数值由两个变量值所确定的一个数值范围表示。4 4、统计分组中的几个概念、统计分组中的几个概念(1)组限:分组的数量界限,分为上限和下限(2)组距:各组上限与下限之差。等距分组 异距分组。(3)闭口组:上限和下限都齐全的组。(4)开口组:上限和下限只具备其一的组。(5)组中值:各组上限和下限的中点值。闭口组:组中值闭口组:组中值(上限下限)/2 缺下限开口组:组中值=上限-邻组组距/2 缺上限开口组:组中值=下限+邻组组距/231三、组距数列的编制三、组距数列的编制1 1、等距分组步骤:、等距分组步骤:(1)排序(2)计算全距R(3)确定组数n(4)计算组距i经验值公式(5)确定组限 以最小组下限小于半个组距为最好。连续型变量:相邻组的组限必须重叠;“上限不在内”原则。离散型变量:相邻组组限必须间断,同时又能相互衔接。(6)计算各组的频数和频率(7)计算累计频数和累计频率32例:现有33个国家的人口平均寿命如下表所示,要求进行等距分组。(n=4)525354566365666767687070717272737474747576767777808080808181828383解:(1)排序;(2)全距R=83-52=31;(3)n=4;(4)组距i=31/4=7.75,取整为10;(5)最小组下限为52-5=47平均人口寿命频数频率向上累计频数向下累计频数47-57412%43357-6739%72967-771546%222677-871133%3311合计33100%-33三、组距数列的编制三、组距数列的编制2 2、异距分组:、异距分组:在标志值变动很不均匀,变动幅度大,遇极偏斜的次数分配等情况下,采用异距分组。例:某地工资水平密集分布于600-2000元,其他部分则分布十分稀少,若以500元为组距进行等距分组,则会使得这一密集的工资段分布信息丢失过大。因此,应在总体单位密集处采用较小的组距,在总体单位稀少处采用较大组距,形成各组组距不等的异距分组。反映单位组距内分布的次数34四、间接来源资料的再分组四、间接来源资料的再分组例:某县各村农民收入分组如左表所示,为了便于对比分析,需要将原有报表资料再分组成为现行报表规定分组的资料右表。平均收入(元)农村数累计310-4005252400-600136188600-900350538900-12004069441200以上561000合计1000-平均收入(元)农村数400以下?400-500?500-800?800-1000?1000-1200?1200以上?合计100052683012522715635五、频数分布的主要类型五、频数分布的主要类型1、正态分布(钟型分布)正态分布正态分布正态分布2、U型分布U UU型分布型分布型分布3、J型分布正正正J J J型分布型分布型分布反反反J J J型分布型分布型分布右偏分布右偏分布右偏分布左偏分布左偏分布左偏分布4、偏分布36 2.3 分布集中趋势的测度分布集中趋势的测度一、算术平均值一、算术平均值二、调和平均值二、调和平均值三、几何平均值三、几何平均值四、切尾平均值四、切尾平均值五、中位数五、中位数六、众数六、众数七、四分位数七、四分位数八、众数中位数和均值的关系八、众数中位数和均值的关系37一、算术平均值一、算术平均值(arithmetical mean)1.集中趋势的最常用测度值2.一组数据的均衡点所在3.体现了数据的必然性特征4.易受极端值的影响5.用于数值型数据,不能用于分类数据和顺序数据38简单算术平均值简单算术平均值(simple arithmetical mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n总体均值总体均值总体均值总体均值样本均值样本均值样本均值样本均值39加权算术平均值加权算术平均值(weighted arithmetical mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xk k相应的频数为:相应的频数为:f f1 1,f f2 2,f fk k总体均值总体均值总体均值总体均值样本均值样本均值样本均值样本均值40加权均值(例题分析)o 41均值均值(数学性质数学性质)1.各变量值与均值的离差之和等于零 2.各变量值与均值的离差平方和最小42二、调和平均值二、调和平均值(harmonic mean)设一组数据为:设一组数据为:x x1 1,x x2 2,x xn n1 1、简单调和平均值、简单调和平均值、简单调和平均值、简单调和平均值是各个变量值倒数的自述平均数的倒数。是各个变量值倒数的自述平均数的倒数。43例:某种蔬菜价格,甲市场例:某种蔬菜价格,甲市场3.5元元/斤,乙市场斤,乙市场4.1元元/斤,丙市场斤,丙市场4.6元元/斤,若在以上市场上各斤,若在以上市场上各买买1元蔬菜,求平均每斤蔬菜多少钱?元蔬菜,求平均每斤蔬菜多少钱?2、加权调和平均值、加权调和平均值44算术平均值与调和平均值关系算术平均值与调和平均值关系按价格分组(元)组中值销售额90-100959500100-11010521000110-12011511500合计-42000例:某商场销售某种品牌皮鞋,由于季节原因,售价有所例:某商场销售某种品牌皮鞋,由于季节原因,售价有所波动,按售价分组如表所示,求平均每双皮鞋的价格。波动,按售价分组如表所示,求平均每双皮鞋的价格。45算术平均值与调和平均值关系算术平均值与调和平均值关系按价格分组(元)组中值销售量90-10095100100-110105200110-120115100合计-40046三、几何平均值三、几何平均值(geometric mean)1.n 个变量值乘积的 n 次方根2.适用于对比率数据的平均3.主要用于计算平均增长率4.计算公式为5.5.可看作是均值的一种变形可看作是均值的一种变形47几何平均值(例题分析)【例例】一位投资者购持有一种股票,在2000年、2001年、2002年和2003年收益率分别为4.5%、2.1%、25.5%、1.9%。计算该投资者在这四年内的平均收益率。算术平均:算术平均:算术平均:算术平均:几何平均:几何平均:几何平均:几何平均:48四、切尾平均值四、切尾平均值(trimmed Mean)1.去掉大小两端的若干数值后计算中间数据的均值2.在电视大奖赛、体育比赛及需要人们进行综合评价的比赛项目中已得到广泛应用3.计算公式为n n 表示观察值的个数;表示观察值的个数;表示切尾系数,表示切尾系数,49切尾平均值(例题分析)【例】【例】某次比赛共有11名评委,对某位歌手的给分分别是:经整理得到顺序统计量值为经整理得到顺序统计量值为经整理得到顺序统计量值为经整理得到顺序统计量值为去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取去掉一个最高分和一个最低分,取1/111/11 50五、中位数五、中位数(median)1.排序后处于中间位置上的值MMe e50%50%2.不受极端值的影响不受极端值的影响3.主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能用于分类数据用于分类数据51数值型数据的中位数数值型数据的中位数(9个数据的算例个数据的算例)【例】【例】9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9中位数中位数 108052数值型数据的中位数数值型数据的中位数(10个数据的算例个数据的算例)o【例】:【例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位置位置:1 2 3 4 5 6 7 8 9 10 53总结:总结:未分组数据中位数确定:未分组数据中位数确定:(1)将标志值排序(2)确定中位数所在位置=(n+1)/2 n奇数,数列最中间的那个数就是中位数。n偶数,最中间两个数的算术平均值是中位数。54分组数据中位数的确定分组数据中位数的确定(1)按分组标志值由小到大排序(2)确定中位数位置中位数所在组称为中位数组55分组数据中位数的确定分组数据中位数的确定Me :表示中位数L:表示中位数组的下限fm:表示中位数组的次数Sm-1:表示中位数组以前各组的累积次数(向上累计)Sm+1:表示中位数组以后各组的累积次数(向下累计)i:表示中位数组的组距(3)由公式计算中位数下限公式:下限公式:上限公式:上限公式:56例:例:某厂工人月收入情况如表所示,试计算中位数值。月收入额(元)工人数向上累计向下累计500-6002424300600-7004872276700-800105177228800-90060237123900-100027264631000-110021285361100-120012297151200以上33003合计300-57解:所以,中位数应在第三组中,即中位数组为所以,中位数应在第三组中,即中位数组为700-800同时,同时,f3=105,s2=72,s4=123,L=700,U=800,i=100,58六、众数六、众数(mode)1.一组数据中出现次数最多的变量值2.适合于数据量较多时使用3.不受极端值的影响4.一组数据可能没有众数或有几个众数5.主要用于分类数据,也可用于顺序数据和数值型数据59众数众数(不惟一性不惟一性)无众数无众数原始数据:10 5 9 12 6 8一个众数一个众数原始数据:6 5 9 8 5 5多于一个众数多于一个众数原始数据:25 28 28 36 42 4260o对于分组数据,众数计算方法:对于分组数据,众数计算方法:MMO O:表示众数表示众数L L:表示众数组的下组限:表示众数组的下组限 表示众数组次数与前一组次数之差表示众数组次数与前一组次数之差 表示众数组次数与后一组次数之差表示众数组次数与后一组次数之差 i i 表示众数组的组距表示众数组的组距(1)确定众数所在组)确定众数所在组(2)采用下面的近似公式计算众数)采用下面的近似公式计算众数下限公式:下限公式:上限公式:上限公式:61例:例:某厂工人月收入情况如表所示,试计算众数。月收入额(元)工人数向上累计向下累计500-6002424300600-7004872276700-800105177228800-90060237123900-100027264631000-110021285361100-120012297151200以上33003合计300-62解:(1)众数组为700-800 (2)代入下限公式计算众数63七、四分位数七、四分位数(quartile)1.排序后处于25%和75%位置上的值2.不受极端值的影响3.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QL LQQMMQQU U25%25%25%25%64四分位数四分位数(位置的确定位置的确定)原始数据:原始数据:分组数据:分组数据:65数值型数据的四分位数数值型数据的四分位数(9个数据的算例个数据的算例)【例】:【例】:9个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 966数值型数据的四分位数数值型数据的四分位数(10个数据的算例个数据的算例)【例】:【例】:10个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 67八、众数中位数和均值的关系八、众数中位数和均值的关系左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布均值均值均值均值均值均值 中位数中位数中位数中位数中位数中位数 众数众数众数众数众数众数对称分布对称分布对称分布对称分布对称分布对称分布 均值均值均值均值均值均值=中位数中位数中位数中位数中位数中位数=众数众数众数众数众数众数右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布众数众数众数众数众数众数 中位数中位数中位数中位数中位数中位数均值均值均值均值均值均值68众数、中位数、均值的特点和应用众数、中位数、均值的特点和应用1.众数n不受极端值影响n具有不惟一性n数据分布偏斜程度较大时应用2.中位数n不受极端值影响n数据分布偏斜程度较大时应用3.均值n易受极端值影响n数学性质优良n数据对称分布或接近对称分布时应用692.4 分布离散程度的测度分布离散程度的测度一、极差一、极差二、内距二、内距三、方差和标准差三、方差和标准差四、离散系数四、离散系数70一、极差一、极差(range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7 7 8 8 9 910107 7 8 8 9 9 1010 R=max(xi)-min(xi)5.计算公式为计算公式为71二、内距二、内距(Inter-Quartile Range,IQR)1.也称四分位差2.上四分位数与下四分位数之差o 内内 距距=Q3 Q13.反映了中间50%数据的离散程度4.不受极端值的影响5.可用于衡量中位数的代表性72三、方差和标准差三、方差和标准差(Variance and Standard deviation)1.离散程度的测度值之一2.最常用的测度值3.反映了数据的分布o反映了各变量值与均值的平均差异o根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4 6 8 10 124 6 8 10 12 x x=8 873总体方差和标准差(Population variance and Standard deviation)未分组数据:组距分组数据组距分组数据:未分组数据未分组数据:组距分组数据组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式74样本方差和标准差(simple variance and standard deviation)未分组数据:组距分组数据:组距分组数据:未分组数据:未分组数据:组距分组数据:组距分组数据:方差的计算公式方差的计算公式方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式标准差的计算公式注意:注意:注意:样本方差用自样本方差用自样本方差用自由度由度由度n nn-1-1-1去除去除去除!75样本方差自由度(degree of freedom)1.一组数据中可以自由取值的数据的个数2.当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则 x=5。当 x=5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值4.样本方差用自由度去除,其原因可从多方面解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量76四、离散系数四、离散系数(coefficient of variation)1.标准差与其相应的均值之比2.对数据相对离散程度的测度3.消除了数据水平高低和计量单位的影响4.用于对不同组别数据离散程度的比较5.计算公式为77离散系数(例题分析)某管理局所属某管理局所属8家企业的产品销售数据家企业的产品销售数据企业编号企业编号产品销售额(万元)产品销售额(万元)x1销售利润(万元)销售利润(万元)x21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例例例例 】某某管管理理局局抽抽查查了了所所属属的的8 8家家企企业业,其其产产品品销销售售数数据如表。试比较产品销售额与销售利润的离散程度据如表。试比较产品销售额与销售利润的离散程度78离散系数(例题分析)结结论论:计算结果表明,v1v2,说明产品销售额的离散程度小于销售利润的离散程度 v v1 1=536.25536.25309.19309.19=0.5770.577v v2 2=32.521532.521523.0923.09=0.7100.710792.5 分布偏态与峰度的测度分布偏态与峰度的测度一、偏态及其测度一、偏态及其测度二、峰度及其测度二、峰度及其测度80一、偏态及其测度一、偏态及其测度o偏态是对分布偏斜方向及程度的测度。o偏态系数用SK表示o计算公式未分组数据:已分组数据:81一、偏态及其测度一、偏态及其测度o偏态系数的取值:SK1 高度偏斜程度 SK=0 对称 0.5|SK|0 右偏|SK|越接近于0,偏斜程度越小82二、峰度及其测度o峰度是对数据分布平峰或尖峰程度的测度。o峰度通常是与标准正态分布相比较而言的。o峰度系数用K来表示o计算公式未分组数据:已分组数据:83二、峰度及其测度o峰度系数的取值:正态分布时,峰度系数K=0 当K0时,为尖峰分布;K0时,为扁平分布84统计函数o算术平均数:Averageo几何平均数:Geomeano中位数:Mediano众数:Modeo百分位数:Percentileo四分位数:Quartile85统计函数o样本方差:Varo样本标准差:STDEVo总体标准差:STDEVPo切尾均值:TRIMMEANo偏态系数:SKEWo峰态系数:KURT86用EXCEL进行描述统计分析87课堂练习 1.某工厂2009年7月份50个工人加工的零件登记如下:(1)对数据进行分组(分成10组),并编制次数分配表;(2)根据次数分配表,绘制直方图、折线图;(3)编制向上累计和向下累计频数表,并绘制累计曲线图;(4)计算工人加工零件平均数和标准差;(5)计算工人加工零件数的中位数和众数。100112117122126129135137140146153157159160162164171173175176181181183184186188191194196198201203203204209211219222224227229232237243252255260267282298882、银行为吸收存款,逐年提高存款利率,5年各年利率分别为5,6,7,8,10,若本金为1000元。问:(1)按算术平均数计算平均利率,第5年末的实际存款额是多少?(2)按几何平均数计算平均利率,第5年末的实际存款额是多少?(3)哪种方法比较合理,为什么?89

    注意事项

    本文(统计数据的描述专题培训ppt课件.ppt)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开