欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第2章数据的表述课件.ppt

    • 资源ID:82432230       资源大小:3.11MB        全文页数:127页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第2章数据的表述课件.ppt

    一、数据的分类一、数据的分类(一)(一)数据数据分类的原则分类的原则互斥原则:互斥原则:每一个数据只能划归到某一类型中,而每一个数据只能划归到某一类型中,而不能既是这一类,又是那一类不能既是这一类,又是那一类。穷穷尽尽原原则则:所所有有被被观观察察的的数数据据都都可可被被归归属属到到适适当当的的类型中,没有一个类型中,没有一个数据数据无从归属。无从归属。(二)(二)数据数据的类型的类型1.定性数据和定量数据定性数据和定量数据定性数据:定性数据:用文字描述的用文字描述的 。如如消消费费者者对对国国美美所所提提供供服服务务的的总总体体评评价价等等都都属属于于文文字描述的定性数据字描述的定性数据。定量数据:定量数据:用数字描述的用数字描述的。如如企企业业的的净资产额净资产额、净净利利润额润额等等。2.离散型数据和连续型数据离散型数据和连续型数据类型类型离散型变量:数据离散型变量:数据只能取整数只能取整数。如一家公司的如一家公司的职职工人数工人数。连续连续型型变变量的数据量的数据可以取介于两个可以取介于两个数数值值之之间间的任意的任意数数值值。如如销销售售额额、经济经济增增长长率等。率等。3.数据的数据的四个等级四个等级 定类数据定类数据例如,对人口按性别划分为男性和女性例如,对人口按性别划分为男性和女性两类两类。也称列名数据(分类数据),这种数据只也称列名数据(分类数据),这种数据只对事物的某种属性和类别进行具体的定性对事物的某种属性和类别进行具体的定性描述。描述。能能够够进进行行的的唯唯一一运运算算是是计计数数,即即计计算算每每一一个类型的频数或频率(即比重)。个类型的频数或频率(即比重)。定序数据定序数据例如,对企业按经营管理的水平和取得例如,对企业按经营管理的水平和取得的效益划分为一级企业、二级企业等。的效益划分为一级企业、二级企业等。定序定序数据,数据,也称顺序也称顺序数据,是数据,是对对事物所具事物所具有的属性顺序进行描述。有的属性顺序进行描述。定距定距数据数据如如1010、2020等。它不仅有明确的高低等。它不仅有明确的高低之分,而且可以计算差距,如之分,而且可以计算差距,如2020比比1010高高1010,比,比55高高1515等。等。也称间距也称间距数据数据,是比定序,是比定序数据的描述功能数据的描述功能更好更好一些的定量一些的定量数据数据。定定距距测测定定的的量量可可以以进进行行加加或或减减的的运运算算,但但却不能进行乘或除的运算。却不能进行乘或除的运算。定比定比数据数据如如产产量量、产产值值、固固定定资资产产投投资资额额、居居民民货币收入和支出、银行存款余额等。货币收入和支出、银行存款余额等。也称比率也称比率数据数据,是比定距,是比定距数据数据更高一级的更高一级的定量定量数据数据。它不仅可以进行加减运算,而。它不仅可以进行加减运算,而且还可以作乘除运算。且还可以作乘除运算。测定层次测定层次特征特征运算功能运算功能举例举例1.定类测定定类测定2.定序测定定序测定3.定距测定定距测定4.定比测定定比测定分类分类分类;排序分类;排序分类;排序;分类;排序;有基本测量单位有基本测量单位分类;排序;分类;排序;有基本测量单位;有基本测量单位;有绝对零点有绝对零点计数计数计数;排序计数;排序计数;排序;计数;排序;加减加减计数;排序;计数;排序;加减加减乘除乘除产业分类产业分类企业等级企业等级温度温度商品销售商品销售额额统计数据四个层次的概括统计数据四个层次的概括 知音漫客知音漫客问卷大调查问卷大调查Q1.看完看完知音漫客知音漫客第五集的感觉是什么?第五集的感觉是什么?1.非常有趣非常有趣 2.有点有趣有点有趣 3.一般一般 4.有点无趣有点无趣 5.非常无趣非常无趣Q2.你的性别是?你的性别是?1.女女 2.男男Q3.你的年龄是?你的年龄是?_ 岁岁Q4.平均每月购买几本杂志?平均每月购买几本杂志?_本本气温是什么数据?气温是什么数据?出生地呢?出生地呢?柔道的段位?柔道的段位?体重?体重?二、二、统计数据的整理统计数据的整理统计搜集到的大量资料是分散的,不系统的,只能说统计搜集到的大量资料是分散的,不系统的,只能说明各个单位的特征和属性,必须按照科学的原则加以明各个单位的特征和属性,必须按照科学的原则加以整理整理,使之条,使之条理化和系统化,理化和系统化,成为便于储存和传递的、成为便于储存和传递的、反映总体特征的数据。反映总体特征的数据。基本问题基本问题1.要弄清所面对的数据类型要弄清所面对的数据类型不不同同类类型型的的数数据据,采采取取不不同同的的处处理理方方式和方法式和方法2.对分类数据和顺序数据主要是作分类整理对分类数据和顺序数据主要是作分类整理3.对数值型数据则主要是作分组整理对数值型数据则主要是作分组整理4.适适合合于于低低层层次次数数据据的的整整理理和和显显示示方方法法也也适适合合于于高高层层次次的的数数据据;但但适适合合于于高高层层次次数数据据的的整整理理和和显显示示方方法法并并不不适适合合于于低低层层次次的的数数据据分类数据的整理与图示分类数据的整理与图示定类数据的整理定类数据的整理(基本过程基本过程)1.列出各类别列出各类别 2.2.计算各类别的频数计算各类别的频数3.制作频数分布表制作频数分布表4.用图形显示数据用图形显示数据分类分类频数频数比例比例百分比百分比比率比率ABCDE定类数据的整理定类数据的整理(可计算的统计量可计算的统计量)SPSS中的频数分布表中的频数分布表频数(频数(Frequency):变量值落在某个区变量值落在某个区间(或某个类别)中的次数。间(或某个类别)中的次数。百分比(百分比(Percent):各频数占总样本数的各频数占总样本数的百分比。百分比。有效百分比(有效百分比(Valid Percent):各频数占有各频数占有效样本数的百分比。效样本数的百分比。定类数据整理定类数据整理频数分布表频数分布表(例题分析例题分析)【例例例例】一一一一家家家家市市市市场场场场调调调调查查查查公公公公司司司司为为为为研研研研究究究究不不不不同同同同品品品品牌牌牌牌饮饮饮饮料料料料的的的的市市市市场场场场占占占占有有有有率率率率,对对对对随随随随机机机机抽抽抽抽取取取取的的的的一一一一家家家家超超超超市市市市进进进进行行行行了了了了调调调调查查查查。调调调调查查查查员员员员在在在在某某某某天天天天对对对对5050名名名名顾顾顾顾客客客客购购购购买买买买饮饮饮饮料料料料的的的的品品品品牌牌牌牌进进进进行行行行了了了了记记记记录录录录,如如如如果果果果一一一一个个个个顾顾顾顾客客客客购购购购买买买买某某某某一一一一品品品品牌牌牌牌的的的的饮饮饮饮料料料料,就就就就将将将将这这这这一一一一饮饮饮饮料料料料的的的的品品品品牌牌牌牌名名名名字字字字记记记记录录录录一一一一次次次次 。右右右右边边边边就是就是就是就是记录记录记录记录的原始数据的原始数据的原始数据的原始数据绿色绿色绿色绿色健康饮品健康饮品健康饮品健康饮品使用使用Excel计数函数计数函数(COUNTIF)如如果果只只需需要要计计算算某某一一类类别别的的数数据据个个数数,可可以以使使用用Excel中中的的统统计计函函数数【COUNTIF】。在在对对话话框框【Range】后后输输入入数数据据区区域域,在在【Criteria】后后输输入入数数字字、表表达达式式、字字符符串串等等,计计数数单单元元格格必必须须符符合的条件,即可得出结果合的条件,即可得出结果 例例如如,我我们们要要计计算算出出可可口口可可乐乐出出现现的的频频数数,在在【Range】后后输输入入A1:A50(数数据据所所在在的的区区域域),在在【Criteria】后后输输入入“可可口口可可乐乐”,结结果果为为15。如如果果数数据据区区域域是是数数值值型型数数据据,计计算算符符合合特特定定条条件件的的数数据据个个数数,则则可可在在【Criteria】后后输输入入“某某一一数数值值”、“某一数值某一数值”、“=某一数值某一数值”,等等,等等统计函数统计函数统计函数统计函数COUNTIFCOUNTIF分类数据的图示分类数据的图示条形图条形图(bar chart)1.用用宽宽度度相相同同的的条条形形的的高高度度或或长长短短来来表表示示各类别数据的图形各类别数据的图形2.有单式条形图、复式条形图等形式有单式条形图、复式条形图等形式3.主要用于反映分类数据的频数分布主要用于反映分类数据的频数分布4.绘绘制制时时,各各类类别别可可以以放放在在纵纵轴轴,称称为为条条形形图图,也也可可以以放放在在横横轴轴,称称为为柱柱形形图图(column chart)分类数据的图示分类数据的图示条形图条形图(例题分析例题分析)分类数据的图示分类数据的图示帕帕雷托图雷托图(Pareto chart)1.按按各各类类别别数数据据出出现现的的频频数数多多少少排排序序后后绘绘制制的的柱柱形图形图 2.主主要要用用于于展展示示分分类类数数据据的的分分布布分类数据的图示分类数据的图示对比条形图对比条形图(side-by-side bar chart)1.分分类类变变量量在在不不同同时时间间或或不不同同空空间间上上有有多多个个取值取值2.对对比比分分类类变变量量的的取取值值在在不不同同时时间间或或不不同同空空间间上上的的差差异异或或变化趋势变化趋势电脑品牌电脑品牌一季度一季度二季度二季度联想联想256468IBM285397康柏康柏247328戴尔戴尔563688分类数据的图示分类数据的图示对比条形图对比条形图(例题分析例题分析)分类数据的图示分类数据的图示饼图饼图(pie chart)1.也也称称圆圆形形图图,是是用用圆圆形形及及圆圆内内扇扇形形的的角角度度来表示数值大小的图形来表示数值大小的图形2.主主要要用用于于表表示示样样本本或或总总体体中中各各组组成成部部分分所所占的比例,用于研究结构性问题占的比例,用于研究结构性问题3.绘绘制制圆圆形形图图时时,样样本本或或总总体体中中各各部部分分所所占占的的百百分分比比用用圆圆内内的的各各个个扇扇形形角角度度表表示示,这这些些扇扇形形的的中中心心角角度度,按按各各部部分分数数据据百百分分比比占占3600的相应比例确定的相应比例确定分类数据的图示分类数据的图示饼图饼图(例题分析例题分析)顺序数据的整理顺序数据的整理(可计算的统计量可计算的统计量)1.累累积积频频数数(cumulative frequencies):各各类类别别频数的逐级累加频数的逐级累加2.累累积积频频率率(cumulative percentages):各各类类别别频率频率(百分比百分比)的逐级累加的逐级累加 顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)【例例例例】在在在在一一一一项项项项城城城城市市市市住住住住房房房房问问问问题题题题的的的的研研研研究究究究中中中中,研研研研究究究究人人人人员员员员在在在在甲甲甲甲乙乙乙乙两两两两个个个个城城城城市市市市各各各各抽抽抽抽样样样样调调调调查查查查300300户户户户,其其其其中中中中的的的的一一一一个个个个问问问问题题题题是是是是:“您您您您对对对对您您您您家家家家庭庭庭庭目目目目前前前前的的的的住住住住房房房房状状状状况是否满意?况是否满意?况是否满意?况是否满意?”1 1 非非非非 常常常常 不不不不满满满满意意意意;2 2不不不不满满满满意意意意;3 3一一一一般般般般;4 4满满满满意;意;意;意;5 5非常满意。非常满意。非常满意。非常满意。甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数(户户)百分比百分比(%)向下累积向下累积 向上累积向上累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 836311510 24132225270300 8.0 44.0 75.0 90.0100.0300276168 75 30100.092562510合计合计300100.0顺序数据的频数分布表顺序数据的频数分布表(例题分析例题分析)乙城市家庭对住房状况评价的频数分布乙城市家庭对住房状况评价的频数分布回答类别回答类别乙城市乙城市户数户数(户户)百分比百分比(%)向上累积向上累积 向下累积向下累积 户数户数(户户)百分比百分比(%)户数户数(户户)百分比百分比(%)非常不满意非常不满意 不满意不满意 一般一般 满意满意 非常满意非常满意2199786438 7.033.026.021.312.7 21120198262300 7.0 40.0 66.0 87.3100.0300279180102 38100.0 93.0 60.0 34.0 12.7合计合计300100.0顺序数据的图示顺序数据的图示累计频数分布图累计频数分布图(例题分析例题分析)243001322252700100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(a)向上累积向上累积27616830300750100200300400 非常不满意 不满意 一般 满意 非常满意累积户数(户)(b)向下累积向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布环形图环形图(doughnut chart)1.环环形形图图中中间间有有一一个个“空空洞洞”,样样本本或或总总体体中中的每一部分数据用环中的一段表示的每一部分数据用环中的一段表示2.与饼图类似,但又有区别与饼图类似,但又有区别饼图只能显示一个总体各部分所占的比例饼图只能显示一个总体各部分所占的比例环环形形图图则则可可以以同同时时绘绘制制多多个个样样本本或或总总体体的的数数据据系列,每一个样本或总体的数据系列为一个环系列,每一个样本或总体的数据系列为一个环3.用于结构比较研究用于结构比较研究 4.用于展示分类和顺序数据用于展示分类和顺序数据环形图环形图(例题分析例题分析)8%36%31%15%7%33%26%21%13%10%非常不满意 不满意 一般 满意 非常满意 甲乙两城市家庭对住房状况的评价甲乙两城市家庭对住房状况的评价数值型数据的整理与展示数值型数据的整理与展示数据分组数据分组分组方法分组方法等距分组等距分组异距分组异距分组单变量值分组单变量值分组(要点要点)1.将一个变量值作为一组2.适合于离散变量3.适合于变量值较少的情况组距分组组距分组(要点要点)1.将变量值的一个区间作为一组2.适合于连续变量3.适合于变量值较多的情况4.需要遵循“不重不漏”的原则5.可采用等距分组,也可采用不等距分组 组距分组组距分组(步骤步骤)1.确确定定组组数数:组组数数的的确确定定应应以以能能够够显显示示数数据据的的分分布布特特征征和和规规律律为为目目的的。在在实实际际分分组组时时,组组数数一一般般为为5 K 15,可以按可以按 Sturges 提出的经验公式确定组数提出的经验公式确定组数K2.2.确确确确定定定定组组组组距距距距:组组组组距距距距(class(class width)width)是是是是一一一一个个个个组组组组的的的的上上上上限限限限与与与与下下下下限限限限之之之之差差差差,可可可可根根根根据据据据全全全全部部部部数数数数据据据据的的的的最最最最大大大大值值值值和和和和最最最最小小小小值值值值及及及及所所所所分分分分的的的的组数来确定,即组数来确定,即组数来确定,即组数来确定,即 组距组距组距组距(最大值最大值最大值最大值 -最小值最小值最小值最小值)组数组数组数组数 3.3.统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表统计出各组的频数并整理成频数分布表 组距分组组距分组(几个概念几个概念)1.下限下限(low limit):一个组的最小值一个组的最小值2.上限上限(upper limit):一个组的最大值一个组的最大值3.组距组距(class width):上限与下限之差上限与下限之差4.组中值组中值(class midpoint):下限与上限之下限与上限之间的中点值间的中点值下限值下限值+上限值上限值2组中值组中值=频数分布表的编制频数分布表的编制(例题分析例题分析)【例例例例】表表表表 中中中中是是是是 某某某某 电电电电 脑脑脑脑 公公公公司司司司 20052005年年年年 前前前前四四四四 个个个个 月月月月 各各各各 天天天天的的的的 销销销销 售售售售 量量量量 数数数数据据据据(单单单单位位位位:台台台台)。试试试试对对对对数数数数据据据据进行分组进行分组进行分组进行分组频数分布表的编制频数分布表的编制(步骤步骤)1.确定组数:根据 Sturges 提出的经验公式得组数K为2.确定各组的组距 组距组距(237-141)10=9.6 103.用用Excel制作频数分布表制作频数分布表 等距分组表等距分组表(上下组限重叠上下组限重叠)等距分组表等距分组表(上下组限间断上下组限间断)等距分组表等距分组表(使用开口组使用开口组)使用使用Excel频数函数频数函数(FREQUENCY)Excel的的【直直方方图图】工工具具的的缺缺陷陷是是:频频数数分分布布及及直直方方图图没没有有与与数数据据链链接接,当当改改变变任任何何一一个个数数据据时时,频频数数分分布表和直方图不会跟着改变布表和直方图不会跟着改变使使用用统统计计函函数数【FREQUENCY】创创建建频频数数分分布布表表和和直方图可解决这一问题。具体步骤是直方图可解决这一问题。具体步骤是选选择择与与接接受受区区域域相相临临近近的的单单元元格格区区域域,作作为为频频数数分分布布表表输出的区域输出的区域选择统计函数中的选择统计函数中的【FREQUENCY】函数函数在在对对话话框框【Date-array】后后输输入入数数据据区区域域,在在【Bins-array】后输入接受区域后输入接受区域同时按下同时按下“Ctrl-Shift-Enter”组合键,即得到频数分布组合键,即得到频数分布统计函数统计函数统计函数统计函数FREQUENCYFREQUENCY数值型数据的图示数值型数据的图示Excel分组数据分组数据直方图和折线图直方图和折线图分组数据分组数据直方图直方图(histogram)1.用于展示分组数据分布的一种图形用于展示分组数据分布的一种图形2.用矩形的宽度和高度来表示频数分布用矩形的宽度和高度来表示频数分布本质上是用矩形的本质上是用矩形的面积面积来表示频数分布来表示频数分布3.在在直直角角坐坐标标系系中中,用用横横轴轴表表示示数数据据分分组组,纵纵轴轴表表示示频频数数或或频频率率,各各组组与与相相应应的的频频数数就形成了一个矩形,即直方图就形成了一个矩形,即直方图4.直方图下的总面积等于直方图下的总面积等于1分组数据的图示分组数据的图示(直方图的绘制直方图的绘制)140140 150150210210直方图下的面直方图下的面积之和等于积之和等于11某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图某电脑公司销售量分布的直方图我我我我一一一一眼眼眼眼就就就就看看看看出出出出来来来来了了了了,销销销销售售售售量量量量在在在在 170170 180180之之之之间间间间的的的的天天天天数数数数最最最最多多多多!190190 200200180180160160 170170频频频频频频数数数数数数(天天天天天天)25252020151510105 53030220220 230230 240240销售量(台)销售量(台)分组数据分组数据直方图直方图(直方图与条形图的区别直方图与条形图的区别)1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据分组数据分组数据折线图折线图(frequency polygon)1.折线图也称频数多边形图折线图也称频数多边形图2.是是在在直直方方图图的的基基础础上上,把把直直方方图图顶顶部部的的中中点点(组组中值中值)用直线连接起来,再把原来的直方图抹掉用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是折线图的两个终点要与横轴相交,具体的做法是第第一一个个矩矩形形的的顶顶部部中中点点通通过过竖竖边边中中点点(即即该该组组频频数数一一半半的的位位置置)连连接接到到横横轴轴,最最后后一一个个矩矩形形顶顶部部中中点点与与其其竖边中点连接到横轴竖边中点连接到横轴折折线线图图下下所所围围成成的的面面积积与与直直方方图图的的面面积积相相等等,二二者者所表示的频数分布一致所表示的频数分布一致分组数据的图示分组数据的图示(折线图的绘制折线图的绘制)折线图与直方图折线图与直方图下的面积相等!下的面积相等!140140 150150210210某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图某电脑公司销售量分布的折线图190190 200200180180160160 170170220220 230230240240频频频频频频数数数数数数(天天天天天天)25252020151510105 53030销售量(台)销售量(台)未分组数据未分组数据茎叶图茎叶图(stem-and-leaf display)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由“茎茎”和和“叶叶”两两部部分分构构成成,其其图图形形是是由由数字组成的数字组成的3.以以该该组组数数据据的的高高位位数数值值作作树树茎茎,低低位位数数字字作作树叶树叶4.树叶上只保留最后一位数字树叶上只保留最后一位数字5.对对于于n(20 n 300)个个数数据据,茎茎叶叶图图最最大大行行数不超过数不超过 L=10 lg n 未分组数据茎叶图(例题分析)某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图某电脑公司销售量分布的茎叶图茎叶图与直方图的区别茎叶图与直方图的区别 茎叶图类似于横置的直方图,但又有区别茎叶图类似于横置的直方图,但又有区别直方图可观察一组数据的分布状况,但没有给出具直方图可观察一组数据的分布状况,但没有给出具体的数值体的数值茎叶图既能给出数据的分布状况,又能给出每一个茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息原始数值,保留了原始数据的信息直方图适用于大批量数据,茎叶图适用于小批量数直方图适用于大批量数据,茎叶图适用于小批量数据据随时间起舞的图随时间起舞的图线图线图(line plotline plot)1.表示时间序列数据趋势的图形表示时间序列数据趋势的图形2.时间一般绘在横轴,数据绘在纵轴时间一般绘在横轴,数据绘在纵轴3.图形的长宽比例大致为图形的长宽比例大致为10:74.一一般般情情况况下下,纵纵轴轴数数据据下下端端应应从从“0”开开始始,以以便便于于比比较较。数数据据与与“0”之之间间的的间间距距过过大大时,可以采取折断的符号将纵轴折断时,可以采取折断的符号将纵轴折断(例题分析例题分析)【例例例例】我国我国我国我国1991199120032003年城乡居民家年城乡居民家年城乡居民家年城乡居民家庭的人均收入庭的人均收入庭的人均收入庭的人均收入数据如右表。数据如右表。数据如右表。数据如右表。试绘制线图试绘制线图试绘制线图试绘制线图¥19912003年城乡居民家庭人均收入年城乡居民家庭人均收入年份年份城镇居民城镇居民农村居民农村居民19911992199319941995199619971998199920002001200220031700.62026.62577.43496.24283.04838.95160.35425.15854.06280.06859.07702.88472.2 708.6 784.0 921.61221.01577.71926.12091.12162.02210.32253.42366.42475.62622.2(例题分析例题分析)留意象形图右图是象形图,象形图右图是象形图,象形图其实就是柱状图,以图其实就是柱状图,以图形取代柱体。这个图的形取代柱体。这个图的目标是广告商,他们正目标是广告商,他们正在考虑预算要花在什么在考虑预算要花在什么地方。这个图显示,地方。这个图显示,时代杂志时代杂志吸引了大吸引了大量的广告支出。真是这量的广告支出。真是这样的吗?笔顶端的数字样的吗?笔顶端的数字显示显示 在在时代杂志时代杂志的的广告费是广告费是新闻周刊新闻周刊的的1.64倍。倍。注意刻度改变线图的刻度所产生的效改变线图的刻度所产生的效果:两个图所展示的是同一果:两个图所展示的是同一组数据,但是右边的图使得组数据,但是右边的图使得增加的速度看起来快得多。增加的速度看起来快得多。怎样把图画好怎样把图画好一定要在表示与说明里表示清楚,图里面一定要在表示与说明里表示清楚,图里面变量变量是什么,是什么,单位单位是什么,以及是什么,以及资料来源资料来源。要让数据很醒目要让数据很醒目。要确实注意到,抓住看图者。要确实注意到,抓住看图者注意力的是数据本身,而不是标示,格子,或注意力的是数据本身,而不是标示,格子,或者背景。你是在画一个呈现数据的图,而不是者背景。你是在画一个呈现数据的图,而不是在搞艺术创作。在搞艺术创作。要注意实际上眼睛会捕捉到什么要注意实际上眼睛会捕捉到什么。避免用象形。避免用象形图,而且要注意刻度。也不要用很炫目的图,而且要注意刻度。也不要用很炫目的“三三维空间维空间”效果,因为那只会让人看得迷迷糊糊,效果,因为那只会让人看得迷迷糊糊,不会增加看的人对数据的了解。不会增加看的人对数据的了解。蹩脚的图右图显示,右图显示,25岁以上女性拥岁以上女性拥有高学位的比有高学位的比率增加了。一率增加了。一共只有五个数共只有五个数据点。所以线据点。所以线图应该很简单,图应该很简单,但右图可不简但右图可不简单,画图的人单,画图的人大概忍不住在大概忍不住在背景中加画些背景中加画些东西。东西。三、变量的概括性度量三、变量的概括性度量4-4-6060 第四章 综合指标4-4-6262 4-4-6363 众众 数数分布数列中出现频数分布数列中出现频数(率)最多率)最多的变量值。的变量值。存在条件存在条件存在条件存在条件q 总体体单位数位数较多;多;q 变量量值的次数分布有明的次数分布有明显的集中的集中趋势特特特特 点点点点q不受极端值和开口组的影响,增强对不受极端值和开口组的影响,增强对数列一般水平的代表性;数列一般水平的代表性;q是一个不易确定的平均指标是一个不易确定的平均指标例:例:7名工人日产量(件)为名工人日产量(件)为4、5、6、6、6、7、8。则众数是。则众数是6。由未分组资料确定众数由未分组资料确定众数4-4-6565 【例例例例】:已知已知已知已知某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下某企业某日工人的日产量资料如下:计算工人日产量的众数。计算工人日产量的众数。计算工人日产量的众数。计算工人日产量的众数。日产量(件)日产量(件)日产量(件)日产量(件)工人人数(人)工人人数(人)工人人数(人)工人人数(人)10 10 11 11 12 12 13 13 141470 70 100 100 380 380 150 150 100100合计合计合计合计800800单项数列4-4-6666 【例例例例】以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,计算教师年龄的众数。计算教师年龄的众数。计算教师年龄的众数。计算教师年龄的众数。教师按年龄分组(岁)教师按年龄分组(岁)人数(人)人数(人)20308304028405016506010合计合计62组距数列组距数列组距数列组距数列4-4-6767 中位数中位数 各各单位位变量量值按按顺序排列,位序排列,位于中点位置的于中点位置的变量量值。1 1 1 1、未分组资料:、未分组资料:、未分组资料:、未分组资料:45 62 74 78 79 81 85 87 90 45 62 74 78 79 81 85 87 90 36 45 48 78 81 84 85 8836 45 48 78 81 84 85 88变量值的个数是奇数变量值的个数是奇数:变量值的个数是偶数变量值的个数是偶数:排序:排序:中位数位次:中位数位次:计算中位数的位次:算中位数的位次:中位数为中位数为:(78+81)/2=79.5中位数为中位数为:79 确定中位数组确定中位数组 根据公式计算中位数(组距式分组)根据公式计算中位数(组距式分组)2 2 2 2、分组资料:、分组资料:、分组资料:、分组资料:4-4-6969 【例例例例】某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:某企业某日工人的日产量资料如下:计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。计算该企业该日全部工人日产量的中位数。日产量(件)日产量(件)工人人数(人)工人人数(人)向下累计次数向下累计次数(人)(人)10 11 12 13 1470 100 380 150 10070 170 550 700 800合计合计800 单项数列单项数列中位数的位次:中位数的位次:4-4-7070 【例例例例】以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,以下是教师按年龄分组的资料,计算教师年龄的中位数。计算教师年龄的中位数。计算教师年龄的中位数。计算教师年龄的中位数。教师按年龄分教师按年龄分组(岁)组(岁)人数人数(人)(人)向下累向下累计人计人数数20308304028405016506010合计合计628365262-组距数列组距数列四分位数四分位数(quartilequartile)1.1.排序后处于排序后处于25%25%和和75%75%位置上的值位置上的值2.不受极端值的影响不受极端值的影响3.主主要要用用于于顺顺序序数数据据,也也可可用用于于数数值值型型数数据据,但不能用于分类数据但不能用于分类数据QQL LQQMMQQU U25%25%25%25%四分位数四分位数(位置的确定位置的确定)原始数据:原始数据:分组数据:分组数据:数值型数据的四分位数数值型数据的四分位数(9个数据的算例个数据的算例)【例例】:9个家庭的人均月收入数据个家庭的人均月收入数据原始数据原始数据:1500 750 780 1080 850 960 2000 1250 1630排排 序序:750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9数值型数据的四分位数(10个数据的算例)【例例】:10个家庭的人均月收入数据个家庭的人均月收入数据排排 序序:660 750 780 850 960 1080 1250 1500 1630 2000位位 置置:1 2 3 4 5 6 7 8 9 10 顺序数据的四分位数顺序数据的四分位数(例题分析例题分析)解:解:解:解:QL位置位置=(300)/4=75 QU位置位置=(3300)/4 =225 从从累累计计频频数数看看,QL在在“不不满意满意”这一组别中;这一组别中;QU在在“一般一般”这一组别中这一组别中 四分位数为四分位数为四分位数为四分位数为 Q QL L =不满意不满意不满意不满意 QQU U =一般一般一般一般甲城市家庭对住房状况评价的频数分布甲城市家庭对住房状况评价的频数分布回答类别回答类别甲甲城市城市户数户数 (户户)累计频数累计频数 非非常常不不满满意意 不满意不满意 一般一般 满意满意 非常满意非常满意 24108 93 45 30 24132225270300合计合计300箱线图箱线图(box plot)1.用于显示未分组的原始数据的分布用于显示未分组的原始数据的分布2.由由一一组组数数据据的的5个个特特征征值值绘绘制制而而成成,它它由由一一个个箱箱子和两条线段组成子和两条线段组成3.绘制方法绘制方法首首先先找找出出一一组组数数据据的的5个个特特征征值值,即即最最大大值值、最最小小值值、中中位位数数Me和和两两个个四四分分位位数数(下下四四分分位位数数QL和和上上四分位数四分位数QU)连连接接两两个个四四分分位位数数画画出出箱箱子子,再再将将两两个个极极值值点点与与箱箱子相连接子相连接该箱线图也称为该箱线图也称为Median/Quart./Range箱线图箱线图 未分组数据未分组数据单批数据箱线图单批数据箱线图(箱线图的构成箱线图的构成)中位数中位数4 46 68 810101212QQU UUQQL LLX X最大值最大值最大值X X最小值最小值最小值Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图未分组数据未分组数据单批数据箱线图单批数据箱线图(例题分析例题分析)最小值最小值最小值141141141最大值最大值最大值237237237中位数中位数中位数182182182下四分位数下四分位数下四分位数170.25170.25170.25上四分位数上四分位数上四分位数197197197140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240140 150 160 170 180 190 200 210 220 230 240某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的某电脑公司销售量数据的Median/Quart./RangeMedian/Quart./Range箱线图箱线图箱线图箱线图分布的形状与箱线图分布的形状与箱线图 对称分布对称分布对称分布对称分布对称分布对称分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU左偏分布左偏分布左偏分布左偏分布左偏分布左偏分布Q QQL LL中位数中位数中位数中位数中位数中位数 Q QQU UU右偏分布右偏分布右偏分布右偏分布右偏分布右偏分布Q QQL LL 中位数中位数中位数中位数中位数中位数 Q QQU UU不同分布的箱线图不同分布的箱线图不同分布的箱线图不同分布的箱线图未分组数据未分组数据多批数据箱线图多批数据箱线图(例题分析例题分析)【例例例例】从从从从某某某某大大大大学学学学经经经经济济济济管管管管理理理理专专专专业业业业二二二二年年年年级级级级学学学学生生生生中中中中随随随随机机机机抽抽抽抽取取取取1111人人人人,对对对对 8 8门门门门 主主主主要要要要课课课课程程程程的的的的考考考考试试试试成成成成绩绩绩绩进进进进行行行行调调调调查查查查,所所所所得得得得结结结结果果果果如如如如右右右右表表表表。试试试试绘绘绘绘制制制制各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的批批批批比比比比较较较较箱箱箱箱线线线线图图图图,并并并并分分分分析析析析各各各各科科科科考考考考试试试试成成成成绩绩绩绩的的的的分分分分布布布布特征特征特征特征11名学生各科的考试成绩数据名学生各科的考试成绩数据课程名称课程名称学生编号学生编号1234567891011英语英语经济数学经济数学西方经济学西方经济学市场营销学市场营销学财务管理财务管理基础会计学基础会计学统计学统计学计算机应用基础计算机

    注意事项

    本文(第2章数据的表述课件.ppt)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开