数据的计量尺度精选PPT.ppt
《数据的计量尺度精选PPT.ppt》由会员分享,可在线阅读,更多相关《数据的计量尺度精选PPT.ppt(58页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于数据的计量尺度第1页,讲稿共58张,创作于星期二(1)定类尺度定类尺度(Nominal Scale)也称分类尺度也称分类尺度例如:例如:性别、民族、职业性别、民族、职业数据表现为数据表现为“类别类别”各类之间无等级次序各类之间无等级次序 各类别可以用数字代码表示各类别可以用数字代码表示根据定类尺度得到的数据为根据定类尺度得到的数据为分类数据。分类数据。第2页,讲稿共58张,创作于星期二(2)定序尺度定序尺度(Ordinal Scale)也称顺序尺度也称顺序尺度例如例如健康状况、质量等级健康状况、质量等级可对等级、大小等排序可对等级、大小等排序未测量出类别之间的准确差值未测量出类别之间的准确
2、差值根据定序尺度得到的数据为顺序数据。根据定序尺度得到的数据为顺序数据。第3页,讲稿共58张,创作于星期二(3)定距尺度定距尺度(Interval Scale)也称间隔尺度也称间隔尺度例如例如年份、摄氏温度年份、摄氏温度数据表现为数据表现为“数值数值”可以进行加减运算可以进行加减运算“0”是只是尺度上的一个点,不代表是只是尺度上的一个点,不代表“不不存在存在”根据定距尺度得到的数据为间距数据。根据定距尺度得到的数据为间距数据。第4页,讲稿共58张,创作于星期二(4)定比尺度定比尺度(Ratio Scale)也称比率尺度也称比率尺度例如例如体重、身高体重、身高数据表现为数据表现为“数值数值”可以
3、进行加减、乘除运算可以进行加减、乘除运算“0”表示表示“没有没有”或或“不存在不存在”根据定比尺度得到的数据为比率数据。根据定比尺度得到的数据为比率数据。第5页,讲稿共58张,创作于星期二四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较定类尺度定类尺度 定序尺度定序尺度 定距尺度定距尺度 定比尺度定比尺度 分分类类(=,)排序排序()间间距距(+,-)比比值值(,)计量尺度计量尺度数学特性数学特性第6页,讲稿共58张,创作于星期二四种计量尺度的比较四种计量尺度的比较1、四种尺度所包含的信息量是依次递增的,级别、四种尺度所包含的信息量是依次递增的,级别由低到高。由低到高。
4、2、根据较高层次的计量尺度可以获得较低层次的计、根据较高层次的计量尺度可以获得较低层次的计量尺度。量尺度。3、不同的尺度数据对应着不同数据显示方法和分、不同的尺度数据对应着不同数据显示方法和分析方法。析方法。第7页,讲稿共58张,创作于星期二8数据的基本类型第8页,讲稿共58张,创作于星期二9问卷题目的类型大致可以分为单选、多选、排序、开放题目四种类型,他们的变量的定义和处理的方法各有不同,详细举例介绍如下:第9页,讲稿共58张,创作于星期二3.2 统计图数据类型数据类型定性数据定性数据定量数据定量数据条条形形图图饼饼 图图线线 图图茎茎叶叶图图箱箱线线图图直直方方图图第10页,讲稿共58张,
5、创作于星期二3.2.1 线图(Line Chart)利用线形的升降起伏来表现描述的变量在一段时期内的变动情况,主要用于显示时间数列的数据。1996年-2003年城乡居民人民币储蓄存款年底余额第11页,讲稿共58张,创作于星期二双变项线形图(延伸线)输出结果双变项线形图(复线图)输出结果3.2.1 线图(Line Chart)第12页,讲稿共58张,创作于星期二3.2.2 条形图(Bar Chart)用宽度相同的条形高度或长短来表示数据变动的图形,条形的排列可以横排,也可以纵排。条形图有单式、复式等形式。2003年我国就业人员情况(万人)第13页,讲稿共58张,创作于星期二3.2.3 圆形图(P
6、ie Chart)也叫饼图,它是用圆形及圆内扇形的面积来表示数值大小的图形。主要用于总体内部的结构,各组成部分所占比例等。2003年我国国内生产总值中各产业比重第14页,讲稿共58张,创作于星期二3.2.4 直方图(Histogram)用来反映定量变量的分布状况。在统计分组的基础上,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。注意注意对不等距分组:纵轴必须表示为频数密度纵轴必须表示为频数密度。频数密度频数密度=频数/组距(面积之和=总频数)手工绘制直方图时需要先对数据进行分组;用统计软件spss作直方图时统计软件可以自动进行分组。第15页,讲稿共58张,
7、创作于星期二直方图(等距分组)某会计师事务所对某会计师事务所对20家公司进家公司进行年终审计所需时间(天)的行年终审计所需时间(天)的频数分布表频数分布表审计时间(天)频数10-15415-20820-25525-30230-351合计20第16页,讲稿共58张,创作于星期二直方图(不等距分组)某会计师事务所对某会计师事务所对20家公司家公司进行年终审计所需时间(天)进行年终审计所需时间(天)的的频数分布频数分布表表审计时间(天)频数频数密度10-1540.815-2081.620-255125-3530.3合计20-第17页,讲稿共58张,创作于星期二直方图与条形图的异同都是用来反映数据的分
8、布状况,适用于不同类型的数据。条形图条形图是用条形的高度表示各类别频数的多少,其宽度(表示类别)则是固定的。直方图直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义。直方图的各矩形通常是连续排列,条形图则是分开排列。第18页,讲稿共58张,创作于星期二主要用于显示未分组的原始数据的分布。由“茎”和“叶”两部分构成,其图形是由数字组成的。通常以数据的高位数值作树茎,低位数字作树叶,树叶上只保留一位数字。树叶的竖列要对齐,以计算各组的次数。原始数据:24,26,24,21,27,27,30,41,32,38从小到大排序后的数据:21,2
9、4,24,26,27,27,30,32,38,413 0 2 84 12 1 4 4 6 7 7303.2.5 茎叶图(Stem-and-Leaf Display)茎叶图第19页,讲稿共58张,创作于星期二SPSS Statistics生成的一个茎叶图40名教师的年龄的数据:40,41,48,51,37,35,36,50,33,42,28,33,36,29,28,29,34,35,27,36,28,29,34,26,35,40,27,43,45,39,42,41,48,55,43,42,42,51,52,64stem-and-leaf Plot frequency stem&leaf 9.00
10、 2.677888999 4.00 3.3344 8.00 3.55566679 10.00 4.0011222233 3.00 4.588 4.00 5.0112 1.00 5.5 1.00extremes (=64)stem width:10.00 each leaf:1 case(s)第20页,讲稿共58张,创作于星期二常用的集中趋势的测度指标:算术平均数中位数众数集中趋势集中趋势:一组数据向其中心:一组数据向其中心值靠拢的倾向和程度。值靠拢的倾向和程度。集中趋势测度集中趋势测度:寻找数据水平:寻找数据水平的代表值或中心值。的代表值或中心值。第21页,讲稿共58张,创作于星期二4.1.1
11、 算术平均数(均值,Arithmetic Mean)总体均值常用 表示。样本均值常用 表示。样本均值的计算公式:简单平均数:加权平均数(分组数据):4.1 集中趋势的测定集中趋势的测定第22页,讲稿共58张,创作于星期二算术平均数的性质1、所有的定量数据都有算术平均数。2、计算算术平均数时使用了所有数据。3、一组数只有一个均值。4、各变量值与均值的离差之和等于零。张村有个张张村有个张千万,千万,九个邻居穷九个邻居穷光蛋;光蛋;统计平均算资统计平均算资产,产,个个都是张个个都是张百万。百万。缺点:缺点:易受极端值的影响。第23页,讲稿共58张,创作于星期二一组数据按大小顺序排列后,处在数列中点位
12、置的数值。特点:对一组数据是唯一的。不受极端值的影响。主要用于顺序数据,也可用数值型数据,但不能用于分类数据。4.1.2 中位数中位数(Median)4.1 集中趋势的测定集中趋势的测定第24页,讲稿共58张,创作于星期二根据原始数据计算中位数n为奇数时等于第(n+1)/2个数。n为偶数时等于第n/2和n/2+1个数的平均值1,2,5,9,11中位数中位数=51,2,5,9,11,18中位数中位数=(5+9)/2=7第25页,讲稿共58张,创作于星期二一组数据中出现次数最多的变量值。主要特点:不受极端值的影响。有的数据无众数或有多个众数。对未分组定量资料很少使用。4.1.3 众数众数(Mode
13、)4.1 集中趋势的测定集中趋势的测定第26页,讲稿共58张,创作于星期二众数的不惟一性众数众数无众数无众数众数众数 1众数众数2第27页,讲稿共58张,创作于星期二众数、中位数和算术平均数的关系对称分布对称分布 均值均值=中位数中位数=众数众数左偏分布左偏分布均值均值 中位数中位数 众数众数右偏分布右偏分布众数众数 中位数中位数均值均值第28页,讲稿共58张,创作于星期二反映各变量值远离其中心值的程度(离散程度),从另一个侧面说明了集中趋势测度值的代表程度。常用指标:常用指标:全距(极差)四分位距方差和标准差离散系数 4.2 离散程度的测定离散程度的测定三三个个不不同同的的曲曲线线表表示示三
14、三个个不不同同的的总总体体,其其均均值相同值相同,但,但离散趋势不同离散趋势不同。第29页,讲稿共58张,创作于星期二全距也称极差,是一组数据的最大值与最小值之差。R=最大值最小值组距分组数据可根据最高组上限-最低组下限计算。受极端值的影响。全距=?2,5,6,7,8,9,10,12,15,16,204.2.1 全距全距(Range)4.2 离散程度的测定离散程度的测定7 8 9 107 8 9 10第30页,讲稿共58张,创作于星期二等于上四分位数与下四分位数之差反映了中间50%数据的离散程度,数值越小说明中间的数据越集中。不受极端值的影响。可以用于衡量中位数的代表性。2,5,6,7,8,9
15、,10,12,15,16,20Q1=6,Q2=9,Q3=154.2.2 四分位距四分位距(Inter-Quartile Range)4.2 离散程度的测定离散程度的测定第31页,讲稿共58张,创作于星期二方差是一组数据中各数值与其算术平均数离差平方的平均数,标准差是方差正的平方根。总体方差和样本方差的符号不同,计算公式也不一样。是反映定量数据离散程度的最常用的指标。4.2.3 方差和标准差方差和标准差 4.2 离散程度的测定离散程度的测定4 6 8 10 12x=8.3第32页,讲稿共58张,创作于星期二方差的计算公式总体方差总体方差 样本方差样本方差 未分组数据分组数据 样本方差用(样本方差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 计量 尺度 精选 PPT
限制150内