统计数据的描述(3).ppt
《统计数据的描述(3).ppt》由会员分享,可在线阅读,更多相关《统计数据的描述(3).ppt(160页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 2章章 统计数据的描述统计数据的描述学习目标学习目标1.了解数据的计量尺度了解数据的计量尺度2.了解统计数据的来源和数据的质量了解统计数据的来源和数据的质量要求要求3.掌握数值型数据的整理方法掌握数值型数据的整理方法4.掌握数据集中趋势和离散程度的测掌握数据集中趋势和离散程度的测度方法度方法5.掌握统计表和统计图的使用掌握统计表和统计图的使用2.1 数据的计量尺度数据的计量尺度 按照计量学的一般分类方法,把按照计量学的一般分类方法,把数据由低到高分为四种计量尺度:数据由低到高分为四种计量尺度:1、列名尺度、列名尺度、2、顺序尺度、顺序尺度、3、间隔尺度、间隔尺度、4、比例尺度。、比例尺度
2、。一一、列名尺度:、列名尺度:最粗略,仅能分类。最粗略,仅能分类。二、顺序尺度:二、顺序尺度:精确度稍高,可以表现次序,精确度稍高,可以表现次序,比较优劣,但不可运算。比较优劣,但不可运算。三、间隔尺度:三、间隔尺度:能精确进行加减计量,可计能精确进行加减计量,可计算差异,算差异,“0”有具体含义,不表示有具体含义,不表示“不存不存在在”。不可计算倍率。不可计算倍率。四、比例尺度:四、比例尺度:能精确进行四则运算,可计能精确进行四则运算,可计算差异及计算倍率,算差异及计算倍率,“0”表示表示“不存在不存在”。四种计量尺度的比较四种计量尺度的比较2.1.1 列名尺度列名尺度(P17)1.也称名义
3、尺度或分类尺度也称名义尺度或分类尺度2.计量层次最低计量层次最低3.对事物进行平行的分类对事物进行平行的分类4.各类别可以指定数字代码表示各类别可以指定数字代码表示5.使用时必须符合类别穷尽和互斥的要求使用时必须符合类别穷尽和互斥的要求6.数据表现为数据表现为“类别类别”,属于品质标志,属于品质标志7.具有具有=或或,是或否,是或否的数学特性的数学特性列名尺度数据举例列名尺度数据举例人口的民族人口的民族(汉、蒙、苗、白汉、蒙、苗、白)、人口的性别人口的性别(男、女男、女)、,、,企业所属行业企业所属行业(制造业、建筑业、金融业制造业、建筑业、金融业),某类产品的规格、型号等标志某类产品的规格、
4、型号等标志以上标志的计量尺度都属于列名尺度,它们都以上标志的计量尺度都属于列名尺度,它们都仅对事物起分类作用仅对事物起分类作用,仅仅是个便于相互区别,仅仅是个便于相互区别的符号,不能对各分类起排序、比较的作用,的符号,不能对各分类起排序、比较的作用,各类之间也都不能比较差异及进行运算。各类之间也都不能比较差异及进行运算。2.1.2 顺序尺度顺序尺度(P17)1.也称定序尺度也称定序尺度2.对事物分类的同时给出各类别的顺序对事物分类的同时给出各类别的顺序3.比列名尺度精确一些比列名尺度精确一些4.未测量出类别之间的准确差值未测量出类别之间的准确差值5.数据表现为有序的数据表现为有序的“类别类别”
5、,仍为品质标,仍为品质标志志6.具有具有或或的数学特性的数学特性顺序尺度数据举例顺序尺度数据举例产品的等级产品的等级(一等、二等、三等一等、二等、三等);等级成绩等级成绩(优、良、中优、良、中);文化程度文化程度(中学、大专、本科中学、大专、本科);对事物的态度对事物的态度(同意、中立、反对同意、中立、反对),上述标志的计量尺度都属于顺序尺度,它们上述标志的计量尺度都属于顺序尺度,它们除除了对事物起分类作用,还能对各分类起排序、了对事物起分类作用,还能对各分类起排序、比较的作用,比较的作用,可以比较各类之间的大小、优劣。可以比较各类之间的大小、优劣。但各类之间不能计算差异,不能进行运算。但各类
6、之间不能计算差异,不能进行运算。2.1.3 间隔尺度间隔尺度(P17)1.也称定距尺度也称定距尺度2.对事物的准确测度对事物的准确测度3.比定序尺度精确比定序尺度精确4.数据表现为数据表现为“数值数值”,为数量标志,为数量标志5.没有绝对零点,没有绝对零点,“0”有具体含义,表有具体含义,表示水平的界限,而不表示示水平的界限,而不表示“不存在不存在”。6.具有具有 或或 的数学特性的数学特性7.不可计算倍率(即乘除)不可计算倍率(即乘除)间隔尺度数据举例间隔尺度数据举例例:百分制成绩从数值大小可判断成绩优劣,从两个成绩例:百分制成绩从数值大小可判断成绩优劣,从两个成绩的差可以了解差距大小,的差
7、可以了解差距大小,0分不表示无成绩分不表示无成绩(缺考才是缺考才是无成绩无成绩),而表示成绩为最低。,而表示成绩为最低。例:温度从数值大小可判断温度高低,从两个温度的差可例:温度从数值大小可判断温度高低,从两个温度的差可以了解温差大小,以了解温差大小,0oC不表示无温度,而表示结冰临界。不表示无温度,而表示结冰临界。例:海拔的数值大小可判断事物相对于海平面的位置,从例:海拔的数值大小可判断事物相对于海平面的位置,从两个海拔的差可以了解垂直距离,但两个海拔的差可以了解垂直距离,但“0”海拔不表示无海拔不表示无海拔,而表示处于海平面上。海拔,而表示处于海平面上。例:电脑显示器屏幕尺寸例:电脑显示器
8、屏幕尺寸(12寸、寸、14寸、寸、17寸寸),从数,从数值大小可判断屏幕大小,从两个尺寸的差可以了解差距值大小可判断屏幕大小,从两个尺寸的差可以了解差距大小。大小。2.1.4 比例尺度比例尺度(P17)1.也称比率尺度也称比率尺度2.对事物的最准确的测度对事物的最准确的测度3.与定距尺度处于同一层次与定距尺度处于同一层次4.数据表现为数据表现为“数值数值”,属于数量标志,属于数量标志5.有绝对零点,有绝对零点,“0”表示事物不存在表示事物不存在6.具有具有、的数学特性,的数学特性,比例尺度数据举例比例尺度数据举例长度、重量、产量、利润等标志的计量尺度都长度、重量、产量、利润等标志的计量尺度都属
9、于比例尺度,它们可以对事物进行分类、排属于比例尺度,它们可以对事物进行分类、排序、比较,还能进行加、减、乘、除运算。在序、比较,还能进行加、减、乘、除运算。在比例尺度中,比例尺度中,“0”表示表示“没有没有”或或“无无”。例:由长度大小可判断距离长短,两个长度的差例:由长度大小可判断距离长短,两个长度的差表明差距大小,两个长度的比表明其倍率,表明差距大小,两个长度的比表明其倍率,0长度表示该种物体不存在。长度表示该种物体不存在。例:由产量大小可判断效率高低,两个产量的差例:由产量大小可判断效率高低,两个产量的差表明差距大小,两个产量的比表明其倍率,表明差距大小,两个产量的比表明其倍率,0产量表
10、示该种产品不存在。产量表示该种产品不存在。标志的数值特征标志的数值特征 根据是否可以运算这一特点,可以根据是否可以运算这一特点,可以将列名尺度和顺序尺度归为一个大类,将列名尺度和顺序尺度归为一个大类,它们具有非数值特征,属于它们具有非数值特征,属于品质标志品质标志;而间隔尺度和比例尺度归为另一个大类,而间隔尺度和比例尺度归为另一个大类,它们具有数值特征,属于它们具有数值特征,属于数量标志数量标志。四种计量尺度数学特性的比较四种计量尺度数学特性的比较四种计量尺度的比较四种计量尺度的比较列名尺度列名尺度 顺序尺度顺序尺度 间隔尺度间隔尺度 比例尺度比例尺度 分分类类(=,)排序排序()间间距距(+
11、,-)比比值值(,)计量尺度计量尺度数学特性数学特性“”表示表示该该尺度具有相尺度具有相应应的数学特性的数学特性2.2 统计数据的来源(P19)一、直接获取的数据:一、直接获取的数据:来源于直接组来源于直接组织的调查、观察和科学试验,称织的调查、观察和科学试验,称之为第一手资料。之为第一手资料。二、间接获取的数据二、间接获取的数据:来源于已有来源于已有的数据,称之为第二手资料或间的数据,称之为第二手资料或间接的数据。接的数据。2.2.1 间接获取的数据间接获取的数据(P18)InternetInternethttp/http/WWW.WWW.中国统计年中国统计年中国统计年中国统计年鉴鉴鉴鉴20
12、012001中中中中国国国国人人人人口口口口统统统统计计计计年年年年鉴鉴鉴鉴中中中中国国国国市市市市场场场场统统统统计计计计年年年年鉴鉴鉴鉴世世世世界界界界发发发发展展展展报报报报告告告告世世世世界界界界经经经经济济济济年年年年检检检检工工工工业业业业普普普普查查查查数数数数据据据据中国统计出版社1.统统计计部部门门和和政政府府部部门门公公布布的的有有关关资资料料,如各类统计年鉴如各类统计年鉴2.各各类类经经济济信信息息中中心心、信信息息咨咨询询机机构构、专专业调查机构等提供的数据业调查机构等提供的数据3.各各类类专专业业期期刊刊、报报纸纸、书书籍籍所所提提供供的的资资料料4.各各种种会会议议
13、,如如博博览览会会、展展销销会会、交交易易会会及及专专业业性性、学学术术性性研研讨讨会会上上交交流流的的有有关关资料资料5.从互联网或图书馆查阅到的相关资料从互联网或图书馆查阅到的相关资料 2.2.2 直接获取的数据直接获取的数据(P19)直接获取数据的手段主要有:直接获取数据的手段主要有:1.普查普查2.抽样调查抽样调查1.普查普查(P19)1.为特定目的专门组织的为特定目的专门组织的,非经常性的全非经常性的全面调查面调查2.通常是一次性或周期性的通常是一次性或周期性的3.一般需要规定统一的标准调查时间一般需要规定统一的标准调查时间4.数据的规范化程度较高数据的规范化程度较高5.应用范围比较
14、狭窄应用范围比较狭窄总体总体2.抽样调查抽样调查(P19)1.从总体中随机抽取一部分单位作为样本从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体特征的数据收集方法 总体总体总体总体随机样本随机样本随机样本随机样本 2.具有经济性、时具有经济性、时 效性强、适应面广、效性强、适应面广、准确性高等特点准确性高等特点3.可以估计和控制误可以估计和控制误差的大小差的大小2.3 统计统计数据的质量数据的质量(P20)1.抽样误差抽样误差(P20下下)1、定义:、定义:所有样本可能的结果与总体真值之间所有样本可能的结果与总体真
15、值之间的平均性差异。的平均性差异。2、产生原因:、产生原因:由于抽样的随机性所带来的。由于抽样的随机性所带来的。3、影响抽样误差大小的因素:、影响抽样误差大小的因素:与样本容量的算术根成反比与样本容量的算术根成反比与总体方差成正比与总体方差成正比4、特点:、特点:是不可避免的,但可以预先计算并加以控制是不可避免的,但可以预先计算并加以控制 在坚持随机原则的条件下,平均来讲,抽样误在坚持随机原则的条件下,平均来讲,抽样误差与样本容量的算术根成反比差与样本容量的算术根成反比2.非抽样误差非抽样误差(P20上上)1.定义:定义:除抽样误差以外的,由于其他原因除抽样误差以外的,由于其他原因造成的,样本
16、观察结果与总体真值之间的造成的,样本观察结果与总体真值之间的差异差异2.产生原因:产生原因:工作失误或人为干扰工作失误或人为干扰3.特点:特点:存在于所有的调查之中存在于所有的调查之中 造成的结果往往是致命的,但又是可以避免造成的结果往往是致命的,但又是可以避免的的3.误差的控制误差的控制1.抽样误差的控制:抽样误差的控制:进行事先计算并调整相进行事先计算并调整相关的影响因素关的影响因素2.非抽样误差的控制:非抽样误差的控制:调查员的挑选调查员的挑选调查员的培训调查员的培训督导员的调查专业水平督导员的调查专业水平调查过程控制调查过程控制调查结果进行检验、评估调查结果进行检验、评估现场调查人员进
17、行奖惩的制度现场调查人员进行奖惩的制度2.4 统计数据的整理(P21)一、统计数据的分组一、统计数据的分组 二、次数分配二、次数分配 三、次数分配直方图三、次数分配直方图 四、洛伦茨曲线四、洛伦茨曲线统计数据的分类统计数据的分类(补充补充)所有的统计指标都可以称为综所有的统计指标都可以称为综合指标,它分为总量指标、相合指标,它分为总量指标、相对指标和平均指标三大类。对指标和平均指标三大类。总量指标的概念总量指标的概念(补充补充)总量指标是反映社会经济现象发展总量指标是反映社会经济现象发展的总规模,总水平的综合指标。的总规模,总水平的综合指标。总量指标是对统计调查得来的原始总量指标是对统计调查得
18、来的原始资料经过分组和汇总得到的各项总资料经过分组和汇总得到的各项总计数字是统计整理阶段的直接成果。计数字是统计整理阶段的直接成果。总量指标又称统计绝对数,它的数总量指标又称统计绝对数,它的数值随统计范围的大小而增加或减少。值随统计范围的大小而增加或减少。总量指标是计算相对指标和平均指总量指标是计算相对指标和平均指标的基础。标的基础。总量指标首先表现为总量:总量指标首先表现为总量:如:如:1995年我国国内生产总值年我国国内生产总值57733亿元,亿元,钢产量钢产量9400万吨,城镇职工工资总额万吨,城镇职工工资总额8100亿元。亿元。总量指标还可以表现为两个总量指标的总量指标还可以表现为两个
19、总量指标的差:差:如:某市如:某市2005年新增人口年新增人口12万人,某企万人,某企业今年总产值比上年增加业今年总产值比上年增加5000万元。万元。总量指标的分类总量指标的分类(补充补充)1.按反映现象总体内容的不同,总量指按反映现象总体内容的不同,总量指标分为总体单位总量和总体标志总量。标分为总体单位总量和总体标志总量。总体单位总量是指总体内所有单位的总和。总体单位总量是指总体内所有单位的总和。如:全国企业总数,广东省高校总数。如:全国企业总数,广东省高校总数。总体标志总量是指总体中各单位标志值的总和。总体标志总量是指总体中各单位标志值的总和。如:全国企业总产值,广东省高校总投资额。如:全
20、国企业总产值,广东省高校总投资额。2.按反映时间状态的不同,总量指标分为按反映时间状态的不同,总量指标分为时期指标和时点指标。时期指标和时点指标。时期指标是指反映一段时间连续变化结时期指标是指反映一段时间连续变化结果的总量指标。果的总量指标。如:社会生产总值,基本投资总额,人如:社会生产总值,基本投资总额,人口出生总数。口出生总数。时点指标是指反映某一时点时点指标是指反映某一时点(瞬间瞬间)上的上的总量指标。总量指标。如:人口数,库存额,银行存款余额。如:人口数,库存额,银行存款余额。总量指标的单位总量指标的单位(补充补充)总量指标是按实物单位、货币单位和劳总量指标是按实物单位、货币单位和劳动
21、量单位来计量的。动量单位来计量的。实物单位有:实物单位有:自然单位:个、辆、匹、头自然单位:个、辆、匹、头度量衡单位:公斤、吨、米、公里、平方度量衡单位:公斤、吨、米、公里、平方米、立方厘米米、立方厘米双重单位:台双重单位:台/千瓦、吨千瓦、吨/台台复合单位:吨公里、千瓦小时复合单位:吨公里、千瓦小时相对指标的概念相对指标的概念(补充补充)相对指标又称统计相对数,它是两相对指标又称统计相对数,它是两个有相互联系的现象数量的比率。个有相互联系的现象数量的比率。相对指标的作用:相对指标的作用:为人们深入认识事物发展的质量与为人们深入认识事物发展的质量与状况提供客观的依据;状况提供客观的依据;使不能
22、对比的现象找到可以对比的使不能对比的现象找到可以对比的基础,提供更为有效的分析。基础,提供更为有效的分析。相对指标的数值可有两种表现:有相对指标的数值可有两种表现:有名数与无名数。名数与无名数。有名数的计算单位是计算相对指标有名数的计算单位是计算相对指标时,因分子与分母的单位不同而构时,因分子与分母的单位不同而构成的新单位,称为双重单位。成的新单位,称为双重单位。无名数的计算单位是计算相对指标时,无名数的计算单位是计算相对指标时,分子与分母的单位相同而消除成为纯分子与分母的单位相同而消除成为纯数,多以倍数、成数、百分数或千分数,多以倍数、成数、百分数或千分数表示。数表示。倍数:比值大于倍数:比
23、值大于1很多时,将分母抽象很多时,将分母抽象化为化为1的比值;的比值;成数:将分母抽象化为成数:将分母抽象化为10的比值;的比值;百分数:将分母抽象化为百分数:将分母抽象化为100的比值,的比值,常将比值带上符号常将比值带上符号%;百分数的差值常;百分数的差值常称为百分点。称为百分点。千分数:将分母抽象化为千分数:将分母抽象化为1000的比值,的比值,常将比值带上符号常将比值带上符号。无名数的表示无名数的表示(补充补充)随着研究目的和任务的不同,对比基数也随着研究目的和任务的不同,对比基数也不同,从而产生不同的相对指标。不同,从而产生不同的相对指标。相对指标的种类相对指标的种类(补充补充)1、
24、结构相对指标,结构相对指标,2、比例相对指标,比例相对指标,3、比较相对指标,比较相对指标,4、强度相对指标,强度相对指标,5、动态相对指标,动态相对指标,6、计划完成任务相对指标。计划完成任务相对指标。结构相对指标:是在分组的基础上,以总结构相对指标:是在分组的基础上,以总体总量为比较标准,求出各组总量占总体体总量为比较标准,求出各组总量占总体总量的比重,以反映总体内部组成情况的总量的比重,以反映总体内部组成情况的综合指标。综合指标。1、结构相对指标、结构相对指标(补充补充)计算公式:计算公式:计算结果用百分数或成数表示。计算结果用百分数或成数表示。性质:各组比重总和等于性质:各组比重总和等
25、于100%或或1。例:某大学例:某大学2008年招收的新生共年招收的新生共1900人,其中男生人,其中男生1273人,女生人,女生627人,求人,求2008年该大学新招男、女生的比重年该大学新招男、女生的比重。解:解:2008年该大学新招男生比重为:年该大学新招男生比重为:12731900=67%2008年该大学新招女生比重为:年该大学新招女生比重为:167%=33%比例相对指标:是总体中不同部分数量对比例相对指标:是总体中不同部分数量对比的综合指标,用以分析总体范围内各部比的综合指标,用以分析总体范围内各部分之间的比例状况和协调平衡状况。分之间的比例状况和协调平衡状况。2、比例相对指标、比例
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计数据 描述
限制150内