环境统计调查和数据整理.ppt
张宝林内蒙古师范大学化学与环境科学学院环境统计1课程主要内容 第一章绪论 第二章环境统计调查和数据整理 第三章环境统计的概率论基础 第四章环境统计的描述性统计学 第五章环境统计的推断性统计学 第六章常用多元统计分析及其软件实现 第七章地统计学简介21.1 统计概述 统计学的分科社会经济统计学原理,在统计实践的基础上,对统计理论方法最一般的概括;国民经济统计学,国民经济综合统计工作实践经验的总结,科学地阐述国民经济统计的原理、原则、方法和指标。部门统计学,又叫专业统计学,研究社会生产、生活某一领域的数量方面,研究本部门指标体系的性质,以及搜集、整理、加工、分析和运用本部门统计资料的理论和方法。统计学史,研究统计发生和发展的历史。1.1 统计概述 统计学的理论基础哲学是统计学方法论的基础;研究社会经济现象时,以政治经济学的经济范畴与经济理论为依据;概率论和数理统计是统计学发展的基础。1.1 统计概述 统计研究对象的特点:总体性:社会性:客观性:1.1 统计概述 统计工作的基本步骤统计调查过程:从进行统计研究前的统计设计到社会调查,是收集统计资料的过程,统计工作的基础。统计整理过程:对调查来的统计资料进行条理化、系统化地分组、汇总和综合,把大量原始的个体资料计算成可供分析的综合资料,并编制各种图表,对环境资料的加工整理过程。统计分析过程:对已有的大量综合统计资料进行加工、分析、推断,研究现象的数量关系,反映现象发展变化的规律和趋势,提出定性或定量的结论。对统计资料进行深度加工,增加其利用价值,也是利用和分析统计资料的过程。1.1 统计概述 统计工作的基本步骤统计调查过程:收集资料过程。全面调查(报表制度、普查)非全面调查(重点调查、典型调查和抽样调查)统计整理过程:加工资料过程统计表(把资料综合成统计表)统计图(把资料综合成统计图)整理一系列统计指数(综合指标、回归分析、指数、动态数列)统计分析过程:分析资料过程。描述性分析(利用指标数据说明现象和问题)推断性分析(各种推断和预测)提出可行性建议或判断性结论。1.1 统计概述 统计学是怎样一门科学 统计学是研究有关收集、整理和分析数据从而对研究的对象加深了认识并作出一定结论的方法和理论。1.统计学研究的对象是客观现象的数量方面。2.统计学研究的是群体现象的数量特征与规律性。3.统计学是一门方法论的科学。第一章绪论 1.2 环境统计概述 环境统计的产生 环境统计的含义 环境统计的特点 环境统计的范围 环境统计的任务李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-81.2 环境统计概述 环境统计的产生李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-81.2 环境统计概述 环境统计的含义:环境统计工作:对环境现象的各种信息进行搜集、整理、分析和预测的各个方面的工作。环境统计资料:是环境统计工作的成果,包括环境现象的数字资料和环境统计的分析资料。环境统计学:运用统计学的一般原理,研究环境统计的对象、方法、理论的科学,是长期统计实践经验的理论概括,也是统计工作发展到一定高度的必然产物。李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-81.2 环境统计概述 环境统计的特点:涉及面广、综合性强:技术性强:环境统计是新生事物:李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-81.2 环境统计概述 环境统计的范围:自然资源统计生态破坏与建设统计区域环境质量统计区域环境污染与防治统计环境管理统计环保系统的自身建设统计李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-81.2 环境统计概述 环境统计的任务:信息咨询监督李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-8环境统计学的基本过程样 样本 本总体 总体抽样或试验设计推断统计描述统计统计的主要思想 随机性和规律性犹太教法典:不应该去探寻宝藏,因为宝藏的发现是随机的孟德尔豌豆实验 概率:不可能事件将会发生,这正是概率的特性-亚里士多德 变量统计思想:19 世纪机械宇宙观,拿破仑-拉普拉斯19 世纪末,误差问题20 世纪末,统计模型第一章绪论 思考与练习1 统计学有哪些分科?2 统计研究的基本方法有哪些?3 统计工作的基本过程分哪三个阶段?4 环境统计的含义和特点?李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004。P1-8第二章环境统计调查和数据整理 第一节环境统计指标体系 第二节环境统计调查 第三节统计整理18第一节环境统计指标体系环境统计学也可称为环境统计方法,它是应用概率论和数理统计原理、方法对环境和实验资料从事调查、搜集、整理、分析,借以表现环境问题真相的学科,属于部门统计学。由于记录、观测的数量资料或属性资料是大量、复杂并且常是杂乱无章的。怎样根据统计学原理结合环境科学特点,科学、系统有目的地去调查、搜集、整理、分析观测资料,并能将所获资料,所关心的环境问题以若干简单的数值、图表、公式表示其结果、性质、所研究对象的相互关系以及评价、预测环境状态,显然是环境科学工作者的重要任务。因此环境科学工作者或多或少地都应掌握环境统计方法。19第一节环境统计指标体系 1 统计的几个基本概念 2 科学的统计指标的基本要求 3 总量指标和相对指标 4 平均指标和变异指标 5 环境统计指标体系20李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004,第五章 环境统计指标体系 104-1 统计的几个基本概念 统计总体与总体单位 统计标志与标志表现 变异与变量 统计总体的特征 统计指标 统计指标的种类21统计总体与总体单位 根据一定的目的和要求,观察和研究事物的全体,称为统计总体,简称总体。总体单位:组成总体的每一个事物,称为总体单位,简称个体。统计总体形成的三个条件:第一,客观性:总体和总体单位必须是客观存在的,可以观察和计量的;第二,同质性:组成总体的所有个体必须是在某些性质上是相同的;第三,差异性:构成总体的各单位除了同质性一面还必须有差异性一面,否则就不需要统计研究了。统计总体按总体单位是否有限分为两种:有限总体和无限总体。一个统计总体所包括的单位数如果是有限的,称为有限总体。如果是无限的,称为无限总体。22统计总体与总体单位 二者的关系表为:(1)整体与局部的关系。总体表现为一个整体,总体单位是整体的一部分;(2)转换关系。当统计研究的目的和范围发生变化后,总体和总体单位可相互转换。23统计标志与标志表现 标志是说明总体单位所共同具有的属性和特征的名称品质标志说明总体单位的属性特征,无法量化,如职工的性别、文化程度,企业的经济成份,产品品牌等。数量标志说明总体单位的数量特征,能够量化,如职工的工龄、工资水平,企业的职工数、总产值、总产量、劳动生产率等。标志表现即标志特征在各单位的具体表现。如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现。品质标志表现只能用文字表述,因此不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。数量标志表现是一具体数值,也称标志值。24变异与变量 可变标志的表现由一种状态变为另一种状态称为变异。变异有属性变异和数量变异之分。属性变异表明质的差别,数量变异表明量的差别 数量标志中,不变的数量标志称为常量或参数,可变的数量标志称为变量。变量按其数值是否连续可分为连续性变量和离散性变量。统计调查主要就是根据统计研究的目的,记录各种可变标志在总体各个单位中的具体表现。25统计总体的特征 大量性:由大量单位组成,个别或少数单位不能构成总体。同质性:一切统计研究的前提,只有同质的各个单位才能结合在一个总体中。变异性:构成总体的所有单位在某一方面是同质的,在其它方面是变异的。变异性是统计研究的目的。26统计指标 用一定的统计方法登记各单位的标志表现,汇总之后形成反映总体数量特征的统计指标。反映总体在一定时间、地点条件下某一综合数量特征的数量化概念。特点:说明总体数量化的概念;客观事物的数量反映;反映总体现象的某一综合特征;不是抽象的数值。27统计指标的种类 按反映的数量特征:数量指标和质量指标数量指标是反映社会经济现象的总体规模水平或工作总量的统计指标。质量指标是反映现象的相对水平或平均水平的统计指标。按其作用功能:描述指标、评价指标和预警指标描述指标:反映社会经济现状、生产生活过程和结果的统计指标;评价指标:用于对社会经济行为和结果进行比较、评价、考核,检查工作质量和经济效益的统计指标。预警指标:用以对宏观运作的监测,并根据指标数值的变化预报国民经济即将出现的不平衡、突发事件、危机和结构性障碍等。282 科学的统计指标的基本要求 1 要有科学的统计指标概念:内涵,外延 2 要有科学的计算方法:调查和计量方法计算形式和适用参数可行性和合理性293 总量指标和相对指标总量指标是反映社会经济现象发展的总规模或总水平的统计指标(统计绝对数)。总量指标的种类:单位总量和标志总量;时期指标和时点指标。总量指标的计量单位:实物单位,价值单位和劳动量单位。相对指标是两个有相互联系的现象的数量比率,反映现象的发展程度、结构、强度、普遍程度或比例关系。结构相对指标,比较相对指标,动态相对指标,强度相对指标,计划完成程度相对指标。304 平均指标和变异指标 平均指标(1)算数平均数(2)调和平均数(3)几何平均数(4)众数(5)中位数314 平均指标和变异指标 平均指标(1)算数平均数简单算术平均数:对总体各个单位某一数值标志的平均。加权算术平均数:324 平均指标和变异指标 平均指标(1)算数平均数某厂一年用煤1100t,其中全硫分1.3%的煤500t,全硫分1.5%的煤400t,全硫分1.0%的煤200t,该厂用煤的平均全硫分?334 平均指标和变异指标 平均指标(1)算数平均数某厂一年用煤1100t,其中全硫分1.3%的煤500t,全硫分1.5%的煤400t,全硫分1.0%的煤200t,该厂用煤的平均全硫分?(1.3%500t+1.5%400+1.0%200)/1100=1.32%344 平均指标和变异指标 平均指标(2)调和平均数(倒数平均值)各个变量值倒数算术平均数的倒数例:据甲、乙、丙三厂的实际废水量和处理率,计算平均处理率。甲18%30000t乙23%25000t丙30%18000t354 平均指标和变异指标 平均指标(2)调和平均数(倒数平均值)各个变量值倒数算术平均数的倒数例:据甲、乙、丙三厂的实际废水量和处理率,计算平均处理率。甲18%30000t乙23%25000t丙30%18000t(30000+18000+25000)(1/0.18)30000+(1/0.23)25000+(1/0.30)15000364 平均指标和变异指标 平均指标(3)几何平均数若n 个指标值的总和是n 个变量值的乘积注意:不能有0;不能同时有正又负。374 平均指标和变异指标 平均指标(4)众数(5)中位数监测分析某试样中某成分含量(%):1.61,1.65,1.68,1.70,1.72,1.75,1.901.61,1.65,1.68,1.70,1.72,1.73,1.75,1.90中位数中位数:二者均值384 平均指标和变异指标 变异指标全距:R=Xmax-Xmin平均差标准差变异系数395 环境统计指标体系40第二节环境统计调查 1 环境统计调查的意义和分类 2 环境统计调查方案 3 统计报表制度 4 普查 5 重点调查和典型调查 6 抽样调查和问卷调查 7 环境统计台帐 8 环境统计调查方案的改革41李鸿杰,高见,环境统计学,西北农林科技大学出版社,2004,第六章 统计调查127-第二节环境统计调查421 环境统计调查的意义和分类 环境统计调查是收集原始资料,对现象获得感性认识的初始阶段。是按预定要求,采用某种科学的调查方式,有组织、有计划地向调查对象收集原始资料的过程。统计工作的基础环节,统计分析的前提。符合准确性及及时性431 环境统计调查的意义和分类 统计调查的种类组织形式:统计报表和专门调查调查总体范围:全面调查、非全面调查调查的连续性:经常性调查、一次调查 统计调查方法直接观察法凭证法询问调查442 环境统计调查方案 确定调查目的 确定调查对象 确定调查项目 确定调查时间 确定调查方式、方法 拟定调查的组织、实施方案45第二节环境统计调查 3 统计报表制度46第二节环境统计调查 4 普查:意义、原则、47第二节环境统计调查 5 重点调查和典型调查48第二节环境统计调查 6 抽样调查和问卷调查 7 环境统计台帐 8 环境统计调查方案的改革49第三节统计整理 数据的收集 资料的分类 不同类型资料的整理方法 常用统计表与统计图50第三节统计整理:数据的收集 数据获得:调查、实验?好数据和坏数据好数据是根据合理、正确的统计原则收集到的数据。样本的选择51资料的分类 正确地进行资料的分类是资料整理的前提。在调查或试验中,由观察、测量所得的数据按其性质的不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料三大类。52资料的分类 数量性状资料数量性状是指能够以量测或计数的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料。数量性状资料的记载有量测和计数两种方式,因而数量性状资料又分为计量资料和计数资料两种。(一)计量资料 指用量测手段得到的数量性状资料,即用度、量、衡等计量工具直接测定的数量性状资料。其数据是用长度、容积、重量等来表示,如体高。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定,它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。(二)计数资料 指用计数方式得到的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。如猪的产仔数,这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。53资料的分类 质量性状资料质量性状是指能观察到而不能直接测量的性状,如颜色、性别、生死等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:(一)统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究猪的毛色遗传时,白猪与黑猪杂交,子二代中白猪、黑猪和花猪的头数分类统计。这种由质量性状数量化得来的资料又叫次数资料。(二)评分法 对某一质量性状,因其类别不同,分别给予评分。例如,在研究猪的肉色遗传时,常用的方法是将屠宰后2 小时的猪眼肌横切面与标准图谱对比,由浅到深分别给予1 5 分的评分,以便统计分析。54资料的分类 半定量(等级)资料半定量或等级资料是指将观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得的资料。这类资料既有次数资料的特点,又有程度或量的不同。如用某种药物治疗畜禽的某种疾病,疗效分为“无效”、“好转”、“显效”和“控制”四个级别;然后统计各级别的供试畜禽数。半定量资料在兽医研究中是常见的。55资料的分类三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如果按白细胞总数过高、正常、过低分为三组,清点各组次数,就转化成了半定量资料。56资料的整理 优秀科学家可以做出产生新知识的实验,而二流的科学家常常从事的是积累数据的实验,但对增长知识没有什么用处。57资料的整理 19 世纪末-20 世纪初农业研究费歇尔:整理约90 年的肥料构成实验肥力指数:20 年的科学论战90 年的降水和收成实验数据58资料的整理 资料的检查与核对 资料的整理方法59资料的整理 资料的检查与核对检查和核对原始资料的目的在于确保原始资料的完整性和正确性。所谓完整性是指原始资料无遗缺或重复。所谓正确性是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料,应予以删除或补齐;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。资料的检查与核对工作虽然简单,但在统计处理工作中却是一项非常重要的步骤,因为只有完整、正确的资料,才能真实地反映出调查或试验的客观情况,才能经过统计分析得出正确的结论。60资料的整理 资料的整理方法对原始资料进行检查核对后,根据资料中观测值的多少确定是否分组。当观测值不多(n 30)时,不必分组,直接进行统计分析。当观测值较多(n 30)时,宜将观测值分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。不同类型的资料,其整理的方法略有不同。计数资料的整理计量资料的整理质量性状资料、半定量(等级)资料的整理61资料的整理方法(1)计数资料的整理62资料的整理方法(1)计数资料的整理有些计数资料,观察值较多,变异范围较大,若以每一观察值为一组,则组数太多,而每组内包含的观察值太少,资料的规律性显示不出来。对于这样的资料,可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的规律性就较明显,对资料进一步计算分析也比较方便。63资料的整理方法(2)计量资料的整理:计量资料不能按计数资料的分组方法进行整理,在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组。1、求全距2、确定组数3、确定组距组距(i)全距组数4、确定组限及组中值5、归组划线计数,作次数分布表64资料的整理方法(2)计量资料的整理65资料的整理方法 质量性状资料、半定量(等级)资料的整理对于质量性状资料、半定量(等级)资料,可按性状或等级进行分组,分别统计各组的次数,然后制成次数分布表。66第三节统计整理 资料的分类 不同类型资料的整理方法 常用统计表与统计图67常用统计表与统计图 统计表是用表格形式来表示数量关系;统计图是用几何图形来表示数量关系。用统计表与统计图,可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于比较分析。常用的统计图有长条图(bar chart)、园图(pie chart)、线图(linear chart)、直方图(histogram)和折线图(broken-line chart)等。图形的选择取决于资料的性质,一般情况下,计量资料采用直方图和折线图,计数资料、质量性状资料、半定量(等级)资料常用长条图、线图或园图。68常用统计表与统计图。69常用统计表与统计图 统计图绘制的基本要求1、标题简明扼要,列于图的下方。2、纵、横两轴应有刻度,注明单位。3、横轴由左至右、纵轴由下而上,数值由小到大;图形长宽比例约5:4 或6:5。4、图中需用不同颜色或线条代表不同事物时,应有图例说明。70常用统计表与统计图。杂种二代鸡的冠形分离的次数分布图 几种动物性食品的营养成分(条形图)四种动物性食品的营养成分(圆图)长白猪体重的变化(0-6 月龄)71常用统计表与统计图 1、长条图 用等宽长条的长短或高低表示按某一研究指标划分属性种类或等级的次数或频率分布。如果只涉及一项指标,则采用单式长条图;如果涉及两个或两个以上的指标,则采用复式长条图。在绘制长条图时,应注意以下几点:(1)纵轴尺度从“0”开始,间隔相等,标明所表示指标的尺度及单位。(2)横轴是长条图的共同基线,应标明各长条的内容。长条的宽度要相等,间隔相同。间隔的宽度可与长条宽度相同或者是其一半。(3)在绘制复式长条图时,将同一属性种类、等级的两个或两个以上指标的长条绘制在一起,各长条所表示的指标用图例说明,同一属性种类、等级的各长条间不留间隔。72常用统计表与统计图 2、园图 用于表示计数资料、质量性状资料或半定量(等级)资料的构成比。所谓构成比,就是各类别、等级的观测值个数(次数)与观测值总个数(样本含量)的百分比。把园图的全面积看成100%,按各类别、等级的构成比将园面积分成若干分,以扇形面积的大小表分别表示各类别、等级的比例。绘制园图时,应注意以下三点:(1)圆图每3.6 园心角所对应的扇形面积为1%。(2)圆图上各部分按资料顺序或大小顺序,以时钟9 时或12 时为起点,顺时针方向排列。(3)圆图中各部分用线条分开,注明简要文字及百分比。73常用统计表与统计图 3、线图 用来表示事物或现象随时间而变化发展的情况。线图有单式和复式两种。(1)单式线图 表示某一事物或现象的动态。(2)复式线图 在同一图上表示两种或两种以上事物或现象的动态。这时可用实线“”,断线“-”,点线“”,横点线“-”等来标志区别。74常用统计表与统计图 4、直方图(柱形图、矩形图)对计量资料,可根据次数分布表作出直方图以表示资料的分布情况。其作法是:在横轴上标记组限,纵轴标记次数(f),在各组上作出其高等于次数的矩形,即得次数分布直方图。75三个品种猪体重的变化(0-6 月龄)常用统计表与统计图 5、折线图 对于计量资料,还可根据次数分布表作出次数分布折线图。其作法是:在横轴上标记组中值,纵轴上标记次数,以各组组中值为横坐标,次数为纵坐标描点,用线段依次连接各点,即可得次数分布折线图。76 126 头基础母羊体重的次数分布直方图 126 头基础母羊体重的次数分布折线图常用统计表与统计图