《统计学01绪论.优秀PPT.ppt》由会员分享,可在线阅读,更多相关《统计学01绪论.优秀PPT.ppt(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1无处不在的统计在诺贝尔经济学获奖者中,三分之二以上的探讨成果与统在诺贝尔经济学获奖者中,三分之二以上的探讨成果与统计和定量分析有关。因此,著名经济学家萨缪尔森在其经计和定量分析有关。因此,著名经济学家萨缪尔森在其经典的教科书,经济学中特殊提到:典的教科书,经济学中特殊提到:“在很多与经济学在很多与经济学有关的学科中,统计学是特殊重要的有关的学科中,统计学是特殊重要的”。美国总统布什的年薪达到美国总统布什的年薪达到4040万美元,在各国元首中名列首万美元,在各国元首中名列首位,但依据美国工作等级年鉴一书的排名,总统一职位,但依据美国工作等级年鉴一书的排名,总统一职并未进入最好工作之列。依据该书
2、的统计,在美国,工作并未进入最好工作之列。依据该书的统计,在美国,工作环境最好的工作是:统计学家。环境最好的工作是:统计学家。219811981年,首届国际红楼梦研讨会在美国召开,威斯康星年,首届国际红楼梦研讨会在美国召开,威斯康星高校讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论高校讲师陈炳藻独树一帜,宣读了题为从词汇上的统计论红楼梦作者的问题的论文。他从字、词出现频率入手,红楼梦作者的问题的论文。他从字、词出现频率入手,通过计算机进行统计、处理、分析,对红楼梦后通过计算机进行统计、处理、分析,对红楼梦后4040回系回系高鹗所作这一流行看法提出异议,认为高鹗所作这一流行看法提出异议,认为12
3、0120回均系曹雪芹所作。回均系曹雪芹所作。无处不在的统计3美国金融业:美国金融业:20062006年美国金融服务业的产值占了美国年美国金融服务业的产值占了美国GDPGDP的几乎的几乎1/41/4,利润则占全部企业利润总额的,利润则占全部企业利润总额的44%44%(美国制造(美国制造业的利润仅为业的利润仅为10%10%左右)。美国人的金融债务在左右)。美国人的金融债务在19801980年为年为GDPGDP的的21%21%,到,到20072007年则是年则是GDPGDP的的116%116%。美国人的。美国人的储蓄水平,干脆加间接,储蓄水平,干脆加间接,19861986年为年为10%10%,200
4、62006年为负年为负值;二次世界大战期间的储蓄率达值;二次世界大战期间的储蓄率达25%25%(同中国人目(同中国人目前水平相像)。前水平相像)。无处不在的统计4第一章 绪论第一节 什么是统计其次节 统计学的分科第三节 统计学的基本概念第一节 什么是统计6一、统计的概念统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探究数据内在的数量规律性。7二、统计探讨的基本环节统计设计统计设计依据所要探讨问题的性质,在有关学科理论的指导下,制定统计依据所要探讨问题的性质,在有关学科理论的指导下,制定统计指标、指标体系和统计分类,给出统一的定义、标准。同时提出指标、指标体系和统计分类,给出统一的定
5、义、标准。同时提出收集、整理和分析数据的方案和工作进度等。收集、整理和分析数据的方案和工作进度等。统计数据的收集统计数据的收集/统计调查统计调查统计数据的整理统计数据的整理对统计数据的加工处理过程,目的是使统计数据系统化、条理化,对统计数据的加工处理过程,目的是使统计数据系统化、条理化,符合统计分析的须要。符合统计分析的须要。统计数据的分析统计数据的分析通过统计描述和统计推断的方法探究数据内在规律的过程,是统通过统计描述和统计推断的方法探究数据内在规律的过程,是统计学的核心内容。计学的核心内容。统计资料的积累、开发与应用统计资料的积累、开发与应用对于已经公布的统计资料须要加以积累,同时还可以进
6、行进一步对于已经公布的统计资料须要加以积累,同时还可以进行进一步的加工,结合相关的实质性学科的理论学问去进行分析和利用。的加工,结合相关的实质性学科的理论学问去进行分析和利用。8其次节 统计学的分科一、描述统计学和推断统计学二、理论统计学和应用统计学三、统计学与其他学科的关系9一、描述统计学和推断统计学描述统计学是探讨如何取得反映客观现象的数据,并通过描述统计学是探讨如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。综合、概括与分析得出反映客观现象的规律性数量特
7、征。内容包括统计数据的收集方法、数据的加工处理方法、数内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。据的显示方法、数据分布特征的概括与分析方法等。推断统计学是探讨如何依据样本数据去推断总统数量特征推断统计学是探讨如何依据样本数据去推断总统数量特征的方法,它是在对样本数据进行描述的基础上,对总体的的方法,它是在对样本数据进行描述的基础上,对总体的未知数量特征作出以概率形式表述的推断。未知数量特征作出以概率形式表述的推断。10描述统计学和推断统计学的关系概率论(包括分布理论、大数定律和中心极限定理等)反映客观现象的统计数据描述统计学(包括统计数据的
8、收集、整理、显示和分析)推断统计学(利用样本信息和概率论对总体的数量特征进行估计和检验等)总体内在的数量规律性样本数据总体数据11二、理论统计学和应用统计学理论统计学是以抽象的数量为探讨对象,探讨一般的收集数据、整理数据和分析数据方法的学科,探讨统计学的数学原理。应用统计学是以各个不同领域的具体数量为探讨对象,探讨应用统计方法解决实际问题的学科。12 统计学学科体系 经经济济学学社社会会学学教教育育学学其其他他社社科科其其他他理理工工科科物物理理学学生生物物学学医医药药学学经经济济统统计计社社会会统统计计教教育育统统计计其其他他社社科科统统计计统统统统计计计计学学学学其其他他理理工工科科统统计
9、计物物理理统统计计生生物物统统计计医医药药统统计计13三、统计学与其他学科的关系统计学与数学统计学与相关的实质性学科14(一)统计学与数学联系:联系:统计学与数学都是探讨数量规律的,都要利用各种公式进统计学与数学都是探讨数量规律的,都要利用各种公式进行运算。数学中的概率论,为统计学供应了数量分析的理行运算。数学中的概率论,为统计学供应了数量分析的理论基础。统计学中的理论统计学以抽象的数量为探讨对象,论基础。统计学中的理论统计学以抽象的数量为探讨对象,其大部分内容也可以看作是数学的分支。其大部分内容也可以看作是数学的分支。区分区分从探讨对象看,数学以最一般的形式探讨数量的联系和空从探讨对象看,数
10、学以最一般的形式探讨数量的联系和空间形式。统计学特殊是应用统计学则总是与客观的对象联间形式。统计学特殊是应用统计学则总是与客观的对象联系在一起的。系在一起的。从探讨方法看,数学主要是逻辑推理和演绎论证的方法。从探讨方法看,数学主要是逻辑推理和演绎论证的方法。而统计本质上是归纳的方法。统计学家特殊是应用统计学而统计本质上是归纳的方法。统计学家特殊是应用统计学家须要深化实际,进行调查或试验去取得数据,探讨时不家须要深化实际,进行调查或试验去取得数据,探讨时不仅要运用统计的方法,而且还要驾驭某一特地领域的学问。仅要运用统计的方法,而且还要驾驭某一特地领域的学问。15联系联系统计学是开展实质性学科科学
11、探讨不行或缺的重要工具。通过统计的统计学是开展实质性学科科学探讨不行或缺的重要工具。通过统计的实证探讨,可以帮助人们相识有关的数量规律,同时检验实质性学科实证探讨,可以帮助人们相识有关的数量规律,同时检验实质性学科理论的真实性和完善程度。理论的真实性和完善程度。实质性学科对统计学起着重要的指导作用。不仅统计指标的设定离不实质性学科对统计学起着重要的指导作用。不仅统计指标的设定离不开实质性学科的指导,而且应用统计方法也在很大的程度上受所探讨开实质性学科的指导,而且应用统计方法也在很大的程度上受所探讨对象性质的影响。对象性质的影响。区分区分实质性学科探讨该领域现象的本质关系并对有关规律作出合理的说
12、明实质性学科探讨该领域现象的本质关系并对有关规律作出合理的说明和论证。而统计学只是为实质性学科探讨和相识数量规律供应特地的和论证。而统计学只是为实质性学科探讨和相识数量规律供应特地的方法和工具,并不干脆对规律产生的缘由和机理作进一步的分析。方法和工具,并不干脆对规律产生的缘由和机理作进一步的分析。(二)统计学与相关的实质性学科的关系16第三节 统计学的基本概念一、一、统计总体、总体单位、样本二、统计数据三、参数、统计量四、变量、变量值17一、统计总体、总体单位、样本统计总体/总体:是依据确定目的确定的所要探讨的事物的全体。它是由客观存在的、具有某种共同性质的很多个别事物构成的整体。18一、统计
13、总体和总体单位、样本总体单位总体单位/单位:是组成总体的各个个体。单位:是组成总体的各个个体。依据探讨目的的不同,单位可以是人、物、机构依据探讨目的的不同,单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物等实物单位,也可以是一种现象或活动等非实物单位。单位。有限总体和无限总体有限总体和无限总体有限总体是由有限量的单位构成的总体。有限总体是由有限量的单位构成的总体。当总体单位数难以确定,其数量可能是无限时,当总体单位数难以确定,其数量可能是无限时,便构成无限总体。便构成无限总体。19一、统计总体和总体单位、样本样本:从总体(又称母体)中,抽取一部分单位作为总体的代表加以探讨,这种
14、由总体的部分单位组成的集合称为样本。样本容量:样本所包含的总体单位数。二、统计数据数据的计量尺度数据的类型2021(一)数据的计量尺度1 1、定类尺度、定类尺度/列名尺度:是依据客观现象的某种属性对其进列名尺度:是依据客观现象的某种属性对其进行分类和分组。行分类和分组。这一场合的所运用的数值只是作为各种分类的代码,并不反这一场合的所运用的数值只是作为各种分类的代码,并不反映各类的优劣、量的大小或依次。例如,人口按性别分为映各类的优劣、量的大小或依次。例如,人口按性别分为男女,用男女,用“1”“1”表示男性,用表示男性,用“0”“0”表示女性。表示女性。定类尺度的主要数学特征是定类尺度的主要数学
15、特征是“=”“=”或或“”“”。在统计处理中,对于。在统计处理中,对于不同的类别,虽然可以计算单位数,但它不能表明第一类不同的类别,虽然可以计算单位数,但它不能表明第一类的一个单位可以相当于其次类的几个单位。的一个单位可以相当于其次类的几个单位。22(一)数据的计量尺度2 2、定序尺度、定序尺度/依次尺度:是对客观现象各类之间的依次尺度:是对客观现象各类之间的等级差或依次差的一种测度。等级差或依次差的一种测度。利用定序尺度不仅可以将探讨对象分成不同的类别,利用定序尺度不仅可以将探讨对象分成不同的类别,而且还可以反映各类的优劣、量的大小或依次。而且还可以反映各类的优劣、量的大小或依次。例如,学生
16、成果可以分为优、良、中、及格和不及例如,学生成果可以分为优、良、中、及格和不及格等五类。在这里,定序尺度虽然无法表明一个格等五类。在这里,定序尺度虽然无法表明一个优等于几个良,但却能准确地表明优高于良,良优等于几个良,但却能准确地表明优高于良,良又高于中又高于中。定序尺度的主要数学特征是定序尺度的主要数学特征是“”“”“”。23(一)数据的计量尺度3 3、定距尺度定距尺度/间隔尺度:是对现象类别或次序之间间隔尺度:是对现象类别或次序之间间距的测度。间距的测度。定距尺度不但可以用数表示现象各类别的不同和依定距尺度不但可以用数表示现象各类别的不同和依次大小的差异,而且可以用准确的数值反映现象次大小
17、的差异,而且可以用准确的数值反映现象之间在量方面的差异。之间在量方面的差异。定距尺度运用的计量单位一般为实物单位定距尺度运用的计量单位一般为实物单位(自然或物自然或物理理)或者价值单位。或者价值单位。定距尺度的主要数学特征是定距尺度的主要数学特征是“+”“+”或或“”“”。24(一)数据的计量尺度4 4、定比尺度、定比尺度/比例尺度:是在定距尺度的基础上,确定相应比例尺度:是在定距尺度的基础上,确定相应的比较基数,然后将两种相关的数加以对比而形成相对数的比较基数,然后将两种相关的数加以对比而形成相对数(或平均数或平均数),用于反映现象的结构、比重、速度、密度等,用于反映现象的结构、比重、速度、
18、密度等数量关系。数量关系。例如,将一个企业创建的增加值与该企业的职工人数对比,例如,将一个企业创建的增加值与该企业的职工人数对比,计算全员劳动生产率,以此反映该企业的生产效率。计算全员劳动生产率,以此反映该企业的生产效率。定比尺度的主要数学特征是定比尺度的主要数学特征是“”“”或或“”“”。定距尺度与定比尺度属于同一层次,仅有微小差别:定距尺度与定比尺度属于同一层次,仅有微小差别:定比尺度中定比尺度中“0”“0”表示表示“没有或不存在没有或不存在”,而定距尺度中,而定距尺度中“0”“0”不表不表示示“不存在不存在”。25四种计量尺度的比较四种计量尺度的比较四种计量尺度的比较定类尺度定类尺度 定
19、序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 分分类类(,(,)排序(排序()间间距(距(+,-)比比值值(,)计量尺度计量尺度数学特性数学特性“”表示表示该该尺度所具有的特性尺度所具有的特性26(二)数据的类型1 1、按数据的计量尺度分类、按数据的计量尺度分类定性数据定性数据/品质数据:品质数据:说明事物的品质特征,是不能用数值表示的,其说明事物的品质特征,是不能用数值表示的,其结果通常表现为类别,这类数据是由定类尺度和结果通常表现为类别,这类数据是由定类尺度和定序尺度计量形成的。定序尺度计量形成的。分类数据、依次数据分类数据、依次数据定量数据定量数据/数量数据数量数据/数值型数据数值型数
20、据说明事物的数量特征,是能够用数值表示的,这说明事物的数量特征,是能够用数值表示的,这类数据是由定距尺度和定比尺度计量形成的。类数据是由定距尺度和定比尺度计量形成的。27(二)数据的类型2、按对客观现象视察的时间状态分类:静态数据/横截面数据指在同一时间对同一总体内不同单位的数量进行视察而获得的数据。动态数据/时间序列数据是指在不同时间对同一总体的数量表现进行视察而获得的数据。28(二)数据的类型3 3、按数据的表现形式分类:、按数据的表现形式分类:确定数确定数确定数按其反映的时间状态不同,分为时期数据确定数按其反映的时间状态不同,分为时期数据和实践数据。和实践数据。相对数相对数相对数由相对数
21、由2 2个相互联系的数值对比求得。常用的相个相互联系的数值对比求得。常用的相对数包括:结构相对数、动态相对数、比较相对对数包括:结构相对数、动态相对数、比较相对数、强度相对数、利用程度相对数、支配完成相数、强度相对数、利用程度相对数、支配完成相对数等。对数等。平均数平均数平均数反映现象总体的一般水平或分布的集中趋平均数反映现象总体的一般水平或分布的集中趋势。势。三、参数、统计量参数参数参数是用来描述总体特征的概括性数字度量,它是探讨者参数是用来描述总体特征的概括性数字度量,它是探讨者想要了解的总体的某种特征值。如总体平均数、总体标准想要了解的总体的某种特征值。如总体平均数、总体标准差等。差等。
22、因为总体数据通常未知,所以参数也是未知常数。因为总体数据通常未知,所以参数也是未知常数。统计量统计量统计量是用来描述样本特征的概括性数字度量。是依据样统计量是用来描述样本特征的概括性数字度量。是依据样本数据计算出来的。如样本平均数、样本标准差等。本数据计算出来的。如样本平均数、样本标准差等。由于抽样随机,统计量是样本的函数。由于抽样随机,统计量是样本的函数。因为样本已知,所以统计量已知。因为样本已知,所以统计量已知。30四、变量、变量值概念:概念:变量:说明现象某种特征的概念。变量:说明现象某种特征的概念。变量值:变量的具体取值。变量值:变量的具体取值。类型:类型:分类变量分类变量依次变量依次
23、变量数值型变量数值型变量31数值型变量连续变量和离散变量连续变量和离散变量连续变量:变量的取值在数轴上连绵不断,无法一一列举,连续变量:变量的取值在数轴上连绵不断,无法一一列举,即在一个区间内可以取随意实数值。即在一个区间内可以取随意实数值。离散变量是指变量的其取值是整数值,可以一一列举。离散变量是指变量的其取值是整数值,可以一一列举。确定变量和随机变量确定变量和随机变量确定变量:受确定性因素影响的变量,即影响变量值变更的确定变量:受确定性因素影响的变量,即影响变量值变更的因素是明确的,是可说明和可限制的。因素是明确的,是可说明和可限制的。随机变量:受很多微小的不确定因素(又称随机因素)影响随机变量:受很多微小的不确定因素(又称随机因素)影响的变量。变量的取值无法事先确定。的变量。变量的取值无法事先确定。阅历变量和理论变量阅历变量和理论变量阅历变量:描述四周环境中可以视察到的事物的变量。阅历变量:描述四周环境中可以视察到的事物的变量。理论变量:统计学家用数学方法所构造出来的变量。如理论变量:统计学家用数学方法所构造出来的变量。如z z统统计量、计量、t t统计量等。统计量等。32练习题
限制150内