《统计学第一章统计学的基础理论幻灯片.ppt》由会员分享,可在线阅读,更多相关《统计学第一章统计学的基础理论幻灯片.ppt(37页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学第一章统计学的基础理论第1页,共37页,编辑于2022年,星期二2023/4/142第2页,共37页,编辑于2022年,星期二l统计统计学,学,贾贾俊平等,中国人民大学出版社,俊平等,中国人民大学出版社,2009年年 11月第月第4版版l统计统计学,学,贾贾俊平等,中国人民大学出版社,俊平等,中国人民大学出版社,2008年年 11月第月第3版版l统计统计学学从数据到从数据到结论结论,吴喜之著,中国,吴喜之著,中国统计统计出版社,出版社,2006年年l例解商例解商务统计务统计学,学,Terry F.Triola著,著,陈鹤陈鹤琴等琴等译译,清清华华大学出版社,大学出版社,2001年年202
2、3/4/143第3页,共37页,编辑于2022年,星期二2023/4/1442023/4/144第4页,共37页,编辑于2022年,星期二2023/4/145第5页,共37页,编辑于2022年,星期二2023/4/1462023/4/146统计学是一门关于搜集、处理、分析、解释数据并从数据中得出结论的科学。第6页,共37页,编辑于2022年,星期二2023/4/147第7页,共37页,编辑于2022年,星期二l研究如何取得反映客观现象的数据,并通过图研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得
3、出反映客观现象进而通过综合、概括与分析得出反映客观现象的规律性数量特征。的规律性数量特征。l主要内容主要内容:l统计数据的搜集方法;统计数据的搜集方法;l数据的加工处理方法;数据的加工处理方法;l数据的显示方法;数据的显示方法;l数据分布特征的概括与分析方法等数据分布特征的概括与分析方法等。2023/4/148第8页,共37页,编辑于2022年,星期二l是研究如何根据样本数据去推断总体数量特征的方法,是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。未知数量特征作出以
4、概率形式表述的推断。l主要内容主要内容:l参数估计:利用样本信息推断总体特征参数估计:利用样本信息推断总体特征l假设检验:利用样本信息检验对总体的某个假假设检验:利用样本信息检验对总体的某个假 设是否成立设是否成立2023/4/149第9页,共37页,编辑于2022年,星期二l是指统计学的数学原理,它主要研究统计学是指统计学的数学原理,它主要研究统计学 的一般理论和统计方法的数学理论。的一般理论和统计方法的数学理论。l从事统计理论和方法研究的人员需要有坚实从事统计理论和方法研究的人员需要有坚实 的数学基础。的数学基础。l由于概率论是统计推断的数学和理论基础,由于概率论是统计推断的数学和理论基础
5、,因而广义地讲统计学也应该包括概率论在内。因而广义地讲统计学也应该包括概率论在内。2023/4/1410第10页,共37页,编辑于2022年,星期二l是研究如何应用统计方法去解决实际问题。是研究如何应用统计方法去解决实际问题。l由于在自然科学及社会科学研究领域中,都需要由于在自然科学及社会科学研究领域中,都需要 通过数据分析来解决实际问题,因而,统计方法通过数据分析来解决实际问题,因而,统计方法 的应用几乎扩展到了所有的科学研究领域。的应用几乎扩展到了所有的科学研究领域。l应用统计学的不同分支所应用的基本统计方法都应用统计学的不同分支所应用的基本统计方法都 是一样的,即都是描述统计和推断统计的
6、主要方是一样的,即都是描述统计和推断统计的主要方 法。但由于各应用领域都有其特殊性,统计方法法。但由于各应用领域都有其特殊性,统计方法 在应用中又形成了一些不同的特点。在应用中又形成了一些不同的特点。2023/4/1411第11页,共37页,编辑于2022年,星期二l说出哪些领域运用统计,哪些领域不运用统计,都很困难说出哪些领域运用统计,哪些领域不运用统计,都很困难l几乎找不到一个不用统计的领域几乎找不到一个不用统计的领域l统计是适用于所有科学领域的通用数据分析方法统计是适用于所有科学领域的通用数据分析方法l只要有数据的地方,都会用到统计只要有数据的地方,都会用到统计2023/4/1412统计
7、的统计的应用应用一切社会科学领域一切人类生活领域一切自然科学领域一切生产活动领域第12页,共37页,编辑于2022年,星期二2023/4/1413第13页,共37页,编辑于2022年,星期二2023/4/1414 根据调查对象的性质进行分类,各类之间是并 列关系。定类尺度定类尺度 与等距量表是一个等级,但该尺度存在绝对 “0”点,“0”在此处表示不存在,故可计算比率。测度多类别之间不同程度的顺序关系,存在类 别差和顺序差。测度顺序和各顺序位置之间的距离。这种尺度不存 存在绝对“0”点,“0”在此处是有意义的数字。定序尺度定序尺度定距尺度定距尺度定比尺度定比尺度 第14页,共37页,编辑于202
8、2年,星期二2023/4/1415第15页,共37页,编辑于2022年,星期二l分类数据分类数据 是只能归于某一类别的非数字型数据。如,人口的性别:男和女;产品类别:食是只能归于某一类别的非数字型数据。如,人口的性别:男和女;产品类别:食品、衣着、家电等;品、衣着、家电等;l顺序数据顺序数据 是只能归于某一顺序类别的非数字型数据。如产品的质量等级:一等品、二是只能归于某一顺序类别的非数字型数据。如产品的质量等级:一等品、二等品等;等品等;l数值型数据数值型数据 是按数量尺度测量的数据。一般可直接进行加减乘除运算,且使用自然、是按数量尺度测量的数据。一般可直接进行加减乘除运算,且使用自然、物理、
9、货币等单位计量。物理、货币等单位计量。l分类数据和顺序数据说明是事物的品质特征分类数据和顺序数据说明是事物的品质特征-品质数据或定性数品质数据或定性数 据;据;数值型数据是说明事物的数量特征数值型数据是说明事物的数量特征-定量数据定量数据2023/4/1416第16页,共37页,编辑于2022年,星期二l观测数据:观测数据:通过调查或观察而搜集到的统计数据。如有关社会经济数据均通过调查或观察而搜集到的统计数据。如有关社会经济数据均 为观测数据。为观测数据。l试验数据:试验数据:在试验中,利用监控手段,通过控制试验对象而搜集到的统计在试验中,利用监控手段,通过控制试验对象而搜集到的统计 数据。如
10、对医药疗效试验数据;生物成长的试验数据等。数据。如对医药疗效试验数据;生物成长的试验数据等。l观测数据一般不能再生,只能通过观察得到;大多数试验数据来观测数据一般不能再生,只能通过观察得到;大多数试验数据来源于科学实验,一般可以重复取得。源于科学实验,一般可以重复取得。2023/4/1417第17页,共37页,编辑于2022年,星期二l截面数据截面数据 在相同或近似相同的时间点上搜集的数据;描述多个现象在在相同或近似相同的时间点上搜集的数据;描述多个现象在 某一时刻的变化情况;比如,某一时刻的变化情况;比如,20102010年我国各地区的国内生产年我国各地区的国内生产 总值数据。总值数据。l时
11、序数据时序数据 在不同时间上搜集到的数据;描述一个现象随时间变化的情在不同时间上搜集到的数据;描述一个现象随时间变化的情 况;比如,况;比如,19901990年至年至20102010年国内生产总值数据。年国内生产总值数据。l混合数据混合数据 在数据集中含有时间序列和截面数据成分的数据;描述多个在数据集中含有时间序列和截面数据成分的数据;描述多个 现象随时间变化的情况;比如,现象随时间变化的情况;比如,19901990年到年到20102010年我国各地区年我国各地区 的国内生产总值数据的国内生产总值数据。2023/4/1418第18页,共37页,编辑于2022年,星期二2023/4/1419第1
12、9页,共37页,编辑于2022年,星期二2023/4/1420第20页,共37页,编辑于2022年,星期二2023/4/1421第21页,共37页,编辑于2022年,星期二2023/4/1422第22页,共37页,编辑于2022年,星期二2023/4/1423第23页,共37页,编辑于2022年,星期二l总体总体l就是根据一定目的确定的所要研究事物的全体。它是由客观存在就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。的、具有某种共同性质的许多个别事物构成的整体,简称为总体。l构成统计总体的个别事物则称为总体单位。构成统计总体的个
13、别事物则称为总体单位。l样本样本l从总体中抽取出来,作为代表这一总体的部分单位组成从总体中抽取出来,作为代表这一总体的部分单位组成的集合体称为样本。的集合体称为样本。2023/4/1424第24页,共37页,编辑于2022年,星期二l参数l用来描述总体特征的概括性数字度量用来描述总体特征的概括性数字度量l参数一般是未知常数参数一般是未知常数l统计量l用来描述样本特征的概括性数字度量用来描述样本特征的概括性数字度量l统计量是随机变量统计量是随机变量l可以由样本数据计算出来可以由样本数据计算出来2023/4/1425第25页,共37页,编辑于2022年,星期二l说明现象某种特质的概念l变量的取值称
14、为变量值l变量按取值特征不同,可分为离散变量与连续变量l变量按计量尺度不同,可分为分类变量、顺序变量、数值型变量2023/4/1426第26页,共37页,编辑于2022年,星期二l概率分布的理论十分丰富概率分布的理论十分丰富l按涉及的对象不同,可分为总体分布、样本分布、抽样分按涉及的对象不同,可分为总体分布、样本分布、抽样分布布l概率分布按精确程度不同,可分为精确分布与渐进分布概率分布按精确程度不同,可分为精确分布与渐进分布l按属性不同,可分为理论分布与经验分布按属性不同,可分为理论分布与经验分布l按涉及的随机变量的性质不同,可分为离散变量的概率按涉及的随机变量的性质不同,可分为离散变量的概率
15、分布与连续变量的概率分布分布与连续变量的概率分布2023/4/1427第27页,共37页,编辑于2022年,星期二l l总体分布总体分布总体分布总体分布p总体中各元素的观察值所形成的相对频数总体中各元素的观察值所形成的相对频数(频率)分布。(频率)分布。分布通常是未分布通常是未知的知的(因为几乎得不到总体所有观察值因为几乎得不到总体所有观察值),可以(根据理论分析)假定它服,可以(根据理论分析)假定它服从某种分布从某种分布 l l样本分布样本分布样本分布样本分布p一个样本中各观察值形成的相对频数(频率)分布,一个样本中各观察值形成的相对频数(频率)分布,也称经验分布也称经验分布。当样本。当样本
16、容量容量n逐渐增大时,样本分布逐渐接近总体的分布逐渐增大时,样本分布逐渐接近总体的分布 l l抽样分布抽样分布抽样分布抽样分布p样本统计量的概率分布,是一种理论分布在重复选取容量为样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本的样本时,由该统计量的所有可能取值形成的相对频数分布时,由该统计量的所有可能取值形成的相对频数分布 2023/4/1428第28页,共37页,编辑于2022年,星期二l l理论分布理论分布理论分布理论分布l根据数学原理,所推导出来的随机变量的分布模型。对于离散随根据数学原理,所推导出来的随机变量的分布模型。对于离散随机变量,常用的理论分布模型有机变量,常用的
17、理论分布模型有 两点分布、二项分布、泊松分布、两点分布、二项分布、泊松分布、超几何分布;对于连续随机变量,常用的理论分布模型有正态分超几何分布;对于连续随机变量,常用的理论分布模型有正态分布、指数分布、均匀分布,以及由正态分布导出的布、指数分布、均匀分布,以及由正态分布导出的 分布、分布、分布、分布、分布(分布(统计三大分布统计三大分布)。)。l l经验分布经验分布经验分布经验分布l一个样本中各观察值形成的相对频数(频率)分布。这种分布是可知一个样本中各观察值形成的相对频数(频率)分布。这种分布是可知的,是一种实际发生的分布。的,是一种实际发生的分布。2023/4/1429第29页,共37页,
18、编辑于2022年,星期二l l精确分布精确分布精确分布精确分布l在总体在总体X的分布的分布类类型已知型已知时时,若,若对对任意自然数任意自然数 ,都能,都能导导出出统计统计量量 的分布的数学表达式,的分布的数学表达式,这这种分布称种分布称为为精确的抽精确的抽样样分布。它分布。它对样对样本量本量较较小的小的统计统计推断非常有用。精确分布大多数是在正推断非常有用。精确分布大多数是在正态态分布情况下得到的。分布情况下得到的。l l渐进渐进渐进渐进分布分布分布分布l在统计学的抽样分布理论中,至今已求出的精确分布并不多。在统计学的抽样分布理论中,至今已求出的精确分布并不多。抽样分布很难求,即便求出来精确
19、的抽样分布,也因为过于复抽样分布很难求,即便求出来精确的抽样分布,也因为过于复杂而难于应用。因此,人们往往寻求在样本量无限增大时统计杂而难于应用。因此,人们往往寻求在样本量无限增大时统计量的极限分布,这种极限分布常称为渐进分布。量的极限分布,这种极限分布常称为渐进分布。2023/4/1430第30页,共37页,编辑于2022年,星期二正态分布正态分布 分布分布 分布分布 分布分布2023/4/1431第31页,共37页,编辑于2022年,星期二l如果连续随机变量如果连续随机变量X的密度函数的密度函数为为:则则随机随机变变量服从均量服从均值为值为 ,方差,方差为为 的正的正态态分布,分布,记为记
20、为l标标准正准正态态分布:分布:l 准准则则2023/4/1432第32页,共37页,编辑于2022年,星期二l设随机变量设随机变量 相互独立,且相互独立,且 服从标准正态分布服从标准正态分布 ,则它们的平方和,则它们的平方和 服从自服从自由度为由度为 的的 分布。分布。记为记为l 分布的期望与方差分别为:分布的期望与方差分别为:l 分布的上侧分位值定义为:分布的上侧分位值定义为:2023/4/1433第33页,共37页,编辑于2022年,星期二l设随机变量设随机变量 ,且,且X与与Y独立,独立,则则随机随机变变量:量:服从自由度服从自由度为为 的的 分布,分布,记为记为l随着自由度随着自由度
21、 的增加,的增加,分布分布 的密度函数越来越接近的密度函数越来越接近标标准正准正态态分布的密度函数。分布的密度函数。实际应实际应用中,一般当用中,一般当n 30时时,分布与分布与标标准正准正态态分布就非常接近。分布就非常接近。l 分布的数学期望与方差分分布的数学期望与方差分别为别为2023/4/1434第34页,共37页,编辑于2022年,星期二l设设随机随机变变量量Y与与Z相互独立,且相互独立,且Y和和Z分分别别服从自由度服从自由度为为m和和n的的 分布,分布,则则随机随机变变量量X:l服从第一自由度为服从第一自由度为m,第二自由度为,第二自由度为n的的 分布分布l 分布与分布与 分布存在如下关系:如果随机变量分布存在如下关系:如果随机变量 X服从服从 分布,则分布,则X2服从服从 的的 分布。分布。l分布的期望与方差分分布的期望与方差分别为别为:2023/4/1435第35页,共37页,编辑于2022年,星期二2023/4/1436第36页,共37页,编辑于2022年,星期二2023/4/1437第37页,共37页,编辑于2022年,星期二
限制150内